4月24日,DeepSeek-V4模型正式發(fā)布并開源,華為云首發(fā)適配。DeepSeek-V4擁有百萬Token超長上下文,在Agent能力、世界知識和推理性能上均實現(xiàn)國內(nèi)與開源領(lǐng)域的領(lǐng)先。其中,DeepSeek-V4-Flash模型參數(shù)下降至284B,推理成本進(jìn)一步降低,模型參數(shù)和激活更小,V4-Flash能夠提供更加快捷、經(jīng)濟(jì)的API服務(wù),實現(xiàn)百萬上下文普惠。當(dāng)前,華為云MaaS模型即服務(wù)平臺已為開發(fā)者提供免部署、一鍵調(diào)用DeepSeek-V4-Flash API的Tokens服務(wù)。
在此次新模型適配過程中,華為云在系統(tǒng)層、算子層和集群層的關(guān)鍵能力上協(xié)同,分別從調(diào)度效率、計算效率和數(shù)據(jù)流轉(zhuǎn)效率三個維度保障新模型快速適配與高性能落地。
針對DeepSeek-V4,華為云首發(fā)適配模型分層注意力壓縮機(jī)制,實現(xiàn)V4注意力機(jī)制下 KVCache的高效分配管理,提供TopK、SWA、CFA等10+昇騰高性能融合算子,搭配框架異步調(diào)度、MTP多步投機(jī)等框架優(yōu)化,支持原生1M長上下文的高性能推理。
華為云以高效的AI基礎(chǔ)設(shè)施為核心打造“硅基黑土地”,開放接納自研和第三方主流大模型和眾多智能體,為企業(yè)解難題,提升生產(chǎn)效率!
-
模型
+關(guān)注
關(guān)注
1文章
3831瀏覽量
52285 -
華為云
+關(guān)注
關(guān)注
3文章
2837瀏覽量
19378 -
DeepSeek
+關(guān)注
關(guān)注
2文章
855瀏覽量
3413
原文標(biāo)題:DeepSeek-V4發(fā)布,華為云首發(fā)適配
文章出處:【微信號:huaweicorp,微信公眾號:華為】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
摩爾線程完成DeepSeek-V4全鏈路工程化適配:S5000基于MUSA+SGLang實現(xiàn)復(fù)雜MoE模型快速落地
云天勵飛完成DeepSeek-V4系列模型關(guān)鍵機(jī)制適配驗證
摩爾線程攜手智源人工智能研究院Day-0適配DeepSeek-V4 Pro和Flash雙模型
摩爾線程攜手上海AI實驗室Day-0適配DeepSeek-V4核心算子
摩爾線程TileLang-MUSA率先支持DeepSeek-V4全新TileKernels
開放原子AtomGit平臺首發(fā)適配DeepSeek-V4系列模型
登臨科技GPU+架構(gòu)深度適配DeepSeek-V4大模型
寒武紀(jì)Day 0適配DeepSeek-V4模型
沐曦股份Day 0適配DeepSeek-V4-Flash模型
燧原科技L600 FP8原生適配DeepSeek-V4-Pro/Flash模型
壁仞科技壁礪166系列GPU產(chǎn)品率先支持DeepSeek-V4模型
華為云首發(fā)適配DeepSeek-V4模型
評論