華為云首發(fā)適配DeepSeek-V4模型

4月24日，DeepSeek-V4模型正式發(fā)布并開源，華為云首發(fā)適配。DeepSeek-V4擁有百萬Token超長上下文，在Agent能力、世界知識和推理性能上均實現(xiàn)國內(nèi)與開源領(lǐng)域的領(lǐng)先。其中，DeepSeek-V4-Flash模型參數(shù)下降至284B，推理成本進(jìn)一步降低，模型參數(shù)和激活更小，V4-Flash能夠提供更加快捷、經(jīng)濟(jì)的API服務(wù)，實現(xiàn)百萬上下文普惠。當(dāng)前，華為云MaaS模型即服務(wù)平臺已為開發(fā)者提供免部署、一鍵調(diào)用DeepSeek-V4-Flash API的Tokens服務(wù)。

在此次新模型適配過程中，華為云在系統(tǒng)層、算子層和集群層的關(guān)鍵能力上協(xié)同，分別從調(diào)度效率、計算效率和數(shù)據(jù)流轉(zhuǎn)效率三個維度保障新模型快速適配與高性能落地。

針對DeepSeek-V4，華為云首發(fā)適配模型分層注意力壓縮機(jī)制，實現(xiàn)V4注意力機(jī)制下 KVCache的高效分配管理，提供TopK、SWA、CFA等10+昇騰高性能融合算子，搭配框架異步調(diào)度、MTP多步投機(jī)等框架優(yōu)化，支持原生1M長上下文的高性能推理。

華為云以高效的AI基礎(chǔ)設(shè)施為核心打造“硅基黑土地”，開放接納自研和第三方主流大模型和眾多智能體，為企業(yè)解難題，提升生產(chǎn)效率！

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

模型

模型

+關(guān)注

關(guān)注
1

文章
3831

瀏覽量
52285
華為云

華為云

+關(guān)注

關(guān)注
3

文章
2837

瀏覽量
19378
DeepSeek

DeepSeek

+關(guān)注

關(guān)注
2

文章
855

瀏覽量
3413

原文標(biāo)題：DeepSeek-V4發(fā)布，華為云首發(fā)適配

文章出處：【微信號：huaweicorp，微信公眾號：華為】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

日B视频亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

搜索歷史

華為云首發(fā)適配DeepSeek-V4模型

評論