日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國產(chǎn)AI算力:從DeepSeek V4與華為昇騰協(xié)同看全棧自主之路

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2026-04-25 07:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)2026年4月24日,DeepSeek V4 - Pro和DeepSeek V4 - Flash正式發(fā)布并開源。模型上下文處理長(zhǎng)度從128K大幅提升至1M,新增KV Cache滑窗和壓縮算法,顯著降低計(jì)算與訪存開銷,在Agent能力、世界知識(shí)和推理性能上處于國內(nèi)及開源領(lǐng)域領(lǐng)先地位。

與此同時(shí),華為宣布昇騰超節(jié)點(diǎn)全系列產(chǎn)品全面支持DeepSeek V4系列,這場(chǎng)芯模協(xié)同不僅彰顯技術(shù)實(shí)力,更標(biāo)志著國產(chǎn)AI算力在擺脫海外依賴、構(gòu)建全棧自主生態(tài)上邁出關(guān)鍵一步。

生態(tài)遷移:從CUDA到CANN的跨越

DeepSeek V4與華為昇騰的合作,核心在于從英偉達(dá)CUDA生態(tài)向華為自研的CANN異構(gòu)計(jì)算架構(gòu)遷移,這一過程遠(yuǎn)非簡(jiǎn)單的代碼移植。

過去,中國大模型開發(fā)高度依賴英偉達(dá)GPU和CUDA生態(tài),從訓(xùn)練到推理都面臨卡脖子風(fēng)險(xiǎn)。此次遷移需重寫數(shù)十萬行底層代碼,重構(gòu)通信協(xié)議、顯存管理等核心模塊,攻克算子對(duì)齊、通信優(yōu)化、內(nèi)存管理三大技術(shù)壁壘。

據(jù)傳,DeepSeek團(tuán)隊(duì)耗時(shí)14個(gè)月攻堅(jiān),華為工程師駐場(chǎng)支持,反復(fù)調(diào)試精度、優(yōu)化算子。最終,經(jīng)深度優(yōu)化,DeepSeek V4在昇騰950PR上的推理速度較初期版本提升35倍,能耗降低40%。第三方評(píng)測(cè)顯示,昇騰950PR單卡推理性能達(dá)到英偉達(dá)特供版H20芯片的2.87倍。這一成果表明國產(chǎn)AI芯片正加速從“可用”邁向“好用”,在特定場(chǎng)景下已具備超越國際主流產(chǎn)品的競(jìng)爭(zhēng)力。

華為計(jì)算官微顯示,華為昇騰950超節(jié)點(diǎn)通過融合kernel和多流并行技術(shù),結(jié)合多種量化算法,實(shí)現(xiàn)了DeepSeek V4模型的高吞吐、低時(shí)延推理部署。具體而言,昇騰950超節(jié)點(diǎn)實(shí)現(xiàn)了DeepSeek V4 - Pro 20ms和DeepSeek V4 - Flash 10ms的極低時(shí)延推理。在8K輸入場(chǎng)景下,單卡Decode吞吐分別可達(dá)4700TPS(V4 - Pro)和1600TPS(V4 - Flash)。這一成就得益于昇騰950底層架構(gòu)的三大升級(jí):原生精度加速支持FP8、MXFP8等數(shù)據(jù)格式,內(nèi)存占用降低50%以上;稀疏訪存優(yōu)化解決MoE模型帶寬瓶頸;Vector與Cube共享Memory設(shè)計(jì)消除數(shù)據(jù)搬運(yùn)開銷。

此外,Atlas 900 A3 SuperPoD液冷超節(jié)點(diǎn)及Atlas 800 A3風(fēng)冷超節(jié)點(diǎn)采用平等架構(gòu)、全局內(nèi)存統(tǒng)一編址、點(diǎn)對(duì)點(diǎn)互聯(lián)帶寬達(dá)784GB/s。提供32到384多種規(guī)格滿足不同業(yè)務(wù)需求,昇騰超節(jié)點(diǎn)是國內(nèi)唯一成熟規(guī)模商用的超節(jié)點(diǎn)產(chǎn)品,滿足互聯(lián)網(wǎng)、運(yùn)營商、金融等行業(yè)對(duì)大模型推理超高吞吐、超大并發(fā)的極致性能需求。

基于昇騰A3 64卡超節(jié)點(diǎn)結(jié)合大EP模式部署,DeepSeek V4-Flash模型,8K/1K輸入輸出場(chǎng)景,基于vLLM推理引擎可實(shí)現(xiàn)2000+TPS的單卡Decode吞吐,單卡吞吐持續(xù)提升。針對(duì)DeepSeek V4-Pro模型,昇騰A3同步支持推理部署,性能持續(xù)優(yōu)化中。

此次合作意義重大,徹底打破了國產(chǎn)AI對(duì)海外技術(shù)的依賴。DeepSeek V4成為首個(gè)在華為昇騰平臺(tái)上完成從訓(xùn)練到推理完整閉環(huán)的萬億級(jí)模型,中國首次擁有了從頂級(jí)大模型到自主算力基礎(chǔ)設(shè)施的完整、可控的AI技術(shù)棧。這不僅是技術(shù)上的勝利,更是產(chǎn)業(yè)生態(tài)的轉(zhuǎn)折點(diǎn),向市場(chǎng)證明國產(chǎn)算力有能力承載全球頂尖AI模型,且能實(shí)現(xiàn)性能與成本的雙重優(yōu)勢(shì)。

國產(chǎn)大模型與算力的協(xié)同共進(jìn)

在DeepSeek V4發(fā)布當(dāng)天,寒武紀(jì)宣布基于自研NeuWare軟件生態(tài)與vLLM框架,完成對(duì)DeepSeek V4的“Day 0”適配,并將適配代碼開源至GitHub社區(qū)。這是寒武紀(jì)連續(xù)第二次在DeepSeek新模型發(fā)布首日推出國產(chǎn)芯片適配方案,通過自研高性能融合算子庫Torch - MLU - Ops和BangC編程語言,充分釋放硬件底層潛力。

天數(shù)智芯也完成了與DeepSeek - V4的Day 0級(jí)適配,以天垓系列訓(xùn)練芯片與智鎧系列推理芯片為核心,承接DeepSeek - V4的全場(chǎng)景應(yīng)用。此外,DeepSeek V4 - Flash還已經(jīng)在海光信息、沐曦、摩爾線程(FP8)、昆侖芯、平頭哥真武等國產(chǎn)AI芯片平臺(tái)上實(shí)現(xiàn)適配。

近年來,隨著先進(jìn)大模型的發(fā)布和開源,國產(chǎn)AI芯片廠商紛紛發(fā)布Day 0適配消息。如MiniMax M2.7全球開源時(shí),華為昇騰、摩爾線程、沐曦股份、昆侖芯等廠商就宣布推理平臺(tái)已完成Day0適配,即在開源首日完成模型接入與推理適配工作。

MiniMax M2.7開源當(dāng)日,華為昇騰AI基礎(chǔ)軟硬件實(shí)現(xiàn)首日適配,基于vllm - Ascend推理引擎在Atlas800A3、Atlas800IA2系列產(chǎn)品上為模型推理部署提供全流程支持;摩爾線程技術(shù)團(tuán)隊(duì)基于MUSA架構(gòu),針對(duì)M2.7的模型特點(diǎn)完成深度調(diào)優(yōu),成功在MTTS5000上實(shí)現(xiàn)模型高性能推理;沐曦曦云C系列GPU憑借全棧自研的MXMACA軟件棧,首日完成深度適配,實(shí)現(xiàn)“模型發(fā)布即算力就緒”的Day0體驗(yàn);昆侖芯依托自研架構(gòu),通過底層算子優(yōu)化與軟硬件協(xié)同加速,保障M2.7在平臺(tái)上的穩(wěn)定、高效運(yùn)行。

此外,近日騰訊混元Hy3preview語言模型發(fā)布并開源,依托全棧自研技術(shù)優(yōu)勢(shì),壁仞科技基于vLLM主流開源框架實(shí)現(xiàn)Hy3preview模型的Day0適配及推理驗(yàn)證。月內(nèi)該公司旗艦GPU產(chǎn)品適配國內(nèi)多家大模型,包括月之暗面Kimi K2.6模型、阿里(BABA)Qwen3.6-35B-A3B大模型等。

在AI大模型和芯片領(lǐng)域,適配是關(guān)鍵技術(shù)術(shù)語,指讓軟件在特定硬件或軟件平臺(tái)上順利、高效運(yùn)行的一整套技術(shù)工作。國產(chǎn)AI芯片在支持大模型推理上已呈現(xiàn)全面發(fā)展態(tài)勢(shì),此次華為昇騰對(duì)DeepSeek V4的全面支持,讓DeepSeek V4擺脫CUDA生態(tài)依賴,使用CANN,國產(chǎn)AI算力實(shí)力更上一層樓。

國產(chǎn)AI算力的未來展望

DeepSeek V4與華為昇騰的深度融合,不僅是技術(shù)上的成功適配,更是深刻的戰(zhàn)略轉(zhuǎn)型,標(biāo)志著中國AI產(chǎn)業(yè)從依賴海外技術(shù)邁向全鏈路自主可控。

性能上的反超和成本上的巨大優(yōu)勢(shì),為國產(chǎn)AI的商業(yè)化落地鋪平道路。隨著下半年昇騰950超節(jié)點(diǎn)的批量上市,DeepSeek V4 - Pro的服務(wù)價(jià)格有望大幅下調(diào),這將加速AI技術(shù)在金融、政務(wù)、法律等關(guān)鍵領(lǐng)域的普及應(yīng)用。

從數(shù)據(jù)上來看,全球智能計(jì)算芯片市場(chǎng)預(yù)計(jì)2029年達(dá)到5857億美元,2024-2029年年符合增長(zhǎng)率37.5%;中國市場(chǎng)增長(zhǎng)更快,復(fù)合增長(zhǎng)率達(dá)46.3%,國產(chǎn)AI芯片廠商市場(chǎng)份額有望持續(xù)提升。

展望未來,一個(gè)由國產(chǎn)芯片、國產(chǎn)框架、國產(chǎn)大模型構(gòu)成的完整AI生態(tài)閉環(huán)正在加速形成。這不僅體現(xiàn)了國家科技自立自強(qiáng)的戰(zhàn)略要求,也為全球AI產(chǎn)業(yè)發(fā)展提供了新的思路和模式。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI算力
    +關(guān)注

    關(guān)注

    1

    文章

    174

    瀏覽量

    10042
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    開放原子AtomGit平臺(tái)首發(fā)適配DeepSeek-V4系列模型

    2026年4月24日,DeepSeek-V4系列模型正式發(fā)布并同步開源。AtomGit平臺(tái)為DeepSeek-V4適配版本首發(fā)平臺(tái),為開
    的頭像 發(fā)表于 04-29 16:12 ?673次閱讀

    華為超節(jié)點(diǎn)系列產(chǎn)品全面支持DeepSeek V4模型

    2026年4月24日,DeepSeek V4-Pro和DeepSeek V4-Flash正式發(fā)布并開源,模型上下文處理長(zhǎng)度由原有的128K顯
    的頭像 發(fā)表于 04-28 17:00 ?431次閱讀

    軟通華方超節(jié)點(diǎn)服務(wù)器產(chǎn)品全面適配DeepSeek V4模型

    4月24日,隨著DeepSeek V4大模型的正式開源與發(fā)布,國產(chǎn)生態(tài)迎來關(guān)鍵拼圖。軟通動(dòng)力
    的頭像 發(fā)表于 04-28 16:34 ?261次閱讀

    長(zhǎng)江計(jì)算G940K V2超節(jié)點(diǎn)服務(wù)器完成對(duì)DeepSeek V4模型極速適配

      4月24日,備受行業(yè)關(guān)注的大模型產(chǎn)品DeepSeek V4正式發(fā)布。烽火通信旗下長(zhǎng)江計(jì)算憑借深厚的技術(shù)積累與前瞻布局,以G940K V2超節(jié)點(diǎn)服務(wù)器為核心載體,同步完成對(duì)
    的頭像 發(fā)表于 04-24 17:40 ?1821次閱讀

    端側(cè)AI爆發(fā)!斯貝達(dá)自研技術(shù),助力國產(chǎn)AI崛起

    江接受采訪,分享了國產(chǎn)AI布局和產(chǎn)品市場(chǎng)拓展等話題。 ?
    的頭像 發(fā)表于 04-14 16:51 ?5250次閱讀

    【硬核發(fā)布】310B盒上新賦能2026集創(chuàng)賽華強(qiáng)x賽道玩轉(zhuǎn)新創(chuàng)意!

    -TECHNOLOGICALPROGRESS-310BAIBOX上新全場(chǎng)景AI高能效
    的頭像 發(fā)表于 03-27 17:12 ?1262次閱讀
    【硬核發(fā)布】<b class='flag-5'>昇</b><b class='flag-5'>騰</b>310B<b class='flag-5'>算</b><b class='flag-5'>力</b>盒上新賦能2026集創(chuàng)賽華強(qiáng)x<b class='flag-5'>昇</b><b class='flag-5'>騰</b>賽道玩轉(zhuǎn)新創(chuàng)意!

    國產(chǎn)出海元年開啟

    ? 國產(chǎn)開啟“大航海”時(shí)代。 黃仁勛前段時(shí)間訪華時(shí)曾表示:“華為AI芯片取代英偉達(dá)只是時(shí)間問題?!北藭r(shí),這話多被解讀為對(duì)老對(duì)手的客套。但
    的頭像 發(fā)表于 03-24 15:15 ?586次閱讀
    <b class='flag-5'>國產(chǎn)</b><b class='flag-5'>算</b><b class='flag-5'>力</b>出海元年開啟

    華為發(fā)布全新950PR,Atlas 350單卡接近3倍于H20

    950PR在低精度數(shù)據(jù)格式、向量、互聯(lián)帶寬及自研HBM等方面實(shí)現(xiàn)大幅提升。 ? 芯片是華為AI
    的頭像 發(fā)表于 03-24 09:08 ?6109次閱讀

    【賽題解析】2026集創(chuàng)賽華強(qiáng)x企業(yè)命題!用國產(chǎn)AI重塑未來數(shù)字幻境!

    國產(chǎn)AI打造下一代沉浸式體驗(yàn)!2026集創(chuàng)賽“華強(qiáng)x”企業(yè)命題火熱報(bào)名中!本賽題由華強(qiáng)
    的頭像 發(fā)表于 03-11 08:04 ?824次閱讀
    【賽題解析】2026集創(chuàng)賽華強(qiáng)x<b class='flag-5'>昇</b><b class='flag-5'>騰</b>企業(yè)命題!用<b class='flag-5'>國產(chǎn)</b><b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>重塑未來數(shù)字幻境!

    邊緣AI臨界點(diǎn):深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價(jià)值

    、內(nèi)存革命:48GB/96GB LPDDR4X 背后的帶寬博弈 很多開發(fā)者容易陷入唯論的誤區(qū),但在實(shí)際部署大模型時(shí),內(nèi)存容量和帶寬往往是真正的性能瓶頸。OrangePi AI St
    發(fā)表于 03-10 14:19

    香橙派系列開發(fā)板如何部署OpenClaw

    OrangePi AIPro8T/20T、AI Station、AI Studio Pro、AI Studio都可以按同樣的步驟操作。 隨著香橙派
    發(fā)表于 02-25 10:13

    國產(chǎn)AI芯片真能扛住“內(nèi)卷”?海思的這波操作藏了多少細(xì)節(jié)?

    最近行業(yè)都在說“AI的命門”,但國產(chǎn)芯片真的能接住這波需求嗎? 前陣子接觸到海思910
    發(fā)表于 10-27 13:12

    高達(dá)2070TFLOPS視科技基于NVIDIA Jetson Thor系列模組,重磅推出AI邊緣智大腦解決方案

    視科技基于NVIDIA Jetson Thor系列模組推出的AI邊緣智大腦解決方案,以其卓越的性能和廣泛的適用性,為物理
    的頭像 發(fā)表于 07-28 18:09 ?1441次閱讀
    高達(dá)2070TFLOPS<b class='flag-5'>算</b><b class='flag-5'>力</b>|<b class='flag-5'>騰</b>視科技基于NVIDIA Jetson Thor系列模組,重磅推出<b class='flag-5'>全</b><b class='flag-5'>棧</b><b class='flag-5'>AI</b>邊緣智<b class='flag-5'>算</b>大腦解決方案

    高達(dá)2070TFLOPS視科技基于NVIDIA Jetson Thor系列模組,重磅推出AI邊緣智大腦解決方案

    視科技基于NVIDIA Jetson Thor系列模組推出的AI邊緣智大腦解決方案,以其卓越的性能和廣泛的適用性,為物理
    的頭像 發(fā)表于 07-28 16:48 ?1785次閱讀
    高達(dá)2070TFLOPS<b class='flag-5'>算</b><b class='flag-5'>力</b>|<b class='flag-5'>騰</b>視科技基于NVIDIA Jetson Thor系列模組,重磅推出<b class='flag-5'>全</b><b class='flag-5'>棧</b><b class='flag-5'>AI</b>邊緣智<b class='flag-5'>算</b>大腦解決方案

    高達(dá)2070TFLOPS視科技基于NVIDIA Jetson Thor系列模組,重磅推出AI邊緣智大腦解決方案

    視科技基于NVIDIA Jetson Thor系列模組推出的AI邊緣智大腦解決方案,以其卓越的性能和廣泛的適用性,為物理
    的頭像 發(fā)表于 07-28 16:45 ?1061次閱讀
    高達(dá)2070TFLOPS<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>騰</b>視科技基于NVIDIA Jetson Thor系列模組,重磅推出<b class='flag-5'>全</b><b class='flag-5'>棧</b><b class='flag-5'>AI</b>邊緣智<b class='flag-5'>算</b>大腦解決方案
    名山县| 德钦县| 来宾市| 石景山区| 黑山县| 蕲春县| 酒泉市| 扶沟县| 太保市| 玉龙| 怀集县| 石嘴山市| 忻城县| 星座| 巴东县| 宁明县| 灵寿县| 肇州县| 南阳市| 扎囊县| 百色市| 漳平市| 富宁县| 河津市| 青浦区| 垦利县| 苍溪县| 池州市| 漯河市| 绥江县| 龙里县| 琼中| 漯河市| 五原县| 渑池县| 中卫市| 双桥区| 郁南县| 额尔古纳市| 武定县| 安达市|