日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智源FlagOS攜手海光信息完成DeepSeek V4 Flash全量適配

CHANBAEK ? 來源:海光信息 ? 2026-05-14 17:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,北京智源研究院眾智FlagOS社區(qū)宣布,已完成DeepSeekV4Flash 284B大模型在海光等多款AI芯片上的Day0全量適配與推理部署,同步實(shí)現(xiàn)三大關(guān)鍵技術(shù)突破,讓國產(chǎn)主流算力平臺(tái)可高效運(yùn)行新一代千億級(jí)MoE大模型。

DeepSeek當(dāng)日發(fā)布V4系列兩大模型,其中DeepSeekV4Flash采用MoE架構(gòu),總參數(shù)284B,激活參數(shù)13B,支持100萬token上下文長度,在長文本、復(fù)雜推理、代碼與數(shù)學(xué)任務(wù)上表現(xiàn)突出。

海光平臺(tái)核心適配成果

依托FlagOS三大技術(shù)突破,海光芯片實(shí)現(xiàn)對(duì)DeepSeekV4Flash的穩(wěn)定高效運(yùn)行:

全算子覆蓋,無CUDA依賴

FlagGems算子庫實(shí)現(xiàn)模型推理全鏈路算子替代,MoE調(diào)度Attention、RMSNorm、TopK 路由等核心模塊均基于Triton重新實(shí)現(xiàn),海光可脫離NVIDIA私有庫獨(dú)立運(yùn)行,適配效率大幅提升。

突破顯存限制,覆蓋主流配置

針對(duì)ogroup=8機(jī)制,F(xiàn)lagOS采用獨(dú)立張量并行策略,在保證ogroup切分不超8份前提下,支持模型其他部分超8份張量并行,讓更小顯存芯片可正常加載與推理,不再局限于高端大顯存硬件。

精度路徑打通,效果無損對(duì)齊

DeepSeekV4Flash原生為FP4+FP8混合精度,F(xiàn)lagOS完成權(quán)重反量化、計(jì)算路徑重建與精度對(duì)齊驗(yàn)證,海光平臺(tái)運(yùn)行效果與原生版本保持一致,滿足生產(chǎn)級(jí)部署要求。

極簡部署與生態(tài)支持

FlagOS為海光等芯片提供開箱即用的DeepSeekV4Flash版本,開發(fā)者可通過源碼安裝或直接下載模型鏡像快速部署:

·支持單機(jī)8 卡、雙機(jī)16卡推理,一鍵開啟FlagGems加速

·模型與鏡像已發(fā)布至FlagRelease、魔搭、HuggingFace等平臺(tái)

·底層優(yōu)化自動(dòng)生效,無需修改業(yè)務(wù)代碼,兼容原生使用習(xí)慣

經(jīng)GPQA_Diamond、AIME等權(quán)威評(píng)測集驗(yàn)證,海光平臺(tái)上的FlagOS適配版,在語言理解、復(fù)雜推理、代碼生成、數(shù)學(xué)計(jì)算等能力與CUDA原生版本對(duì)齊,可用于金融、政企、教育、研發(fā)等關(guān)鍵場景。

本次適配標(biāo)志著以海光為代表的國產(chǎn)AI芯片,已具備支撐新一代千億級(jí)MoE大模型的能力。FlagOS將傳統(tǒng)數(shù)周的跨芯片適配周期縮短至數(shù)天,實(shí)現(xiàn) “模型發(fā)布即多芯片支持”,大幅降低大模型規(guī)?;涞爻杀尽?/p>

作為FlagOS生態(tài)重要硬件平臺(tái),海光持續(xù)參與異構(gòu)算力協(xié)同建設(shè),依托統(tǒng)一系統(tǒng)軟件棧實(shí)現(xiàn)模型快速遷移、高效推理,與智源研究院、眾智FlagOS社區(qū)共同推進(jìn)國產(chǎn)AI算力普惠化,為大模型與智能體時(shí)代提供安全、高效、可控的算力底座。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 海光信息
    +關(guān)注

    關(guān)注

    0

    文章

    63

    瀏覽量

    2750
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    860

    瀏覽量

    3440
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    摩爾線程攜手人工智能研究院Day-0適配DeepSeek-V4 Pro和Flash雙模型

    4月24日,摩爾線程聯(lián)合北京智人工智能研究院,基于旗艦級(jí)AI訓(xùn)推一體智算卡MTT S5000與FlagOS棧軟件體系,完成
    的頭像 發(fā)表于 04-30 16:30 ?1668次閱讀

    登臨科技GPU+架構(gòu)深度適配DeepSeek-V4大模型

    DeepSeek-V4-Flash,系標(biāo)配百萬token長上下文能力,開啟大模型長文本普惠新時(shí)代。同日,開源社區(qū)已提交適配DeepSeek-V4的代碼。 作為國產(chǎn)高性能通用GPU的
    的頭像 發(fā)表于 04-29 16:07 ?1917次閱讀

    寒武紀(jì)Day 0適配DeepSeek-V4模型

    2026年4月24日,寒武紀(jì)已基于 vLLM 推理框架完成對(duì)深度求索公司最新開源模型285B DeepSeek-V4-flash 和1.6T DeepSeek-V4-pro的 Day
    的頭像 發(fā)表于 04-29 10:14 ?423次閱讀

    華為云首發(fā)適配DeepSeek-V4模型

    4月24日,DeepSeek-V4模型正式發(fā)布并開源,華為云首發(fā)適配DeepSeek-V4擁有百萬Token超長上下文,在Agent能力、世界知識(shí)和推理性能上均實(shí)現(xiàn)國內(nèi)與開源領(lǐng)域的領(lǐng)
    的頭像 發(fā)表于 04-28 17:01 ?638次閱讀

    軟通華方超節(jié)點(diǎn)服務(wù)器產(chǎn)品全面適配DeepSeek V4模型

    超節(jié)點(diǎn)服務(wù)器,率先完成了對(duì)DeepSeek V4適配與驗(yàn)證工作。這一舉措不僅展現(xiàn)了公司在國產(chǎn)算力領(lǐng)域的深厚技術(shù)積淀,更為廣大企業(yè)用戶提
    的頭像 發(fā)表于 04-28 16:34 ?400次閱讀

    沐曦股份Day 0適配DeepSeek-V4-Flash模型

    4月24日,沐曦股份攜手FlagOS,已完對(duì)DeepSeek最新開源的DeepSeek-V4-Flash模型的Day 0
    的頭像 發(fā)表于 04-28 15:53 ?639次閱讀

    燧原科技L600 FP8原生適配DeepSeek-V4-Pro/Flash模型

    2026年4月24日,深度求索(DeepSeek)正式發(fā)布并開源新一代旗艦大模型DeepSeek?V4,同步推出1.6T DeepSeek?
    的頭像 發(fā)表于 04-28 15:19 ?601次閱讀

    國產(chǎn)AI算力:從DeepSeek V4與華為昇騰協(xié)同看棧自主之路

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)2026年4月24日,DeepSeek V4 - Pro和DeepSeek V4 -
    的頭像 發(fā)表于 04-25 07:02 ?1.3w次閱讀

    長江計(jì)算G940K V2超節(jié)點(diǎn)服務(wù)器完成對(duì)DeepSeek V4模型極速適配

      4月24日,備受行業(yè)關(guān)注的大模型產(chǎn)品DeepSeek V4正式發(fā)布。烽火通信旗下長江計(jì)算憑借深厚的技術(shù)積累與前瞻布局,以G940K V2超節(jié)點(diǎn)服務(wù)器為核心載體,同步
    的頭像 發(fā)表于 04-24 17:40 ?1988次閱讀

    信息DCU平臺(tái)完成對(duì)DeepSeek V4模型極速適配

      4月24日,深度求索正式發(fā)布并開源DeepSeek V4。DCU同步完成對(duì)
    的頭像 發(fā)表于 04-24 17:32 ?1839次閱讀

    摩爾線程S5000 + 智FlagOS:基于原生FP8引擎,Day-0適配DeepSeek-V4

    4月24日,摩爾線程攜手眾智FlagOS社區(qū),在旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000上,率先實(shí)現(xiàn)對(duì)新一代大模型DeepSeek-V
    發(fā)表于 04-24 16:30 ?1868次閱讀
    摩爾線程S5000 + 智<b class='flag-5'>源</b><b class='flag-5'>FlagOS</b>:基于原生FP8引擎,Day-0<b class='flag-5'>適配</b><b class='flag-5'>DeepSeek-V4</b>

    信息DCU平臺(tái)適配阿里通義Qwen3.6-35B-A3B大模型

      近日,阿里通義正式開源多模態(tài)智能體大模型Qwen3.6-35B-A3B,發(fā)布不到24小時(shí),信息聯(lián)合眾智FlagOS社區(qū)完成該模型在
    的頭像 發(fā)表于 04-21 17:40 ?1864次閱讀

    DCU完成階躍星辰基座模型Step 3.5 Flash推理適配

    近日,DCU正式完成對(duì)階躍星辰旗艦開源基座模型Step 3.5 Flash流程適配與深度
    的頭像 發(fā)表于 03-26 09:48 ?742次閱讀

    DCU完成Qwen3.5多模態(tài)MoE模型適配

    近日,DCU完成Qwen3.5-397B MoE旗艦多模態(tài)模型、Qwen3.5-35B-A3B MoE多模態(tài)模型
    的頭像 發(fā)表于 03-26 09:35 ?831次閱讀

    天數(shù)智芯完成阿里云通義千問Qwen3.5系列多模態(tài)模型適配

    近日,天數(shù)智芯攜手眾智FlagOS 社區(qū)完成阿里云通義千問 Qwen3.5 系列多模態(tài)模型適配
    的頭像 發(fā)表于 03-26 09:25 ?2371次閱讀
    宁安市| 陕西省| 安顺市| 乡城县| 唐海县| 巩义市| 陇川县| 射洪县| 平南县| 夹江县| 荔浦县| 思南县| 武城县| 三门峡市| 玛曲县| 延川县| 古蔺县| 营山县| 开封市| 吴忠市| 崇明县| 乌鲁木齐县| 合川市| 闽清县| 青铜峡市| 珲春市| 广汉市| 南开区| 襄城县| 调兵山市| 墨脱县| 基隆市| 灵武市| 鄂尔多斯市| 永康市| 双江| 丰顺县| 柳州市| 乌兰浩特市| 迁西县| 光山县|