日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

沐曦股份Day 0適配DeepSeek-V4-Flash模型

沐曦MetaX ? 來源:沐曦metaX ? 2026-04-28 15:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

4月24日,沐曦股份攜手FlagOS,已完對DeepSeek最新開源的DeepSeek-V4-Flash模型的Day 0適配。同日,沐曦股份還聯(lián)合上海人工智能實驗室KernelSwift智能算子遷移系統(tǒng),率先完成DeepSeek-V4核心算子的Day0適配。

截至目前,沐曦股份已完成針對國內(nèi)19款主流開源模型的極速適配,全面覆蓋DeepSeek、MiniMax、智譜、阿里巴巴、騰訊、階躍星辰、百度等頭部廠商最新旗艦模型,種類涵蓋語言、多模態(tài)、OCR、3D生成等全領域,效率領跑行業(yè)。

能夠取得這一成果,既得益于沐曦股份在GPU硬件設計與自研軟件棧MXMACA上的長期技術積累,也與上海人工智能實驗室、FlagOS合作伙伴的深度協(xié)同密不可分。

FlagOS三大核心技術支持,沐曦芯片完成全量適配

在沐曦股份與FlagOS的合作中,背后有三大關鍵技術提供支持:

高性能通用大模型算子庫FlagGems。據(jù)FlagOS介紹,F(xiàn)lagGems 提供支持8種以上芯片的全算子替代。此次DeepSeek V4在注意力機制和量化策略上引入了5個新算子,F(xiàn)lagGems針對全部5個算子進行了重新實現(xiàn),以支持國產(chǎn)多芯片適配。

FlagOS采用獨立并行策略,解除張量并行最多單機8卡限制,將可運行芯片范圍從“僅限單機80GB以上顯存的個別高端卡”擴展到“多機64GB/32GB的更多主流國產(chǎn)芯片”。

FlagOS支持從“FP4+FP8混合精度” 到 BF16的精度轉(zhuǎn)換。此次 DeepSeek-V4-Flash模型發(fā)布時首次采用 FP4+FP8混合精度,F(xiàn)lagOS 完成了從 FP4 到 BF16 的完整精度轉(zhuǎn)換,使得模型可部署在 FP8 及 BF16 生態(tài)的主流國產(chǎn)芯片上。

目前,F(xiàn)lagOS已經(jīng)完成針對DeepSeek-V4開源模型的多芯全量適配與推理部署,開發(fā)者可直接獲取對應芯片的開箱即用方案。

沐曦適配版本鏈接

魔搭:

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Flash-metax-FlagOS

HuggingFace:

https://huggingface.co/FlagRelease/DeepSeek-V4-Flash-metax-FlagOS

KernelSwift加速,沐曦芯片實現(xiàn)核心算子高效遷移

算子遷移效率與性能優(yōu)化是解鎖國產(chǎn)算力的關鍵。

沐曦股份在與上海人工智能實驗室的合作中,借助實驗室研發(fā)的智能算子遷移系統(tǒng)KernelSwift,沐曦芯片率先完成了DeepSeek-V4核心算子的Day0適配, 算子平均通過率約80%。

在DeepSeek-V4模型發(fā)布后,KernelSwift啟動全自動流程生成核心算子并適配多元國產(chǎn)芯片,全程無人工干預。DeepSeek-V4模型共計21個核心算子中,KernelSwift采用融合策略,核心算子相比?TileLang?達到1.2倍以上性能加速,國產(chǎn)芯片平均實現(xiàn)75%+正確性,平均加速比達3.4倍。自動生成的算子經(jīng)人工修改后,國產(chǎn)芯片平均實現(xiàn)100%正確性,大大提高了算子開發(fā)和遷移效率。

依托“自研GPU硬件+MXMACA軟件棧”軟硬一體計算平臺的核心優(yōu)勢,沐曦股份快速響應大模型迭代節(jié)奏,高效完成了多款主流模型的適配工作,以全棧技術實力為大模型快速落地筑牢算力支撐。

未來,沐曦股份將繼續(xù)與上海人工智能實驗室、FlagOS深度合作,以Day 0適配為標準,實現(xiàn)大模型“發(fā)布即落地”,共同打造從底層算力到上層應用的無縫銜接生態(tài),加速AI技術在千行百業(yè)的規(guī)?;渴穑步ㄗ灾骺煽氐闹悄苡嬎阈碌鬃?。

關于沐曦股份

沐曦股份致力于自主研發(fā)全棧高性能GPU芯片及計算平臺,為智算、通用計算、云渲染等前沿領域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1821

    文章

    50366

    瀏覽量

    267056
  • 沐曦
    +關注

    關注

    1

    文章

    103

    瀏覽量

    1884
  • DeepSeek
    +關注

    關注

    2

    文章

    855

    瀏覽量

    3414

原文標題:沐曦股份攜手FlagOS、上海人工智能實驗室,完成DeepSeek-V4 Day 0適配

文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    寒武紀Day 0適配DeepSeek-V4模型

    2026年4月24日,寒武紀已基于 vLLM 推理框架完成對深度求索公司最新開源模型285B DeepSeek-V4-flash 和1.6T DeepSeek-V4-pro的
    的頭像 發(fā)表于 04-29 10:14 ?299次閱讀

    華為云首發(fā)適配DeepSeek-V4模型

    ,DeepSeek-V4-Flash模型參數(shù)下降至284B,推理成本進一步降低,模型參數(shù)和激活更小,V4-Flash能夠提供更加快捷、經(jīng)濟的API服務,實現(xiàn)百萬上下文普惠。當前,華為云
    的頭像 發(fā)表于 04-28 17:01 ?508次閱讀

    股份云C系列GPU產(chǎn)品Day 0適配小米MiMo-V2.5-Pro模型

    4月23日,小米開啟 MiMo-V2.5系列模型的公測,并于4月28日正式發(fā)布及開源。
    的頭像 發(fā)表于 04-28 15:59 ?299次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU產(chǎn)品<b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>適配</b>小米MiMo-<b class='flag-5'>V</b>2.5-Pro<b class='flag-5'>模型</b>

    股份云C系列GPU產(chǎn)品Day 0適配騰訊混元Hy3 preview語言模型

    4月23日,騰訊混元團隊正式發(fā)布并開源Hy3 preview語言模型。股份旗下云 C 系列
    的頭像 發(fā)表于 04-28 15:51 ?704次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU產(chǎn)品<b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>適配</b>騰訊混元Hy3 preview語言<b class='flag-5'>模型</b>

    摩爾線程S5000 + 智源FlagOS:基于原生FP8引擎,Day-0適配DeepSeek-V4

    4月24日,摩爾線程攜手智源眾智FlagOS社區(qū),在旗艦級AI訓推一體全功能GPU MTT S5000上,率先實現(xiàn)對新一代大模型DeepSeek-V4-FlashDay-0極速
    發(fā)表于 04-24 16:30 ?1425次閱讀
    摩爾線程S5000 + 智源FlagOS:基于原生FP8引擎,<b class='flag-5'>Day-0</b><b class='flag-5'>適配</b><b class='flag-5'>DeepSeek-V4</b>

    股份Day 0適配阿里千問Qwen3.6-35B-A3B大模型

    阿里巴巴千問模型團隊最新宣布,開源旗下多模態(tài)“智能體小鋼炮” Qwen3.6-35B-A3B模型。股份與FlagOS合作,完成了該
    的頭像 發(fā)表于 04-22 11:13 ?779次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>適配</b>阿里千問Qwen3.6-35B-A3B大<b class='flag-5'>模型</b>

    股份云C系列GPU產(chǎn)品Day 0適配百度文心ERNIE-Image文生圖模型

    4月15日,百度文心大模型團隊重磅推出ERNIE?Image文生圖模型股份
    的頭像 發(fā)表于 04-15 17:39 ?512次閱讀

    MiniMax M2.7全球開源,摩爾線程、等完成Day0適配

    電子發(fā)燒友網(wǎng)綜合報道 4月12日,MiniMax M2.7在全球正式開源。華為昇騰、摩爾線程、股份、昆侖芯、NVIDIA,以及TogetherAI、Fireworks、Ollama
    的頭像 發(fā)表于 04-14 11:05 ?1841次閱讀

    股份云C系列GPU產(chǎn)品Day 0適配MiniMax M2.7模型

    4月12日,MiniMax新一代Agent旗艦大模型M2.7開源。股份云C系列GPU已完成
    的頭像 發(fā)表于 04-13 17:08 ?874次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU產(chǎn)品<b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>適配</b>MiniMax M2.7<b class='flag-5'>模型</b>

    股份云C系列GPU產(chǎn)品Day 0適配智譜GLM-5.1旗艦模型

    4月8日,智譜新一代旗艦模型GLM-5.1實現(xiàn)開源。目前,股份云 C 系列 GPU已完成該
    的頭像 發(fā)表于 04-09 11:25 ?435次閱讀

    股份云C系列GPU全面適配通義千問Qwen3.5三款新模型

    今日,通義千問團隊正式開源發(fā)布Qwen3.5系列中等規(guī)模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B三個版本。股份旗下
    的頭像 發(fā)表于 02-28 10:05 ?760次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU全面<b class='flag-5'>適配</b>通義千問Qwen3.5三款新<b class='flag-5'>模型</b>

    股份云C系列GPU深度適配通義千問Qwen3.5模型

    今天,通義千問今天正式發(fā)布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的開放權重版本。股份
    的頭像 發(fā)表于 02-26 14:26 ?837次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU深度<b class='flag-5'>適配</b>通義千問Qwen3.5<b class='flag-5'>模型</b>

    云C系列GPU Day 0 適配智譜全新一代大模型GLM-5

    智譜AI正式上線并開源全新一代大模型 GLM-5,股份實現(xiàn)?Day 0 深度
    的頭像 發(fā)表于 02-12 10:53 ?1134次閱讀
    <b class='flag-5'>曦</b>云C系列GPU <b class='flag-5'>Day</b> <b class='flag-5'>0</b> <b class='flag-5'>適配</b>智譜全新一代大<b class='flag-5'>模型</b>GLM-5

    云C600 GPU產(chǎn)品適配階躍星辰基座模型Step 3.5 Flash

    今天,階躍星辰技術團隊發(fā)布并開源最新旗艦基座模型 Step 3.5 Flash。股份已實現(xiàn)
    的頭像 發(fā)表于 02-02 14:44 ?565次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C600 GPU產(chǎn)品<b class='flag-5'>適配</b>階躍星辰基座<b class='flag-5'>模型</b>Step 3.5 <b class='flag-5'>Flash</b>

    股份云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型

    12月8日智譜AI發(fā)布并開源 GLM-4.6V 系列多模態(tài)大模型股份云C系列GPU完成
    的頭像 發(fā)表于 12-17 14:28 ?866次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU <b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>適配</b>智譜GLM-4.6<b class='flag-5'>V</b>多模態(tài)大<b class='flag-5'>模型</b>
    敦煌市| 筠连县| 博兴县| 永泰县| 永清县| 南昌市| 利辛县| 商南县| 靖安县| 衡南县| 徐汇区| 太白县| 额尔古纳市| 湟中县| 大兴区| 尼木县| 宝鸡市| 瓮安县| 兴和县| 柳河县| 卢氏县| 宜昌市| 重庆市| 承德县| 印江| 秦安县| 玉田县| 阿克| 长顺县| 大埔区| 阜宁县| 阿克陶县| 大新县| 罗江县| 崇文区| 青海省| 靖远县| 焦作市| 仙游县| 浪卡子县| 寿阳县|