日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

摩爾線程攜手智源人工智能研究院Day-0適配DeepSeek-V4 Pro和Flash雙模型

摩爾線程 ? 來(lái)源:摩爾線程 ? 2026-04-30 16:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

4月24日,摩爾線程聯(lián)合北京智源人工智能研究院,基于旗艦級(jí)AI訓(xùn)推一體智算卡MTT S5000與FlagOS全棧軟件體系,完成DeepSeek-V4系列兩款模型推理“Day-0”適配,并在魔塔社區(qū)正式發(fā)布Pro和Flash兩個(gè)版本的鏡像,為開(kāi)發(fā)者與行業(yè)用戶(hù)帶來(lái)開(kāi)箱即用的國(guó)產(chǎn)化部署方案。

DeepSeek-V4-Pro鏡像地址:

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Pro-mthreads-FlagOS

DeepSeek-V4-Flash鏡像地址:

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Flash-mthreads-FlagOS

此次鏡像發(fā)布,標(biāo)志著摩爾線程在前沿大模型適配、先進(jìn)精度承載和國(guó)產(chǎn)算力生態(tài)建設(shè)上取得新進(jìn)展,也體現(xiàn)出摩爾線程與智源研究院圍繞FlagOS生態(tài)適配持續(xù)深化的戰(zhàn)略合作正在加速落地。

當(dāng)前,大模型快速迭代演進(jìn),模型能力競(jìng)爭(zhēng)正加速向工程化落地能力延伸。面對(duì)DeepSeek-V4這類(lèi)對(duì)底層精度能力、算子支持、編譯優(yōu)化與推理效率提出更高要求的先進(jìn)模型,摩爾線程依托 MTT S5000原生FP8能力與完善的軟件生態(tài),率先實(shí)現(xiàn)Day0適配,進(jìn)一步驗(yàn)證了國(guó)產(chǎn)GPU平臺(tái)對(duì)前沿模型的快速承載能力。

原生FP8引擎,夯實(shí)先進(jìn)模型高效推理底座

隨著大模型進(jìn)入先進(jìn)混合精度時(shí)代,原生FP8支持正成為衡量AI基礎(chǔ)設(shè)施能力的重要指標(biāo)之一。相較于傳統(tǒng)BF16、FP16路徑,F(xiàn)P8在吞吐效率、顯存占用和帶寬利用方面具備更優(yōu)平衡,更適合承接參數(shù)規(guī)模更大、推理鏈路更復(fù)雜的新一代模型。

作為國(guó)內(nèi)率先原生支持FP8的全功能GPU,摩爾線程MTT S5000面向大模型訓(xùn)推場(chǎng)景打造,具備支撐先進(jìn)精度計(jì)算的核心能力,能夠更高效匹配DeepSeek-V4對(duì)性能與精度協(xié)同優(yōu)化的要求。此次DeepSeek-V4 Day0適配,正是摩爾線程原生FP8引擎優(yōu)勢(shì)在前沿模型落地中的集中體現(xiàn)。

依托這一能力,摩爾線程不僅能夠第一時(shí)間支持前沿模型運(yùn)行,更能夠以更貼合模型精度趨勢(shì)的硬件能力,實(shí)現(xiàn)高質(zhì)量、高效率的推理部署,為開(kāi)發(fā)者和行業(yè)用戶(hù)提供更具競(jìng)爭(zhēng)力的國(guó)產(chǎn)算力選擇。

三大技術(shù)亮點(diǎn),

釋放摩爾線程平臺(tái)工程化適配能力

圍繞DeepSeek-V4的部署需求,摩爾線程與FlagOS生態(tài)協(xié)同推進(jìn)了多項(xiàng)關(guān)鍵技術(shù)能力落地,進(jìn)一步展現(xiàn)了MTT S5000在先進(jìn)模型推理場(chǎng)景下的工程化優(yōu)勢(shì)。

首先,依托統(tǒng)一高性能算子能力與統(tǒng)一編譯支撐,DeepSeek-V4在摩爾線程平臺(tái)上實(shí)現(xiàn)了從底層算子承接到運(yùn)行部署的高效貫通,顯著提升先進(jìn)模型在國(guó)產(chǎn)GPU上的開(kāi)箱可用性和適配效率。

其次,面向復(fù)雜模型結(jié)構(gòu)帶來(lái)的多卡部署挑戰(zhàn),雙方圍繞并行通信路徑進(jìn)行了針對(duì)性?xún)?yōu)化,進(jìn)一步增強(qiáng)了 DeepSeek-V4 在多卡、多機(jī)場(chǎng)景下的部署靈活性,為更大規(guī)模的推理落地提供支撐。

再次,針對(duì)先進(jìn)模型在精度路徑和權(quán)重遷移上的復(fù)雜需求,雙方打通了自動(dòng)化權(quán)重轉(zhuǎn)換與后續(xù)量化部署能力,使 DeepSeek-V4 在摩爾線程平臺(tái)上的遷移、驗(yàn)證和持續(xù)優(yōu)化更加高效,也為后續(xù)資源效率提升和規(guī)模化應(yīng)用奠定基礎(chǔ)。

從原生FP8承載,到算子、編譯、并行、遷移與鏡像化交付的完整鏈路貫通,摩爾線程展現(xiàn)出的不僅是單點(diǎn)硬件能力,更是面向先進(jìn)模型持續(xù)演進(jìn)的系統(tǒng)級(jí)支撐能力。

軟硬協(xié)同優(yōu)化,推動(dòng)先進(jìn)模型“發(fā)布即可用”

先進(jìn)模型的價(jià)值,不僅在于模型本身,更在于能否快速完成適配、部署與應(yīng)用驗(yàn)證。圍繞大模型訓(xùn)練、推理與服務(wù)化落地需求,摩爾線程持續(xù)完善從驅(qū)動(dòng)、編譯器、運(yùn)行時(shí)到推理引擎、開(kāi)發(fā)工具鏈和鏡像交付的全棧軟件能力,形成了面向開(kāi)發(fā)者友好的國(guó)產(chǎn)GPU軟件生態(tài)。

在本次DeepSeek-V4適配中,摩爾線程軟件生態(tài)與FlagOS技術(shù)體系實(shí)現(xiàn)深度協(xié)同。一方面,MTT S5000的原生FP8支持為先進(jìn)精度路徑提供直接承載;另一方面,F(xiàn)lagOS在統(tǒng)一算子、統(tǒng)一編譯、多芯遷移和鏡像化交付上的能力,則進(jìn)一步縮短了模型適配周期,降低了部署復(fù)雜度。

最終,用戶(hù)在魔塔社區(qū)即可獲取DeepSeek-V4模型鏡像,快速完成環(huán)境拉起、模型驗(yàn)證與部署實(shí)踐,顯著降低先進(jìn)模型在國(guó)產(chǎn)平臺(tái)上的使用門(mén)檻,推動(dòng)大模型應(yīng)用從“可運(yùn)行”邁向“易部署、易驗(yàn)證、易落地”。

攜手智源研究院,

共建國(guó)產(chǎn)算力全棧軟件生態(tài)

此次成果發(fā)布的背后,是摩爾線程與智源研究院圍繞FlagOS生態(tài)適配開(kāi)展的深度協(xié)同。作為面向多種AI芯片的系統(tǒng)軟件技術(shù)體系,F(xiàn)lagOS在統(tǒng)一算子、統(tǒng)一編譯、模型遷移與鏡像發(fā)布等方面提供了關(guān)鍵支撐,為先進(jìn)模型在不同算力平臺(tái)上的快速落地建立起高效路徑。

圍繞DeepSeek-V4推理適配需求,雙方技術(shù)團(tuán)隊(duì)面向MTT S5000平臺(tái)開(kāi)展聯(lián)合優(yōu)化,打通了從底層算子適配、精度路徑承接、編譯執(zhí)行優(yōu)化到運(yùn)行環(huán)境封裝、鏡像發(fā)布的關(guān)鍵鏈路,推動(dòng)模型鏡像在 魔塔社區(qū)順利上線。

這不僅是一項(xiàng)模型適配成果,更是摩爾線程與智源研究院在國(guó)產(chǎn)算力與基礎(chǔ)軟件協(xié)同創(chuàng)新方面長(zhǎng)期戰(zhàn)略合作的又一落地實(shí)踐。雙方正以芯片能力、系統(tǒng)軟件與模型工程化交付的深度協(xié)同,共同構(gòu)建自主可控、開(kāi)放繁榮的國(guó)產(chǎn)算力全棧軟件生態(tài)。

未來(lái),摩爾線程將繼續(xù)發(fā)揮MTT S5000與原生FP8引擎優(yōu)勢(shì),聯(lián)合智源研究院及更多生態(tài)伙伴,持續(xù)推進(jìn)更多前沿模型在FlagOS生態(tài)中的高質(zhì)量適配與高效率發(fā)布,加快國(guó)產(chǎn)AI基礎(chǔ)設(shè)施體系完善,助力大模型在更多行業(yè)場(chǎng)景實(shí)現(xiàn)落地應(yīng)用。

開(kāi)發(fā)者可前往魔塔社區(qū)獲取鏡像:

DeepSeek-V4-Flash

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Flash-mthreads-FlagOS

DeepSeek-V4-Pro

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Pro-mthreads-FlagOS

關(guān)于摩爾線程

摩爾線程以全功能GPU為核心,致力于向全球提供加速計(jì)算的基礎(chǔ)設(shè)施和一站式解決方案,為各行各業(yè)的數(shù)智化轉(zhuǎn)型提供強(qiáng)大的AI計(jì)算支持。

我們的目標(biāo)是成為具備國(guó)際競(jìng)爭(zhēng)力的GPU領(lǐng)軍企業(yè),為融合人工智能和數(shù)字孿生的數(shù)智世界打造先進(jìn)的加速計(jì)算平臺(tái)。我們的愿景是為美好世界加速。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5283

    瀏覽量

    136094
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50366

    瀏覽量

    267045
  • 摩爾線程
    +關(guān)注

    關(guān)注

    2

    文章

    289

    瀏覽量

    6668

原文標(biāo)題:摩爾線程S5000 + 智源FlagOS|Day-0適配DeepSeek-V4 Pro和Flash雙模型,并發(fā)布鏡像

文章出處:【微信號(hào):moorethreads,微信公眾號(hào):摩爾線程】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    摩爾線程完成DeepSeek-V4全鏈路工程化適配:S5000基于MUSA+SGLang實(shí)現(xiàn)復(fù)雜MoE模型快速落地

    ,摩爾線程已構(gòu)建起從硬件架構(gòu)核心計(jì)算引擎承接、熱點(diǎn)算子支持,再到端到端部署驗(yàn)證的系統(tǒng)化適配鏈路,驗(yàn)證了國(guó)產(chǎn)GPU平臺(tái)對(duì)前沿大模型“框架級(jí)兼容、開(kāi)箱即落地”的承載實(shí)力及工程化落地能力。
    發(fā)表于 05-02 09:01 ?619次閱讀

    云天勵(lì)飛完成DeepSeek-V4系列模型關(guān)鍵機(jī)制適配驗(yàn)證

    4月24日,DeepSeek-V4 系列模型發(fā)布。圍繞該模型 CSA/HCA 混合注意力機(jī)制帶來(lái)的新型計(jì)算需求,云天勵(lì)飛依托自研 GPNPU 架構(gòu)及 IFWA
    的頭像 發(fā)表于 04-30 17:09 ?3589次閱讀

    摩爾線程攜手上海AI實(shí)驗(yàn)室Day-0適配DeepSeek-V4核心算子

    今日,DeepSeek-V4預(yù)覽版正式發(fā)布并開(kāi)源。摩爾線程攜手上海 AI 實(shí)驗(yàn)室 DeepLink 團(tuán)隊(duì),通過(guò)大模型驅(qū)動(dòng)的
    的頭像 發(fā)表于 04-30 16:24 ?721次閱讀

    摩爾線程TileLang-MUSA率先支持DeepSeek-V4全新TileKernels

    4月24日,摩爾線程宣布,其基于TileLang 0.1.8版本深度優(yōu)化并已成為T(mén)ileLang官方主線版本的TileLang-MUSA,已率先在國(guó)產(chǎn)全功能GPU上,實(shí)現(xiàn)對(duì)DeepSeek-V
    的頭像 發(fā)表于 04-30 16:17 ?356次閱讀

    開(kāi)放原子AtomGit平臺(tái)首發(fā)適配DeepSeek-V4系列模型

    2026年4月24日,DeepSeek-V4系列模型正式發(fā)布并同步開(kāi)源。AtomGit平臺(tái)為DeepSeek-V4昇騰適配版本首發(fā)平臺(tái),為開(kāi)
    的頭像 發(fā)表于 04-29 16:12 ?673次閱讀

    登臨科技GPU+架構(gòu)深度適配DeepSeek-V4模型

    DeepSeek-V4-Flash,全系標(biāo)配百萬(wàn)token長(zhǎng)上下文能力,開(kāi)啟大模型長(zhǎng)文本普惠新時(shí)代。同日,開(kāi)源社區(qū)已提交適配DeepSeek-V4的代碼。 作為國(guó)產(chǎn)高性能通用GPU的
    的頭像 發(fā)表于 04-29 16:07 ?1149次閱讀

    寒武紀(jì)Day 0適配DeepSeek-V4模型

    2026年4月24日,寒武紀(jì)已基于 vLLM 推理框架完成對(duì)深度求索公司最新開(kāi)源模型285B DeepSeek-V4-flash 和1.6T DeepSeek-V4-pro
    的頭像 發(fā)表于 04-29 10:14 ?287次閱讀

    華為云首發(fā)適配DeepSeek-V4模型

    4月24日,DeepSeek-V4模型正式發(fā)布并開(kāi)源,華為云首發(fā)適配。DeepSeek-V4擁有百萬(wàn)Token超長(zhǎng)上下文,在Agent能力、
    的頭像 發(fā)表于 04-28 17:01 ?484次閱讀

    沐曦股份Day 0適配DeepSeek-V4-Flash模型

    4月24日,沐曦股份攜手FlagOS,已完對(duì)DeepSeek最新開(kāi)源的DeepSeek-V4-Flash模型
    的頭像 發(fā)表于 04-28 15:53 ?412次閱讀

    燧原科技L600 FP8原生適配DeepSeek-V4-Pro/Flash模型

    2026年4月24日,深度求索(DeepSeek)正式發(fā)布并開(kāi)源新一代旗艦大模型DeepSeek?V4,同步推出1.6T
    的頭像 發(fā)表于 04-28 15:19 ?435次閱讀

    壁仞科技壁礪166系列GPU產(chǎn)品率先支持DeepSeek-V4模型

    4月24日,深度求索團(tuán)隊(duì)宣布全新系列模型 DeepSeek-V4 的預(yù)覽版本正式上線并同步開(kāi)源。依托成熟的BIRENSUPA軟件棧與自研GPU全棧智能體“AIModelMaster”,
    的頭像 發(fā)表于 04-28 14:04 ?631次閱讀
    壁仞科技壁礪166系列GPU產(chǎn)品率先支持<b class='flag-5'>DeepSeek-V4</b><b class='flag-5'>模型</b>

    摩爾線程S5000 + 智FlagOS:基于原生FP8引擎,Day-0適配DeepSeek-V4

    4月24日,摩爾線程攜手眾智FlagOS社區(qū),在旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000上,率先實(shí)現(xiàn)對(duì)新一代大
    發(fā)表于 04-24 16:30 ?1347次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>S5000 + 智<b class='flag-5'>源</b>FlagOS:基于原生FP8引擎,<b class='flag-5'>Day-0</b><b class='flag-5'>適配</b><b class='flag-5'>DeepSeek-V4</b>

    Day-0支持|摩爾線程率先完成MiniMax M2.7大模型適配

    4月12日,摩爾線程旗艦級(jí)AI訓(xùn)推一體全功能GPU?MTT S5000已完成對(duì)新一代大模型MiniMax M2.7的Day-0極速
    發(fā)表于 04-13 07:57 ?1375次閱讀
    <b class='flag-5'>Day-0</b>支持|<b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>率先完成MiniMax M2.7大<b class='flag-5'>模型</b><b class='flag-5'>適配</b>

    Day-0支持|摩爾線程完成MiniMax M2.5模型極速適配

    2月14日,摩爾線程在其旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000上,成功實(shí)現(xiàn)了對(duì)MiniMax新一代大模型MiniMax M2.5的Day-0極速
    發(fā)表于 02-15 08:01 ?1593次閱讀

    Day-0支持|摩爾線程MTT S5000率先完成對(duì)GLM-5的適配

    2月11日,智譜正式發(fā)布新一代大模型GLM-5。摩爾線程基于SGLang推理框架,在旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000上,Day-0完成了全流程
    發(fā)表于 02-12 09:15 ?1644次閱讀
    <b class='flag-5'>Day-0</b>支持|<b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>MTT S5000率先完成對(duì)GLM-5的<b class='flag-5'>適配</b>
    陵水| 临澧县| 固原市| 祥云县| 吉安县| 遂溪县| 富源县| 疏附县| 神农架林区| 南雄市| 博客| 扶风县| 磐安县| 玛曲县| 彩票| 莱阳市| 开化县| 文登市| 栾川县| 拉萨市| 肇州县| 盘山县| 赣州市| 九台市| 扬州市| 眉山市| 井冈山市| 施秉县| 沁水县| 阿城市| 杭锦后旗| 汕头市| 哈巴河县| 永顺县| 汶川县| 潞西市| 铅山县| 承德县| 合川市| 乌什县| 祥云县|