福利视频五区,精品97熟妇

4月24日，摩爾線程聯(lián)合北京智源人工智能研究院，基于旗艦級(jí)AI訓(xùn)推一體智算卡MTT S5000與FlagOS全棧軟件體系，完成DeepSeek-V4系列兩款模型推理“Day-0”適配，并在魔塔社區(qū)正式發(fā)布Pro和Flash兩個(gè)版本的鏡像，為開(kāi)發(fā)者與行業(yè)用戶(hù)帶來(lái)開(kāi)箱即用的國(guó)產(chǎn)化部署方案。

DeepSeek-V4-Pro鏡像地址：

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Pro-mthreads-FlagOS

DeepSeek-V4-Flash鏡像地址：

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Flash-mthreads-FlagOS

此次鏡像發(fā)布，標(biāo)志著摩爾線程在前沿大模型適配、先進(jìn)精度承載和國(guó)產(chǎn)算力生態(tài)建設(shè)上取得新進(jìn)展，也體現(xiàn)出摩爾線程與智源研究院圍繞FlagOS生態(tài)適配持續(xù)深化的戰(zhàn)略合作正在加速落地。

當(dāng)前，大模型快速迭代演進(jìn)，模型能力競(jìng)爭(zhēng)正加速向工程化落地能力延伸。面對(duì)DeepSeek-V4這類(lèi)對(duì)底層精度能力、算子支持、編譯優(yōu)化與推理效率提出更高要求的先進(jìn)模型，摩爾線程依托 MTT S5000原生FP8能力與完善的軟件生態(tài)，率先實(shí)現(xiàn)Day0適配，進(jìn)一步驗(yàn)證了國(guó)產(chǎn)GPU平臺(tái)對(duì)前沿模型的快速承載能力。

原生FP8引擎，夯實(shí)先進(jìn)模型高效推理底座

隨著大模型進(jìn)入先進(jìn)混合精度時(shí)代，原生FP8支持正成為衡量AI基礎(chǔ)設(shè)施能力的重要指標(biāo)之一。相較于傳統(tǒng)BF16、FP16路徑，F(xiàn)P8在吞吐效率、顯存占用和帶寬利用方面具備更優(yōu)平衡，更適合承接參數(shù)規(guī)模更大、推理鏈路更復(fù)雜的新一代模型。

作為國(guó)內(nèi)率先原生支持FP8的全功能GPU，摩爾線程MTT S5000面向大模型訓(xùn)推場(chǎng)景打造，具備支撐先進(jìn)精度計(jì)算的核心能力，能夠更高效匹配DeepSeek-V4對(duì)性能與精度協(xié)同優(yōu)化的要求。此次DeepSeek-V4 Day0適配，正是摩爾線程原生FP8引擎優(yōu)勢(shì)在前沿模型落地中的集中體現(xiàn)。

依托這一能力，摩爾線程不僅能夠第一時(shí)間支持前沿模型運(yùn)行，更能夠以更貼合模型精度趨勢(shì)的硬件能力，實(shí)現(xiàn)高質(zhì)量、高效率的推理部署，為開(kāi)發(fā)者和行業(yè)用戶(hù)提供更具競(jìng)爭(zhēng)力的國(guó)產(chǎn)算力選擇。

三大技術(shù)亮點(diǎn)，

釋放摩爾線程平臺(tái)工程化適配能力

圍繞DeepSeek-V4的部署需求，摩爾線程與FlagOS生態(tài)協(xié)同推進(jìn)了多項(xiàng)關(guān)鍵技術(shù)能力落地，進(jìn)一步展現(xiàn)了MTT S5000在先進(jìn)模型推理場(chǎng)景下的工程化優(yōu)勢(shì)。

首先，依托統(tǒng)一高性能算子能力與統(tǒng)一編譯支撐，DeepSeek-V4在摩爾線程平臺(tái)上實(shí)現(xiàn)了從底層算子承接到運(yùn)行部署的高效貫通，顯著提升先進(jìn)模型在國(guó)產(chǎn)GPU上的開(kāi)箱可用性和適配效率。

其次，面向復(fù)雜模型結(jié)構(gòu)帶來(lái)的多卡部署挑戰(zhàn)，雙方圍繞并行通信路徑進(jìn)行了針對(duì)性?xún)?yōu)化，進(jìn)一步增強(qiáng)了 DeepSeek-V4 在多卡、多機(jī)場(chǎng)景下的部署靈活性，為更大規(guī)模的推理落地提供支撐。

再次，針對(duì)先進(jìn)模型在精度路徑和權(quán)重遷移上的復(fù)雜需求，雙方打通了自動(dòng)化權(quán)重轉(zhuǎn)換與后續(xù)量化部署能力，使 DeepSeek-V4 在摩爾線程平臺(tái)上的遷移、驗(yàn)證和持續(xù)優(yōu)化更加高效，也為后續(xù)資源效率提升和規(guī)模化應(yīng)用奠定基礎(chǔ)。

從原生FP8承載，到算子、編譯、并行、遷移與鏡像化交付的完整鏈路貫通，摩爾線程展現(xiàn)出的不僅是單點(diǎn)硬件能力，更是面向先進(jìn)模型持續(xù)演進(jìn)的系統(tǒng)級(jí)支撐能力。

軟硬協(xié)同優(yōu)化，推動(dòng)先進(jìn)模型“發(fā)布即可用”

先進(jìn)模型的價(jià)值，不僅在于模型本身，更在于能否快速完成適配、部署與應(yīng)用驗(yàn)證。圍繞大模型訓(xùn)練、推理與服務(wù)化落地需求，摩爾線程持續(xù)完善從驅(qū)動(dòng)、編譯器、運(yùn)行時(shí)到推理引擎、開(kāi)發(fā)工具鏈和鏡像交付的全棧軟件能力，形成了面向開(kāi)發(fā)者友好的國(guó)產(chǎn)GPU軟件生態(tài)。

在本次DeepSeek-V4適配中，摩爾線程軟件生態(tài)與FlagOS技術(shù)體系實(shí)現(xiàn)深度協(xié)同。一方面，MTT S5000的原生FP8支持為先進(jìn)精度路徑提供直接承載；另一方面，F(xiàn)lagOS在統(tǒng)一算子、統(tǒng)一編譯、多芯遷移和鏡像化交付上的能力，則進(jìn)一步縮短了模型適配周期，降低了部署復(fù)雜度。

最終，用戶(hù)在魔塔社區(qū)即可獲取DeepSeek-V4模型鏡像，快速完成環(huán)境拉起、模型驗(yàn)證與部署實(shí)踐，顯著降低先進(jìn)模型在國(guó)產(chǎn)平臺(tái)上的使用門(mén)檻，推動(dòng)大模型應(yīng)用從“可運(yùn)行”邁向“易部署、易驗(yàn)證、易落地”。

攜手智源研究院，

共建國(guó)產(chǎn)算力全棧軟件生態(tài)

此次成果發(fā)布的背后，是摩爾線程與智源研究院圍繞FlagOS生態(tài)適配開(kāi)展的深度協(xié)同。作為面向多種AI芯片的系統(tǒng)軟件技術(shù)體系，F(xiàn)lagOS在統(tǒng)一算子、統(tǒng)一編譯、模型遷移與鏡像發(fā)布等方面提供了關(guān)鍵支撐，為先進(jìn)模型在不同算力平臺(tái)上的快速落地建立起高效路徑。

圍繞DeepSeek-V4推理適配需求，雙方技術(shù)團(tuán)隊(duì)面向MTT S5000平臺(tái)開(kāi)展聯(lián)合優(yōu)化，打通了從底層算子適配、精度路徑承接、編譯執(zhí)行優(yōu)化到運(yùn)行環(huán)境封裝、鏡像發(fā)布的關(guān)鍵鏈路，推動(dòng)模型鏡像在魔塔社區(qū)順利上線。

這不僅是一項(xiàng)模型適配成果，更是摩爾線程與智源研究院在國(guó)產(chǎn)算力與基礎(chǔ)軟件協(xié)同創(chuàng)新方面長(zhǎng)期戰(zhàn)略合作的又一落地實(shí)踐。雙方正以芯片能力、系統(tǒng)軟件與模型工程化交付的深度協(xié)同，共同構(gòu)建自主可控、開(kāi)放繁榮的國(guó)產(chǎn)算力全棧軟件生態(tài)。

未來(lái)，摩爾線程將繼續(xù)發(fā)揮MTT S5000與原生FP8引擎優(yōu)勢(shì)，聯(lián)合智源研究院及更多生態(tài)伙伴，持續(xù)推進(jìn)更多前沿模型在FlagOS生態(tài)中的高質(zhì)量適配與高效率發(fā)布，加快國(guó)產(chǎn)AI基礎(chǔ)設(shè)施體系完善，助力大模型在更多行業(yè)場(chǎng)景實(shí)現(xiàn)落地應(yīng)用。

開(kāi)發(fā)者可前往魔塔社區(qū)獲取鏡像：

DeepSeek-V4-Flash

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Flash-mthreads-FlagOS

DeepSeek-V4-Pro

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Pro-mthreads-FlagOS

關(guān)于摩爾線程

摩爾線程以全功能GPU為核心，致力于向全球提供加速計(jì)算的基礎(chǔ)設(shè)施和一站式解決方案，為各行各業(yè)的數(shù)智化轉(zhuǎn)型提供強(qiáng)大的AI計(jì)算支持。

我們的目標(biāo)是成為具備國(guó)際競(jìng)爭(zhēng)力的GPU領(lǐng)軍企業(yè)，為融合人工智能和數(shù)字孿生的數(shù)智世界打造先進(jìn)的加速計(jì)算平臺(tái)。我們的愿景是為美好世界加速。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

gpu

gpu

+關(guān)注

關(guān)注
28

文章
5283

瀏覽量
136094
人工智能

人工智能

+關(guān)注

關(guān)注
1821

文章
50366

瀏覽量
267045
摩爾線程

摩爾線程

+關(guān)注

關(guān)注
2

文章
289

瀏覽量
6668

原文標(biāo)題：摩爾線程S5000 + 智源FlagOS｜Day-0適配DeepSeek-V4 Pro和Flash雙模型，并發(fā)布鏡像

文章出處：【微信號(hào)：moorethreads，微信公眾號(hào)：摩爾線程】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

日B视频亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

搜索歷史

摩爾線程攜手智源人工智能研究院Day-0適配DeepSeek-V4 Pro和Flash雙模型

評(píng)論