電子發(fā)燒友網(wǎng)綜合報(bào)道 4月12日,MiniMax M2.7在全球正式開源。華為昇騰、摩爾線程、沐曦股份、昆侖芯、NVIDIA,以及TogetherAI、Fireworks、Ollama等海內(nèi)外芯片廠商、推理平臺(tái)已完成Day0適配,即在開源首日已經(jīng)完成模型接入與推理適配工作。
MiniMax介紹,三周前MiniMax M2.7率先上線,開啟了模型自我進(jìn)化,是業(yè)界第一個(gè)AI深度參與迭代自己的模型。M2.7能夠自行構(gòu)建復(fù)雜Agent Harness,并基于Agent Teams、復(fù)雜Skills、Tool Searchtool等能力,完成高度復(fù)雜的生產(chǎn)力任務(wù)。
基于其在真實(shí)的軟件工程、專業(yè)辦公場(chǎng)景的優(yōu)異表現(xiàn),M2.7已成為在Hermes Agent、OpenClaw等全球熱門智能體中最受歡迎的模型之一。來自海內(nèi)外開發(fā)者與企業(yè)客戶的接入需求持續(xù)增長,模型調(diào)用量快速提升。
開源當(dāng)日,華為昇騰AI基礎(chǔ)軟硬件實(shí)現(xiàn)首日適配,基于vllm-Ascend推理引擎在Atlas800A3、Atlas800IA2系列產(chǎn)品上為模型的推理部署提供全流程支持;摩爾線程技術(shù)團(tuán)隊(duì)基于MUSA架構(gòu),針對(duì)M2.7的模型特點(diǎn),完成深度調(diào)優(yōu),成功在MTTS5000上實(shí)現(xiàn)模型的高性能推理;沐曦曦云C系列GPU,憑借全棧自研的MXMACA軟件棧,首日完成深度適配,實(shí)現(xiàn)“模型發(fā)布即算力就緒”的Day0體驗(yàn)。
此外,昆侖芯依托自研架構(gòu),通過底層算子優(yōu)化與軟硬件協(xié)同加速,保障M2.7在平臺(tái)上的穩(wěn)定、高效運(yùn)行表現(xiàn)。NVIDIA推理框架TensorRT-LLM為M2.7提供了深度適配與全面優(yōu)化支持,幫助開發(fā)者和企業(yè)用戶高效完成模型部署與上線。TogetherAI、Fireworks、Ollama、vLLM、SGLang和智源眾智FlagOS、魔搭等海內(nèi)外開發(fā)平臺(tái)與社區(qū)已同步在首日接入MiniMax M2.7模型并完成適配。
在 AI 大模型和芯片領(lǐng)域,“適配”是一個(gè)關(guān)鍵的技術(shù)術(shù)語。簡單來說,它指的是讓一個(gè)軟件(在這里是 MiniMax M2.7 模型)能夠在特定的硬件(如摩爾線程、沐曦的 GPU)或軟件平臺(tái)(如英偉達(dá)的推理框架)上順利、高效地運(yùn)行起來的一整套技術(shù)工作。
“適配”具體包含哪些工作?
底層算子優(yōu)化:大模型由無數(shù)個(gè)基礎(chǔ)的數(shù)學(xué)計(jì)算(即“算子”)構(gòu)成。不同的芯片架構(gòu)(如英偉達(dá)的 CUDA、摩爾線程的 MUSA)執(zhí)行這些計(jì)算的方式和效率都不同。適配工作就是針對(duì)特定芯片的架構(gòu),對(duì)這些算子進(jìn)行重寫和優(yōu)化,讓它們跑得更快、更穩(wěn)。
推理框架集成:模型需要通過一個(gè)“中間人”——推理框架(如 vLLM、TensorRT-LLM)來調(diào)用硬件資源。適配意味著要將模型無縫集成到這些框架中,確保框架能正確、高效地指揮芯片進(jìn)行計(jì)算。
性能深度調(diào)優(yōu):這是適配的核心目標(biāo)。包括優(yōu)化顯存管理、降低計(jì)算延遲、提高吞吐量等。例如,針對(duì) MiniMax M2.7 支持超長上下文的特點(diǎn),摩爾線程就利用其 MTT S5000 的大顯存和高帶寬進(jìn)行了專門優(yōu)化,以支撐模型長時(shí)間、多步驟的穩(wěn)定執(zhí)行。
為什么“Day 0 適配”如此重要?
這次 MiniMax M2.7 開源能獲得“Day 0 適配”(即發(fā)布當(dāng)天完成適配),具有非常重要的意義:
對(duì)開發(fā)者而言:意味著“開箱即用”。開發(fā)者無需自己花費(fèi)大量時(shí)間和精力去解決兼容性問題,可以在模型發(fā)布的第一時(shí)間就上手使用,極大地加速了應(yīng)用開發(fā)和創(chuàng)新的進(jìn)程。
對(duì)芯片廠商而言:這是展示其技術(shù)實(shí)力和生態(tài)成熟度的絕佳機(jī)會(huì)。能夠快速適配最前沿的大模型,證明了其硬件和軟件棧的競爭力與兼容性,有助于吸引更多開發(fā)者和企業(yè)客戶。
對(duì) MiniMax 而言:廣泛的硬件支持意味著其模型可以觸達(dá)更廣泛的用戶群體,不再受限于單一硬件平臺(tái),從而加速其技術(shù)的商業(yè)落地和生態(tài)建設(shè)。
總而言之,“適配”是連接 AI 模型與算力的橋梁。這次 MiniMax M2.7 與多家國產(chǎn)及海外芯片廠商在首日就完成適配,不僅體現(xiàn)了模型本身的開放性和重要性,也反映了國產(chǎn) AI 芯片生態(tài)正在快速成熟,能夠跟上全球最先進(jìn)模型的發(fā)展步伐。
-
摩爾線程
+關(guān)注
關(guān)注
2文章
289瀏覽量
6668 -
沐曦
+關(guān)注
關(guān)注
1文章
103瀏覽量
1883
發(fā)布評(píng)論請(qǐng)先 登錄
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配小米MiMo-V2.5-Pro模型
沐曦股份Day 0適配DeepSeek-V4-Flash模型
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配騰訊混元Hy3 preview語言模型
沐曦股份Day 0適配阿里千問Qwen3.6-35B-A3B大模型
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配百度文心ERNIE-Image文生圖模型
天數(shù)智芯Day 0適配MiniMax最新開源M2.7大模型
昆侖芯科技完成MiniMax M2.7模型極速適配
Day-0支持|摩爾線程率先完成MiniMax M2.7大模型適配
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配智譜GLM-5.1旗艦?zāi)P?/a>
沐曦曦云C500/C550 GPU產(chǎn)品深度適配MiniMax M2.5模型
Day-0支持|摩爾線程完成MiniMax M2.5模型極速適配
沐曦曦云C600 GPU產(chǎn)品適配階躍星辰基座模型Step 3.5 Flash
沐曦股份曦云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型
MiniMax M2.7全球開源,摩爾線程、沐曦等完成Day0適配
評(píng)論