(電子發(fā)燒友網(wǎng)報道 文/ 章鷹)12月17日,2025小米人車家全生態(tài)合作伙伴大會舉行,小米MiMo大模型負(fù)責(zé)人羅福莉首次登場,她解讀小米最新開源大模型MiMo-V2-Flash,拋出“全球開源模型Top2”“推理成本僅為標(biāo)桿模型2.5%”等重磅信息。

截至2025年12月19日,小米發(fā)布的 MiMo-V2-Flash、深度求索(DeepSeek)的 DeepSeek-V3.2,以及阿里巴巴的 Qwen-3均為當(dāng)前國產(chǎn)大模型中的代表性產(chǎn)品。在與DeepSeek V3.2、千問Qwen-3對比當(dāng)中,小米開源大模型到底有哪些優(yōu)勢和應(yīng)用價值?本文進(jìn)行詳細(xì)分析。
全球開源模型Top2,主打超絕性價比
MiMo-V2-Flash是小米全新一代面向Agent的基座模型,總參數(shù)309B,激活參數(shù)15B,支持256k上下文窗口,整體針對推理、編碼和Agent場景構(gòu)建,支持混合思維模式,允許用戶切換“思考”和即時回答模式。

目前,MiMo-V2-Flash推理吞吐速度為每秒150個token,成本定價0.7元/每百萬輸入token,2.1元/每百萬輸出token,主打超絕性價比。
在架構(gòu)設(shè)計上,小米MiMo-V2-Flash采用了混合注意力機(jī)制。其混合模塊設(shè)計包含8個混合塊,其中每5個滑動窗口注意力(SWA)層對應(yīng)1個全局注意力層。在上下文支持能力上,該模型原生支持32K的訓(xùn)練,并且能夠擴(kuò)展到256K的上下文支持。
從性能表現(xiàn)來看,小米MiMo-V2-Flash在通用基準(zhǔn)測試中,與DeepSeek-V3.2不相上下,同時延遲大幅降低。在SWE-Bench驗證和多語言集中分別取得了73.4%和71.7%的成績。尤為突出的是其速度優(yōu)勢,在Day-0時,輸出速度高達(dá)每秒150個token,這一速度在同類模型中處于領(lǐng)先地位。

圖來自小米官方微信
在多個Agent測評基準(zhǔn)上,MiMo-V2-Flash進(jìn)入全球開源模型Top 2;編碼能力超過所有開源模型,比肩標(biāo)桿閉源模型Claude 4.5 Sonnet,但推理成本僅為其2.5%,生成速度提升2倍。
小米MiMo-V2-Flash推理效率高,來源兩大創(chuàng)新
羅福莉指出,我們要圍繞極致的推理效率去重新設(shè)計模型結(jié)構(gòu)。模型結(jié)構(gòu)主要源自兩大創(chuàng)新:一、模型注意力機(jī)制采用了Hybrid Sliding Window Attention(Hybrid SWA/混合滑動窗口注意力機(jī)制),其中SWA與Full Attention(全局注意力機(jī)制)的比例是5:1,滑動窗口只看 128 個 token。相較于一些復(fù)雜的Linear Attention(線性注意力機(jī)制),SWA在兼顧長短文的推理、知識檢索等方面更勝一籌。
二是在于MTP(Multi-Token Prediction)。羅福莉表示,團(tuán)隊在訓(xùn)練時加入了一層MTP層以提高基座模型能力,并在微調(diào)時也加入了更多MTP層,最終在推理時加入了3層MTP,以加速并行token驗證的方式實現(xiàn)了2-2.6倍推理速度的提升。
還有,為了提高強(qiáng)化學(xué)習(xí)訓(xùn)練的穩(wěn)定性,MiMo團(tuán)隊提出了一種叫做Multi-Teacher On-Policy Distillation(MOPD)的后訓(xùn)練范式。相較于傳統(tǒng)SFT+RL(微調(diào)+強(qiáng)化學(xué)習(xí))的后訓(xùn)練方式,它可以提供稠密的token level監(jiān)督學(xué)習(xí)信號,以簡單快速的方式獲得各個專家模型的能力。
此外,小米并推出線上AI聊天服務(wù)“Xiaomi MiMO Studio”,用戶可在其中體驗“MiMo-V2-Flash”。
羅福莉在社交平臺上透露了更多信息,MiMo-V2-Flash 已正式上線。這只是我們 AGI 路線圖上的第二步。
小米發(fā)布MiMo-V2-Flash,不僅僅是一次大模型領(lǐng)域的技術(shù)創(chuàng)新,更是其“人車家全生態(tài)”戰(zhàn)略的關(guān)鍵支點。該模型通過多項架構(gòu)創(chuàng)新與成本優(yōu)化,為 AI智能體(AI Agent)在終端設(shè)備上的落地提供了前所未有的賦能能力。
我們認(rèn)為,MiMo-V2-Flash 不只是“一個更快的大模型”,而是小米打造 “終端原生智能體操作系統(tǒng)” 的基石。它有機(jī)會讓每一臺小米設(shè)備都可能成為一個 有記憶、會思考、能行動的智能體節(jié)點,最終助力實現(xiàn)雷軍所說的“AI for All Devices, All the Time”。
本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請注明以上來源。微信號zy1052625525。需入群交流,請?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請發(fā)郵箱zhangying@huaqiu.com。
-
小米
+關(guān)注
關(guān)注
70文章
14551瀏覽量
152621
發(fā)布評論請先 登錄
華為云首發(fā)適配DeepSeek-V4模型
天數(shù)智芯Day 0適配MiniMax最新開源M2.7大模型
基于國科微 GK7206V1 芯片:視美泰“ AOV + 普惠黑光 + AI大模型”IPC 產(chǎn)品矩陣解決方案發(fā)布
NVIDIA推出代理式AI藍(lán)圖與電信推理模型
OrangePi RV2 深度技術(shù)評測:RISC-V AI融合架構(gòu)的先行者
華為昇騰深度適配智譜AI全新開源模型GLM-5
使用NORDIC AI的好處
今日看點:小米正式發(fā)布并開源新模型 MiMo-V2-Flash;磷酸鐵鋰開啟漲價潮
NVIDIA推出面向語言、機(jī)器人和生物學(xué)的全新開源AI技術(shù)
澎峰科技完成OpenAI最新開源推理模型適配
Arm率先適配騰訊混元開源模型,助力端側(cè)AI創(chuàng)新開發(fā)
0.7元/百萬token碾壓競品! 小米新開源大模型,卷出AI普惠關(guān)鍵密碼
評論