阿里巴巴千問模型團(tuán)隊(duì)最新宣布,開源旗下多模態(tài)“智能體小鋼炮” Qwen3.6-35B-A3B模型。沐曦股份與FlagOS合作,完成了該模型的Day0 適配。經(jīng)測試,基于沐曦芯片,實(shí)現(xiàn)了“零代碼修改”完成 Qwen3.6-35B-A3B 的推理部署及充分驗(yàn)證。這充分展示出了沐曦股份軟硬件協(xié)同的兼容優(yōu)勢與生態(tài)合作的協(xié)同作用。
Qwen3.6-35B-A3B是一個完全開源的稀疏 MoE(混合專家)模型,主打輕量高效。模型總參數(shù)量為350億, 激活參數(shù)只有30億。據(jù)模型研發(fā)團(tuán)隊(duì)介紹,Qwen3.6-35B-A3B在智能體編程方面表現(xiàn)卓越,大幅超越前代Qwen3.5-35B-A3B,并可與Qwen3.5-27B、Gemma4-31B等稠密模型一較高下。主要特性包括:
卓越的智能體編程能力,可與大得多的模型相媲美
強(qiáng)大的多模態(tài)感知與推理能力

沐曦股份此次與FlagOS合作實(shí)現(xiàn)Day0適配,主要依靠四項(xiàng)關(guān)鍵技術(shù)支撐:
FlagOS 為 vLLM 推理框架打造的專屬插件vLLM-plugin-FL。插件可以在完全不改變 vLLM 原生接口與用戶使用習(xí)慣的前提下,實(shí)現(xiàn)Qwen3.6-35B-A3B的多芯片推理部署。
高性能通用大模型算子庫FlagGems,核心算子深度適配,釋放硬件算力。
統(tǒng)一的AI 編譯器 FlagTree,實(shí)現(xiàn)一次編寫,多芯編譯。
模型跨芯遷移發(fā)布工具 FlagRelease:半自動實(shí)現(xiàn)模型跨芯遷移與版本發(fā)布。
目前,F(xiàn)lagOS已經(jīng)完成針對Qwen3.6-35B-A3B開源模型的多芯適配、精度對齊與部署驗(yàn)證,開發(fā)者可直接獲取對應(yīng)芯片的開箱即用方案。
依托“自研GPU硬件+MXMACA軟件?!钡能浻惨惑w核心優(yōu)勢,沐曦股份快速響應(yīng)大模型迭代節(jié)奏,高效完成了多款主流模型的適配工作。近一段時間來,公司已累計(jì)完成Day 0適配模型超16個,全面覆蓋MiniMax、智譜、阿里千問、階躍星辰、百度飛槳等頭部廠商的最新旗艦?zāi)P?,涵蓋語言、多模態(tài)、OCR等全品類,在國產(chǎn)GPU Day 0適配賽道持續(xù)保持行業(yè)領(lǐng)先地位,以全棧技術(shù)實(shí)力為大模型快速落地筑牢算力支撐。
沐曦股份未來將繼續(xù)與FlagOS深度合作,以Day 0適配為標(biāo)準(zhǔn),實(shí)現(xiàn)大模型“發(fā)布即落地”,共同打造從底層算力到上層應(yīng)用的無縫銜接生態(tài),加速AI技術(shù)在千行百業(yè)的規(guī)?;渴?,共建自主可控的智能計(jì)算新底座。
雙方合作的模型適配版本鏈接見下,歡迎體驗(yàn)!
魔搭平臺:
https://modelscope.cn/models/FlagRelease/Qwen3.6-35B-A3B-nomtp-metax-FlagOS
HuggingFace:
https://huggingface.co/FlagRelease/Qwen3.6-35B-A3B-nomtp-metax-FlagOS
關(guān)于沐曦股份
沐曦股份致力于自主研發(fā)全棧高性能GPU芯片及計(jì)算平臺,為智算、通用計(jì)算、云渲染等前沿領(lǐng)域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟(jì)發(fā)展。
-
阿里
+關(guān)注
關(guān)注
6文章
468瀏覽量
34239 -
沐曦
+關(guān)注
關(guān)注
1文章
103瀏覽量
1883 -
大模型
+關(guān)注
關(guān)注
2文章
3796瀏覽量
5276
原文標(biāo)題:沐曦股份Day0適配阿里千問Qwen3.6-35B-A3B,與FlagOS合作實(shí)現(xiàn)模型多芯部署
文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配小米MiMo-V2.5-Pro模型
沐曦股份Day 0適配DeepSeek-V4-Flash模型
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配騰訊混元Hy3 preview語言模型
海光信息DCU平臺適配阿里通義Qwen3.6-35B-A3B大模型
登臨科技KS系列GPU產(chǎn)品深度適配阿里千問Qwen3.6大模型
壁仞科技光速支持阿里Qwen3.6-35B-A3B大模型
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配百度文心ERNIE-Image文生圖模型
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配智譜GLM-5.1旗艦模型
沐曦股份曦云C系列GPU全面適配通義千問Qwen3.5三款新模型
沐曦股份曦云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型
阿里通義千問發(fā)布小尺寸模型Qwen3-4B,手機(jī)也能跑
沐曦股份Day 0適配阿里千問Qwen3.6-35B-A3B大模型
評論