4月23日,騰訊混元團(tuán)隊(duì)正式發(fā)布并開源Hy3 preview語(yǔ)言模型。沐曦股份旗下曦云 C 系列 GPU已完成Day 0適配,為率先支持該模型的國(guó)產(chǎn)算力。
此次針對(duì)Hy3 preview的極速適配,核心依托于沐曦自研MXMACA 軟件棧的卓越兼容性與深度優(yōu)化能力。作為沐曦 “自主 GPGPU 硬件 + 全棧軟件體系” 的核心樞紐,MXMACA軟件棧承擔(dān)著連接底層算力硬件與上層 AI 應(yīng)用生態(tài)的關(guān)鍵紐帶作用。它不僅全鏈路覆蓋底層驅(qū)動(dòng)、用戶態(tài)接口、MXCC 編譯器、算子深度適配、主流訓(xùn)練 / 推理框架對(duì)接及行業(yè)場(chǎng)景專項(xiàng)優(yōu)化,已實(shí)現(xiàn)對(duì)6000+ 國(guó)際主流應(yīng)用、1000+ AI 模型的原生兼容,可將傳統(tǒng)模型適配周期從數(shù)周壓縮至小時(shí)級(jí),為沐曦國(guó)產(chǎn)GPU快速落地、算力賦能千行百業(yè)打下了堅(jiān)實(shí)基礎(chǔ)。
截至目前,沐曦股份已經(jīng)極速適配業(yè)內(nèi)頂尖模型達(dá)18個(gè),全面覆蓋 MiniMax、智譜、阿里千問 、階躍星辰、百度等頭部廠商最新旗艦?zāi)P?,品類涵蓋語(yǔ)言、多模態(tài)、OCR、文生圖、3D 生成等全領(lǐng)域。在國(guó)產(chǎn) GPU Day 0 適配賽道,沐曦股份持續(xù)領(lǐng)跑行業(yè),以 “硬件算力 + 軟件生態(tài)” 的全棧技術(shù)實(shí)力,為國(guó)產(chǎn)大模型快速迭代與商業(yè)化落地筑牢堅(jiān)實(shí)的算力底座。
未來(lái),沐曦股份將持續(xù)深化與騰訊混元等國(guó)內(nèi)頂尖 AI 團(tuán)隊(duì)的技術(shù)協(xié)同,依托沐曦自研高性能GPU 與 MXMACA 軟件棧的軟硬協(xié)同優(yōu)勢(shì),加速覆蓋更多前沿大模型與創(chuàng)新應(yīng)用場(chǎng)景,全力構(gòu)建自主可控、高效繁榮的國(guó)產(chǎn) AI 算力生態(tài)。
關(guān)于Hy3 preview
Hy3 preview 語(yǔ)言模型是一個(gè)快慢思考融合的混合專家模型,總參數(shù) 295B,激活參數(shù) 21B,最大支持 256K 上下文長(zhǎng)度。這是混元重建后訓(xùn)練的第一個(gè)模型,也是混元迄今最智能的模型,在復(fù)雜推理、指令遵循、上下文學(xué)習(xí)、代碼、智能體等能力及推理性能上實(shí)現(xiàn)了大幅的提升。
多個(gè)測(cè)評(píng)結(jié)果顯示,Hy3 preview 模型能力全面提升。
1出色的上下文學(xué)習(xí)和指令遵循能力
在各種真實(shí)的生產(chǎn)與生活場(chǎng)景,理解雜亂冗長(zhǎng)的上下文并遵從復(fù)雜多變的規(guī)則是模型的首要挑戰(zhàn)?;隍v訊業(yè)務(wù)場(chǎng)景的靈感,騰訊混元提出了 CL-bench和 CL-bench-Life 來(lái)創(chuàng)新性地評(píng)估模型的上下文學(xué)習(xí)能力,并在 Hy3 preview 顯著地提升了模型上下文學(xué)習(xí)和指令遵循能力。

2復(fù)雜推理能力突出,清華數(shù)學(xué)博士資格考試國(guó)內(nèi)分?jǐn)?shù)最高
復(fù)雜推理能力是模型解決各種問題的基礎(chǔ)。Hy3 preview 在 FrontierScience-Olympiad、IMOAnswerBench 等高難度理工科推理任務(wù)中表現(xiàn)突出,并在最新的清華大學(xué)求真書院數(shù)學(xué)博資考(26春) 和 全國(guó)中學(xué)生生物學(xué)聯(lián)賽(CHSBO 2025) 中取得優(yōu)異成績(jī),展現(xiàn)了可泛化的強(qiáng)推理能力。

3代碼與智能體提升最為顯著,展現(xiàn)出高性價(jià)比
代碼和智能體是 Hy3 preview 提升最為顯著的方向。得益于預(yù)訓(xùn)練及強(qiáng)化學(xué)習(xí)框架的重建和強(qiáng)化學(xué)習(xí)任務(wù)規(guī)模的提升,騰訊混元以較快的速度在 SWE-Bench Verified、Terminal-Bench 2.0 等主流代碼智能體基準(zhǔn)以及 BrowseComp、WideSearch 等主流搜索智能體基準(zhǔn)中取得了有競(jìng)爭(zhēng)力的結(jié)果。

除了公開榜單,騰訊混元還進(jìn)一步構(gòu)建了多個(gè)內(nèi)部的評(píng)測(cè)集,對(duì)模型在真實(shí)開發(fā)場(chǎng)景中的表現(xiàn)進(jìn)行評(píng)估。結(jié)果表明,無(wú)論是在后端工程任務(wù)集 Hy-Backend,貼近真實(shí)用戶開發(fā)交互的 Hy-Vibe Bench,還是高難度軟件工程開發(fā)任務(wù)集 Hy-SWE Max 上,Hy3 preview 均體現(xiàn)出了強(qiáng)競(jìng)爭(zhēng)力。

比較各個(gè)開源模型的大小與智能體綜合表現(xiàn),Hy3 preview 展現(xiàn)出高性價(jià)比。
? 
Hy3 preview訪問:
目前,Hy3 preview 已在騰訊云、元寶、ima、CodeBuddy、WorkBuddy、QQ、QQ瀏覽器、騰訊文檔、騰訊樂享等首發(fā)上線,微信公眾號(hào)、和平精英、騰訊新聞、騰訊自選股、騰訊客服、微信讀書等多個(gè)主線產(chǎn)品也在陸續(xù)上線。另外,Hy3 preview 支持接入流行的開源智能體產(chǎn)品,如 OpenClaw、OpenCode、KiloCode 等,并已上架騰訊云大模型服務(wù)平臺(tái) TokenHub。
開發(fā)者可訪問以下鏈接體驗(yàn):
沐曦開發(fā)者社區(qū):developer.metax-tech.com
沐曦量化模型鏡像下載(即將上線):
www.modelscope.cn/organization/metax-tech
關(guān)于沐曦股份
沐曦股份致力于自主研發(fā)全棧高性能GPU芯片及計(jì)算平臺(tái),為智算、通用計(jì)算、云渲染等前沿領(lǐng)域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟(jì)發(fā)展。
-
gpu
+關(guān)注
關(guān)注
28文章
5283瀏覽量
136094 -
算力
+關(guān)注
關(guān)注
2文章
1697瀏覽量
16838 -
沐曦
+關(guān)注
關(guān)注
1文章
103瀏覽量
1883
原文標(biāo)題:沐曦股份曦云C系列GPU Day 0 適配騰訊混元Hy3 preview
文章出處:【微信號(hào):沐曦MetaX,微信公眾號(hào):沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配小米MiMo-V2.5-Pro模型
沐曦股份Day 0適配DeepSeek-V4-Flash模型
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配百度文心ERNIE-Image文生圖模型
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配智譜GLM-5.1旗艦模型
沐曦股份曦云C系列GPU全面適配通義千問Qwen3.5三款新模型
沐曦股份曦云C系列GPU深度適配通義千問Qwen3.5模型
沐曦曦云C500/C550 GPU產(chǎn)品適配智譜GLM-OCR模型
沐曦曦云C500/C550 GPU產(chǎn)品適配騰訊混元圖像3.0圖生圖模型
沐曦曦云C500/C550 GPU產(chǎn)品適配騰訊混元開源翻譯模型1.5版本
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配騰訊混元Hy3 preview語(yǔ)言模型
評(píng)論