4月27日,沐曦股份面向沐曦GPU的TileLang適配支持與優(yōu)化項(xiàng)目TileLang-Metax正式成為TileAI社區(qū)官方主線版本,代碼已開源并托管于TileAI組織之下,與TileLang生態(tài)中的相關(guān)項(xiàng)目協(xié)同向開發(fā)者全面開放。
大模型時(shí)代呼喚芯片、編譯器、框架與算子庫的全棧協(xié)同創(chuàng)新。高性能算子(Kernel)是連接模型算法與底層硬件能力的重要橋梁,也是釋放GPU算力價(jià)值的核心環(huán)節(jié)。
TileLang-Metax作為TileAI社區(qū)生態(tài)的重要組成部分,將持續(xù)面向更廣泛的開發(fā)者、研究者和生態(tài)伙伴演進(jìn)迭代;沐曦GPU對(duì)TileLang生態(tài)的適配支持,也由此正式進(jìn)入持續(xù)迭代、社區(qū)共建的全新階段。
面向沐曦GPU的TileLang深度優(yōu)化
隨著大模型技術(shù)高速發(fā)展,訓(xùn)練與推理場(chǎng)景對(duì)底層算子的性能、開發(fā)效率和跨平臺(tái)適配能力提出了更高要求。如何讓開發(fā)者更便捷地在不同AI加速硬件上編寫、遷移和優(yōu)化高性能算子,已成為AI基礎(chǔ)軟件生態(tài)建設(shè)的關(guān)鍵課題。
TileLang是專為高性能算子開發(fā)設(shè)計(jì)的編程語言與工具體系,旨在幫助開發(fā)者以更高層、更易用的方式描述底層計(jì)算邏輯,同時(shí)兼顧高性能算子的優(yōu)化需求。在大模型訓(xùn)練與推理中,算子性能直接影響端到端效率;而算子開發(fā)往往要求開發(fā)者深入理解硬件架構(gòu)、內(nèi)存層級(jí)、并行策略和編譯優(yōu)化,門檻較高。
圍繞這一目標(biāo),沐曦股份持續(xù)推進(jìn)沐曦GPU在編譯器、算子庫、AI框架、推理引擎和開源工具鏈中的適配與優(yōu)化。
TileLang-Metax在沐曦GPU上的支持已覆蓋多個(gè)關(guān)鍵方向,包括編譯適配、運(yùn)行時(shí)支持、示例適配、優(yōu)化特性與高性能算子實(shí)現(xiàn)。通過該項(xiàng)目,沐曦股份希望進(jìn)一步降低開發(fā)者在沐曦GPU上進(jìn)行底層算子開發(fā)的門檻。無論是模型開發(fā)者、框架開發(fā)者,還是專注底層性能優(yōu)化的系統(tǒng)工程師,均可借助TileLang-Metax探索沐曦GPU上的更多優(yōu)化可能。
目前,TileLang-Metax已對(duì)多個(gè)重要開源項(xiàng)目和算子場(chǎng)景提供支持,具體包括:
TileLang examples: 覆蓋開發(fā)者學(xué)習(xí)、驗(yàn)證和擴(kuò)展TileLang 算子的典型示例場(chǎng)景,是了解TileLang編程模型、算子實(shí)現(xiàn)方式與性能優(yōu)化路徑的重要入口。
TileOPs: 面向大模型訓(xùn)練與推理的TileLang算子生態(tài)項(xiàng)目。借助TileLang-Metax,沐曦GPU可更深度地參與TileOPs中相關(guān)算子的開發(fā)、驗(yàn)證與優(yōu)化。
TileKernels: 由DeepSeek開源的高性能算子項(xiàng)目。TileLang-Metax對(duì)相關(guān)TileLang 算子的適配支持,將有力推動(dòng)高性能算子在國產(chǎn)GPU平臺(tái)上的進(jìn)一步驗(yàn)證與優(yōu)化。
SGLang/vLLM等主流推理框架中的相關(guān)TileLang kernel: 面向大模型推理框架中的關(guān)鍵算子場(chǎng)景,TileLang-Metax已提供相應(yīng)支持,為沐曦GPU在主流大模型推理生態(tài)中的適配與性能優(yōu)化奠定基礎(chǔ)。
上述支持不僅標(biāo)志著沐曦GPU在TileLang生態(tài)中的適配范圍持續(xù)擴(kuò)大,也代表著國產(chǎn)GPU正在以更深入的方式參與開源AI基礎(chǔ)軟件生態(tài)建設(shè)。
開源共建,推動(dòng)國產(chǎn)AI算力生態(tài)繁榮
開源項(xiàng)目的生命力,不僅來自一次性適配,更源于長期維護(hù)、持續(xù)演進(jìn)以及與社區(qū)主線的緊密協(xié)同。TileLang生態(tài)正處于快速發(fā)展階段,社區(qū)主線代碼持續(xù)迭代,新功能、新接口、新優(yōu)化策略與算子實(shí)踐不斷涌現(xiàn)。
為確保沐曦GPU對(duì)TileLang生態(tài)的支持始終保持最新狀態(tài),沐曦股份在TileLang-Metax中建立了與社區(qū)主線代碼的持續(xù)同步機(jī)制,實(shí)現(xiàn)與TileLang社區(qū)主線的周級(jí)同步。這意味著開發(fā)者可以更及時(shí)地獲取上游社區(qū)的新特性、新優(yōu)化和新算子能力,并在沐曦GPU上快速驗(yàn)證和適配社區(qū)最新進(jìn)展。
此次將TileLang-Metax開源并入駐TileAI社區(qū),是沐曦股份踐行開放協(xié)作理念的重要一步。沐曦股份將以社區(qū)共建的方式,攜手TileAI、DeepSeek、SGLang、vLLM等開源生態(tài)伙伴及廣大開發(fā)者,持續(xù)完善沐曦GPU在TileLang生態(tài)中的支持能力。
相關(guān)開源項(xiàng)目鏈接
TileAI TileLang官方倉庫:
https://github.com/tile-ai/tilelang
TileLang-Metax:
https://github.com/tile-ai/tilelang-metax
TileAI TileOPs官方倉庫:
https://github.com/tile-ai/TileOPs
TileOPs-Metax:
https://github.com/MetaX-MACA/TileOps-Metax
DeepSeek TileKernels官方倉庫:
https://github.com/deepseek-ai/TileKernels
TileKernels-Metax:
https://github.com/MetaX-MACA/TileKernels-Metax
關(guān)于沐曦股份
沐曦股份致力于自主研發(fā)全棧高性能GPU芯片及計(jì)算平臺(tái),為智算、通用計(jì)算、云渲染等前沿領(lǐng)域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟(jì)發(fā)展。
-
gpu
+關(guān)注
關(guān)注
28文章
5283瀏覽量
136099 -
開源
+關(guān)注
關(guān)注
3文章
4368瀏覽量
46464 -
沐曦
+關(guān)注
關(guān)注
1文章
103瀏覽量
1884
原文標(biāo)題:沐曦股份開源TileLang-Metax,攜手TileAI社區(qū)共建國產(chǎn)GPU高性能算子生態(tài)
文章出處:【微信號(hào):沐曦MetaX,微信公眾號(hào):沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
沐曦股份Day 0適配DeepSeek-V4-Flash模型
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配騰訊混元Hy3 preview語言模型
沐曦股份與上海聯(lián)通正式簽署戰(zhàn)略合作協(xié)議
沐曦股份Day 0適配阿里千問Qwen3.6-35B-A3B大模型
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配MiniMax M2.7模型
沐曦股份全面入駐國家教育開源平臺(tái)啟悟?qū)W習(xí)社區(qū)
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配智譜GLM-5.1旗艦?zāi)P?/a>
沐曦股份與百度飛槳黑客松硬核賽題來襲
沐曦股份北京AI研究院暨企業(yè)開源中心正式揭牌啟動(dòng)
沐曦股份GPU產(chǎn)品正式接入華佗開源生態(tài)
沐曦股份CXO預(yù)科班2026冬令營圓滿收官
沐曦股份曦云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型
沐曦股份攜手紅帽共同發(fā)布MXAIE解決方案
DLInfer聯(lián)手沐曦股份實(shí)現(xiàn)數(shù)據(jù)生成場(chǎng)景的實(shí)際落地
沐曦曦云C系列產(chǎn)品已支持TileLang
沐曦股份開源TileLang-Metax并入駐TileAI社區(qū)
評(píng)論