日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

擁抱DeepSeek開源生態(tài)| 算能TPU接入TileLang,集結(jié)北大復(fù)旦山大頂尖團(tuán)隊(duì)!

算能開發(fā)者社區(qū) ? 2025-10-03 19:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,DeepSeek V3.2-Exp 上線,官宣支持國(guó)產(chǎn)AI算子編程語(yǔ)言TileLang 并發(fā)布了針對(duì) V3.2 的算子示例,這意味著支持“同一語(yǔ)義、跨多后端”的TileLang得到了權(quán)威認(rèn)可,基于算能TPU的TileLang-TPU項(xiàng)目也于近日完成工程驗(yàn)證。

TileLang 發(fā)布之初,算能聯(lián)合北京大學(xué)、復(fù)旦大學(xué)、山東大學(xué)等高校的科研團(tuán)隊(duì),共同開展TileLang接入算能TPU的工作,目前已在BM1684X 、SC11等智算平臺(tái)上完成了主流大模型算子的工程驗(yàn)證。

算能SC11 FP300單卡集成256GB LPDDR5X高帶寬內(nèi)存,內(nèi)置原生FP8算力單元,板載高達(dá)1.1TB/s的內(nèi)存帶寬,配合PCIe Gen5主機(jī)接口及256GB/s的卡間高速互聯(lián),有效應(yīng)對(duì)大模型參數(shù)存儲(chǔ)與計(jì)算需求,DeepSeek V3滿血版在4卡SC11上吞吐超過(guò)600tokens/s。


Tile Language (TileLang) 是一種簡(jiǎn)潔的領(lǐng)域?qū)S谜Z(yǔ)言,也是一款開源的 AI 算子編程語(yǔ)言,TileLang 對(duì)接算能TPU擴(kuò)展的工作由北大碩士生解文浩、博士生任天行作為主要負(fù)責(zé)人牽頭開發(fā),山大、復(fù)旦的研發(fā)團(tuán)隊(duì)也參與了算子開發(fā)、大模型接入TPU的工作,一并表示感謝。4e96f3dc-a049-11f0-8ce9-92fbcf53809c.png

全棧貫通|從可行性到工程閉環(huán)

TileLang能夠?qū)⒏呒?jí)別的數(shù)據(jù)流描述,自動(dòng)轉(zhuǎn)換并優(yōu)化為高效的底層代碼(如CUDA或TPU kernel)。通過(guò)獨(dú)特的Tile級(jí)抽象和自動(dòng)調(diào)度能力,開發(fā)者可以用更簡(jiǎn)潔的代碼表達(dá)復(fù)雜計(jì)算,快速為自己的算法開發(fā)一個(gè)接近峰值性能的算子,顯著提升算子開發(fā)效率。

TileLang-TPU適配路徑以“少驚擾、強(qiáng)約束”為原則:前端僅描述 tile 級(jí)計(jì)算邏輯與數(shù)據(jù)流,不引入設(shè)備細(xì)節(jié);中間以穩(wěn)定的 Tile-IR 承接形狀推斷、布局決定與算子融合;后端生成面向算能 TPU 的 device 側(cè) C 代碼與指令序列,并與 PPL 的內(nèi)核注冊(cè)、調(diào)度與運(yùn)行時(shí)貫通。

4ea1d662-a049-11f0-8ce9-92fbcf53809c.png

該路徑已在典型大模型算子上跑通,涵蓋常見的 GEMM、歸一化與位置相關(guān)變換等,完成從算子表達(dá)、代碼生成、到 hostdevice 數(shù)據(jù)搬運(yùn)和執(zhí)行的全鏈路打通。由此,TileLang 的一次建模、多后端復(fù)用能力在國(guó)產(chǎn) TPU 場(chǎng)景獲得驗(yàn)證,為后續(xù)開源與規(guī)?;桓兜於嘶A(chǔ)。

極致簡(jiǎn)潔|三步實(shí)現(xiàn) TPU后端支持

TileLang-TPU的核心工作聚焦三點(diǎn):前端原語(yǔ)擴(kuò)展。于 TileLang/language/customize.py 增補(bǔ)自定義 tile op 接口,使 GEMM、RMSNorm、RoPE、SwiGLU 等算子可以以更貼近數(shù)學(xué)定義的方式表達(dá),并在 Tile-IR 層明確迭代空間、數(shù)據(jù)復(fù)用與流水線切分,減少手寫索引與 bank 沖突的偶然性。

4eb2f988-a049-11f0-8ce9-92fbcf53809c.png

代碼生成映射。于 src/target/codegen_ppl.cc 完成原語(yǔ)到算能 TPU 專用執(zhí)行單元的映射,將GEMM 一類算子對(duì)齊到 BDC 的矩陣乘路徑(如 tpu_bdc_fp_mm.v 等),同時(shí)根據(jù)設(shè)備層級(jí)內(nèi)存模型生成指令序列與局部緩存策略,確保計(jì)算與搬運(yùn)(GDMA)管線化協(xié)同。以matmul在BM1684x上的計(jì)算為例,使用TileLang撰寫的算子跟PPL手寫算子性能持平,代碼更加簡(jiǎn)潔。

4ebe3be0-a049-11f0-8ce9-92fbcf53809c.png

運(yùn)行棧整合。生成的 device 側(cè) C 代碼與元信息并入 PPL 體系,完成 kernel 注冊(cè)、調(diào)度入口與形參綁定,保證 host 側(cè)裝載、形狀檢查、dtype/stride 處理與 device 側(cè)執(zhí)行一致;必要時(shí)補(bǔ)充 tiling 規(guī)則與長(zhǎng)短軸對(duì)齊策略,以兼顧大shape與批處理場(chǎng)景。當(dāng)前已實(shí)現(xiàn)TileLang 前端 → PPL/TPU 設(shè)備端 C → PPL 運(yùn)行期可執(zhí)行的完整鏈路,關(guān)鍵算子具備可對(duì)齊的性能基線與可定位的優(yōu)化,便于后續(xù)按模型族進(jìn)行系統(tǒng)化補(bǔ)全與壓測(cè)。

持續(xù)開源 | 一次改寫多處復(fù)用

TileLang開源的價(jià)值不止于“又多了一個(gè)后端”,更在于“少了成倍的重復(fù)移植”。在國(guó)產(chǎn)芯片生態(tài)日益多樣化的現(xiàn)實(shí)下,統(tǒng)一的 tile 級(jí)前端抽象能把算子資產(chǎn)沉淀在可組合、可驗(yàn)證的語(yǔ)義層;遷移到新后端時(shí),僅需圍繞 CodeGen 與 runtime 這條窄口補(bǔ)齊映射與 ABI,可繼承既有的表達(dá)、調(diào)度與測(cè)試體系。

這種“前端統(tǒng)一、后端定制”的方式,有機(jī)會(huì)在工程維度緩解國(guó)產(chǎn)芯片的碎片化,讓差異化架構(gòu)以最小成本共享同一套高質(zhì)量算子實(shí)現(xiàn)與基準(zhǔn)。后續(xù)開發(fā)團(tuán)隊(duì)將優(yōu)先確保DeepSeek等主流模型鏈路的端到端可用,再面向長(zhǎng)尾算子逐步補(bǔ)全,并在流水線深度、訪存回填、緩存復(fù)用等細(xì)節(jié)上持續(xù)優(yōu)化最佳實(shí)踐。

TileLang-TPU 正在做開源前的代碼清理與文檔化的工作,它的意義并不在于“多了一個(gè)后端”,而在于“少了很多重復(fù)”,當(dāng)同一套算子前端可以映射到更多芯片時(shí),碎片化就不再是阻力,而會(huì)成為競(jìng)爭(zhēng)力,讓不同架構(gòu)以各自所長(zhǎng)服務(wù)更大的模型與更廣的場(chǎng)景,而不是把資源消耗在移植與改寫上。

再次感謝來(lái)自北大、復(fù)旦、山大等高校的研發(fā)團(tuán)隊(duì)在TileLang-TPU上所做的前瞻性工作,后續(xù)的開源倉(cāng)庫(kù)將附帶清晰的示例與文檔,支持以標(biāo)準(zhǔn)化方式擴(kuò)展原語(yǔ)、以嚴(yán)謹(jǐn)?shù)墓こ虡?biāo)準(zhǔn)實(shí)現(xiàn)“一次改寫、多平臺(tái)復(fù)用”的目標(biāo)。TileLang-TPU的成功驗(yàn)證,將進(jìn)一步加深算能與高校、開源社區(qū)的合作深度,為完善國(guó)產(chǎn)芯片軟件棧打造一個(gè)經(jīng)典范式。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41315

    瀏覽量

    302691
  • TPU
    TPU
    +關(guān)注

    關(guān)注

    0

    文章

    173

    瀏覽量

    21721
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    855

    瀏覽量

    3413
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    DeepSeek V3.1發(fā)布!擁抱國(guó)產(chǎn)力芯片

    架構(gòu)到Agent能力突破,從API價(jià)格調(diào)整到國(guó)產(chǎn)芯片生態(tài)共建,DeepSeek V3.1的發(fā)布標(biāo)志著中國(guó)AI產(chǎn)業(yè)進(jìn)入技術(shù)突破與產(chǎn)業(yè)落地協(xié)同發(fā)展的新階段。 ? 圖:DeepSeek正式發(fā)布
    的頭像 發(fā)表于 08-23 07:55 ?1.8w次閱讀
    <b class='flag-5'>DeepSeek</b> V3.1發(fā)布!<b class='flag-5'>擁抱</b>國(guó)產(chǎn)<b class='flag-5'>算</b>力芯片

    摩爾線程TileLang-MUSA率先支持DeepSeek-V4全新TileKernels

    4月24日,摩爾線程宣布,其基于TileLang 0.1.8版本深度優(yōu)化并已成為TileLang官方主線版本的TileLang-MUSA,已率先在國(guó)產(chǎn)全功能GPU上,實(shí)現(xiàn)對(duì)DeepSeek
    的頭像 發(fā)表于 04-30 16:17 ?396次閱讀

    沐曦股份開源TileLang-Metax并入駐TileAI社區(qū)

    4月27日,沐曦股份面向沐曦GPU的TileLang適配支持與優(yōu)化項(xiàng)目TileLang-Metax正式成為TileAI社區(qū)官方主線版本,代碼已開源并托管于TileAI組織之下,與TileLan
    的頭像 發(fā)表于 04-28 15:57 ?183次閱讀

    壁仞科技壁礪166系列GPU產(chǎn)品率先支持DeepSeek-V4模型

    4月24日,深度求索團(tuán)隊(duì)宣布全新系列模型 DeepSeek-V4 的預(yù)覽版本正式上線并同步開源。依托成熟的BIRENSUPA軟件棧與自研GPU全棧智能體“AIModelMaster”,壁仞科技快速
    的頭像 發(fā)表于 04-28 14:04 ?662次閱讀
    壁仞科技壁礪166系列GPU產(chǎn)品率先支持<b class='flag-5'>DeepSeek</b>-V4模型

    沐曦股份GPU產(chǎn)品正式接入華佗開源生態(tài)

    沐曦股份堅(jiān)持“自主創(chuàng)新與開放兼容”雙軌戰(zhàn)略,以自研MXMACA軟件棧為核心,構(gòu)建硬件與應(yīng)用的橋梁,并承載開源核心使命。該棧于2025年2月正式開源,致力于打造開放的GPU編程接口標(biāo)準(zhǔn),大幅降低開發(fā)門檻,有效破解跨平臺(tái)兼容難題,驅(qū)動(dòng)AI
    的頭像 發(fā)表于 03-16 14:40 ?1720次閱讀
    沐曦股份GPU產(chǎn)品正式<b class='flag-5'>接入</b>華佗<b class='flag-5'>開源</b><b class='flag-5'>生態(tài)</b>

    國(guó)產(chǎn)生態(tài)擁抱開源AI智能體:光合組織全國(guó)OpenClaw體驗(yàn)“龍蝦局”正式啟動(dòng)

    服務(wù),更同步首發(fā)業(yè)內(nèi)首款端云協(xié)同國(guó)產(chǎn)工作站,標(biāo)志著國(guó)內(nèi)首個(gè)全面擁抱 OpenClaw 的國(guó)產(chǎn)生態(tài),正式邁出技術(shù)落地與全民普及的關(guān)鍵一步,也為國(guó)產(chǎn)力打破
    的頭像 發(fā)表于 03-11 09:39 ?9750次閱讀
    國(guó)產(chǎn)<b class='flag-5'>算</b>力<b class='flag-5'>生態(tài)</b><b class='flag-5'>擁抱</b><b class='flag-5'>開源</b>AI智能體:光合組織全國(guó)OpenClaw體驗(yàn)“龍蝦局”正式啟動(dòng)

    摩爾線程正式開源TileLang-MUSA項(xiàng)目

    近日,摩爾線程正式開源TileLang-MUSA項(xiàng)目,實(shí)現(xiàn)對(duì)TileLang編程語(yǔ)言的完整支持。該項(xiàng)目已成功在摩爾線程多代全功能GPU上完成功能驗(yàn)證與特性開發(fā),旨在通過(guò)高層抽象與編譯器優(yōu)化,大幅降低開發(fā)門檻,為國(guó)產(chǎn)
    的頭像 發(fā)表于 02-11 16:57 ?1728次閱讀

    北大團(tuán)隊(duì)最新研究:AI芯片力提升數(shù)倍,效提升超90倍

    電子發(fā)燒友網(wǎng)綜合報(bào)道 2026年1月,國(guó)際頂級(jí)學(xué)術(shù)期刊《自然·電子》刊發(fā)的一項(xiàng)研究成果,讓全球半導(dǎo)體與力領(lǐng)域?yàn)橹毮俊本┐髮W(xué)人工智能研究院陶耀宇研究員、集成電路學(xué)院楊玉超教授團(tuán)隊(duì),在國(guó)際上
    的頭像 發(fā)表于 01-15 09:31 ?2272次閱讀

    北大學(xué)以開源技術(shù)鋪就人才與產(chǎn)業(yè)共贏之路

    當(dāng)開源浪潮席卷全球科技領(lǐng)域,成為技術(shù)創(chuàng)新與產(chǎn)業(yè)升級(jí)的核心引擎,一所地方高校如何憑借前瞻布局與務(wù)實(shí)行動(dòng),在開源生態(tài)中占據(jù)重要席位,既培育出頂尖創(chuàng)新人才,又產(chǎn)出服務(wù)產(chǎn)業(yè)的硬核成果?中
    的頭像 發(fā)表于 01-07 10:30 ?565次閱讀

    北大學(xué)開源鴻蒙技術(shù)俱樂(lè)部正式揭牌成立

    ”在東北大學(xué)渾南校區(qū)成功舉辦。 嘉賓合影 東北大學(xué)黨委常委、副校長(zhǎng)王輝出席活動(dòng)并致辭。王輝表示,立足國(guó)家戰(zhàn)略布局,發(fā)展開源生態(tài)、鍛造自主可控核心技術(shù)人才隊(duì)伍,是推動(dòng)科技自立自強(qiáng)的關(guān)鍵一
    的頭像 發(fā)表于 10-31 10:43 ?1028次閱讀
    東<b class='flag-5'>北大</b>學(xué)<b class='flag-5'>開源</b>鴻蒙技術(shù)俱樂(lè)部正式揭牌成立

    復(fù)旦大學(xué)探索開源人才發(fā)展新模式

    復(fù)旦大學(xué)作為一所與國(guó)家命運(yùn)緊密相連的百年學(xué)府,始終將服務(wù)國(guó)家戰(zhàn)略需求、培養(yǎng)拔尖創(chuàng)新人才作為核心使命。在科研領(lǐng)域,以敢為人先、開放協(xié)作的姿態(tài),探索著高校與產(chǎn)業(yè)、社區(qū)聯(lián)動(dòng)的創(chuàng)新路徑。近年來(lái),復(fù)旦大學(xué)圍繞開源
    的頭像 發(fā)表于 10-17 11:05 ?837次閱讀

    探秘安全生產(chǎn)預(yù)警預(yù)測(cè)系統(tǒng)的五大頂尖平臺(tái)

    探秘安全生產(chǎn)預(yù)警預(yù)測(cè)系統(tǒng)的五大頂尖平臺(tái)
    的頭像 發(fā)表于 10-16 09:56 ?1470次閱讀
    探秘安全生產(chǎn)預(yù)警預(yù)測(cè)系統(tǒng)的五<b class='flag-5'>大頂尖</b>平臺(tái)

    沐曦曦云C系列產(chǎn)品已支持TileLang

    近日,DeepSeek宣布在其新版本中擁抱國(guó)產(chǎn)GPU語(yǔ)言TileLang,引發(fā)業(yè)界廣泛關(guān)注。作為國(guó)產(chǎn)高性能GPU的代表,沐曦曦云C系列產(chǎn)品已率先在這一新興開源社區(qū)獲得支持。
    的頭像 發(fā)表于 10-14 09:25 ?1364次閱讀
    沐曦曦云C系列產(chǎn)品已支持<b class='flag-5'>TileLang</b>

    邊緣計(jì)算AI硬件如何接入DeepSeek嗎?需要具備哪些條件?

    2025年伊始,一款來(lái)自中國(guó)初創(chuàng)公司“深度求索”的AI大模型DeepSeek橫空出世,驚艷全球。DeepSeek厲害之處在于,在中國(guó)被外國(guó)芯片封鎖的背景下,在性能上接近美國(guó)頂尖AI模型,但研發(fā)
    的頭像 發(fā)表于 08-21 10:30 ?2062次閱讀
    邊緣計(jì)算AI硬件如何<b class='flag-5'>接入</b><b class='flag-5'>DeepSeek</b>嗎?需要具備哪些條件?

    開源金融創(chuàng)新論壇成功舉辦

    日前,2025開放原子開源生態(tài)大會(huì)——開源金融創(chuàng)新論壇在北京成功舉辦。論壇致力于推動(dòng)金融行業(yè)擁抱開源
    的頭像 發(fā)表于 08-05 11:00 ?1423次閱讀
    陇南市| 河间市| 平和县| 延边| 青田县| 克山县| 宁都县| 临高县| 太仆寺旗| 蒙城县| 枞阳县| 闵行区| 盖州市| 文登市| 万年县| 休宁县| 西充县| 灌云县| 平乡县| 科技| 抚松县| 松阳县| 秭归县| 宜都市| 厦门市| 格尔木市| 抚宁县| 大竹县| 九台市| 汉中市| 黎平县| 望江县| 靖宇县| 高州市| 依兰县| 杭州市| 游戏| 湘西| 丰顺县| 谢通门县| 子长县|