北京-4月10日,由全球計算聯(lián)盟(GCC)指導、GCC-OpenAl Infra社區(qū)主辦的2026 Open AlInfra Summit在北京順利舉辦。本次大會匯聚全球AI Infra領(lǐng)域的頂尖專家與生態(tài)伙伴,聚焦超節(jié)點、高速互聯(lián)、全棧液冷、吉瓦級AIDC及超節(jié)點性能Benchmark等核心技術(shù)領(lǐng)域。
奇異摩爾作為行業(yè)領(lǐng)先的AI 網(wǎng)絡(luò)互聯(lián)全棧式產(chǎn)品及解決方案提供商,受邀出席此次峰會,奇異摩爾網(wǎng)絡(luò)技術(shù) VP 葉棟在 “超節(jié)點生態(tài)主題論壇” 進行了題為《AI 原生時代:面向超節(jié)點AI網(wǎng)絡(luò)的智算互聯(lián)解決方案》的演講,他指出,隨著AI模型向萬億級參數(shù)與MoE架構(gòu)加速演進,疊加AI Agent及應(yīng)用的爆發(fā)式普及,傳統(tǒng)智算硬件正面臨嚴峻挑戰(zhàn)。在此背景下,超節(jié)點技術(shù)的快速崛起,對網(wǎng)絡(luò)互聯(lián)的帶寬、延遲與擴展能力提出了全新的需求與考驗。
Token經(jīng)濟的崛起
從計量單位到生產(chǎn)要素
近期,AI智能體應(yīng)用OpenClaw(“龍蝦”)火爆出圈,成為全球最受關(guān)注的AI應(yīng)用,也使得Token的需求正以遠超預(yù)期的速度爆發(fā)。根據(jù)國家數(shù)據(jù)局披露的數(shù)據(jù)顯示,截至2026年3月份,中國日均AI Token調(diào)用量已突破140萬億,較2024年初增長超過1400倍。按照摩根大通預(yù)測,預(yù)計從2025年到2030年,中國Token消耗量的年復合增長率將達到330%,5年間實現(xiàn)370倍的增長。
在GTC 2026大會上,黃仁勛提出“Token經(jīng)濟學”的概念,將數(shù)據(jù)中心重新定義為Token生產(chǎn)工廠,甚至提出一個新的公式:收入 = (每瓦特電力產(chǎn)出的Token數(shù)) × (可用總功率)。也就是說,在電力這個物理極限面前,每瓦特Token的生成效率,將直接決定一家AI企業(yè)的成本、營收和核心競爭力。Token不再僅僅是技術(shù)層面的計量單位,而是成為了衡量AI生產(chǎn)力的“新石油”和“計價器”。
網(wǎng)絡(luò)瓶頸:Token經(jīng)濟的“隱形天花板”
以O(shè)penClaw為代表的AI Agent正展現(xiàn)出驚人的資源消耗特征。其單次復雜自動化工作流的Token消耗量,動輒數(shù)萬甚至數(shù)十萬,重度用戶的日消耗量更可攀升至千萬乃至億級。科技博主的實測數(shù)據(jù)顯示,若將此類Agent作為生產(chǎn)工具全負荷使用,單周費用即可逼近萬元。這種高昂的邊際成本,已成為阻礙AI Agent大規(guī)模普及的關(guān)鍵瓶頸。要打破這一困局,不僅需要降低Token的生產(chǎn)成本,更亟需從根本上提升底層算力的利用效率。
這一效率挑戰(zhàn)的根源在于Agentic AI獨特的核心訴求,其需構(gòu)建一套持續(xù)迭代、多輪交互、異構(gòu)協(xié)同、低時延響應(yīng)的推理流水線:Prefill預(yù)填充+Decode解碼+上下文記憶(KV cache共享),支撐多智能體之間高效通信交互。傳統(tǒng)計算架構(gòu)在此場景下已難以適配,而互聯(lián)也已不再是單純的輔助性基礎(chǔ)設(shè)施,而是迭代升級為Agentic AI的決定性神經(jīng)系統(tǒng),成為支撐這套核心推理流水線高效運轉(zhuǎn)的核心支柱,直接決定Agentic AI的響應(yīng)效率、協(xié)同能力與性能上限。NVIDIA首席科學家Bill Dally在訪談中也印證了這一觀點,AI推理對延遲的要求很高,而“目前的瓶頸已經(jīng)不是算力本身,瓶頸在通信開銷上”。
超節(jié)點:解決互聯(lián)瓶頸的系統(tǒng)級答案
面對傳統(tǒng)集群在帶寬、延遲和運維上的結(jié)構(gòu)性瓶頸,行業(yè)給出了新的解決方案——超節(jié)點。其作為新一代智算基礎(chǔ)設(shè)施核心單元,憑借高帶寬互聯(lián)架構(gòu)、全局內(nèi)存統(tǒng)一編址等核心技術(shù)優(yōu)勢,以及規(guī)?;M網(wǎng)、高可靠運行等系統(tǒng)特性,成為承載大模型全流程計算、突破算力性能瓶頸的關(guān)鍵底座。超節(jié)點是基于高速互聯(lián)協(xié)議,將多顆AI芯片深度融合構(gòu)建的一體化智能計算系統(tǒng),可突破單機硬件擴展邊界,實現(xiàn)大規(guī)模算力的高效聚合與協(xié)同調(diào)度,全面適配千億至萬億參數(shù)級大模型訓練、推理等核心場景。
奇異摩爾在超節(jié)點領(lǐng)域的核心優(yōu)勢
不過,當前超節(jié)點發(fā)展面臨節(jié)奏錯配與生態(tài)碎片化雙重挑戰(zhàn)。一方面,AI模型以“月”為單位快速迭代,要求萬卡級擴展能力,而硬件標準迭代周期以“年”計,“軟節(jié)奏”與“硬周期”存在錯配。另一方面,行業(yè)內(nèi)超節(jié)點協(xié)議有多條不同路線,生態(tài)碎片化拖累標準化進程,也使超節(jié)點走向規(guī)?;倪M展略慢。
針對這些行業(yè)痛點,奇異摩爾創(chuàng)新性地推出了通用超節(jié)點互聯(lián)芯粒——Kiwi G2G IOD,旨在為復雜的國產(chǎn)AI芯片生態(tài)提供一個統(tǒng)一的“互聯(lián)底座”。
Kiwi G2G IOD的核心優(yōu)勢在于將互聯(lián)功能與計算核心進行物理“解耦”。相比將互聯(lián)IP集成在計算芯片內(nèi)的傳統(tǒng)方案(通常占用20-30%的寶貴面積),Kiwi G2G IOD僅占用1-20mm2的微小面積,極大地優(yōu)化了計算面積利用率,讓芯片能更專注于算力提升。同時,這種解耦架構(gòu)使其即便采用非先進工藝,也能將XPU互聯(lián)帶寬提升至2TBbps,性能超越NVLink 5.0。在協(xié)議層面,Kiwi G2G IOD展現(xiàn)出卓越的靈活性,支持SUE、OISA、ETH-X等多種主流及未來協(xié)議。
綜合來看,超節(jié)點芯粒方案具備擴展性更優(yōu)、研發(fā)成本更低、周期更短等顯著優(yōu)勢。在摩爾定律放緩、單純硬件堆砌難以為繼的背景下,Kiwi G2G IOD所代表的軟硬件全棧協(xié)同新范式,將成為提升算力轉(zhuǎn)化效率、加速大模型迭代、推動AI產(chǎn)業(yè)走向成熟的關(guān)鍵力量。
破局智算互聯(lián)瓶頸:
奇異摩爾多軌并進,共筑互聯(lián)新生態(tài)
在提供創(chuàng)新產(chǎn)品的同時,奇異摩爾積極投身產(chǎn)業(yè)生態(tài)建設(shè),加速互聯(lián)標準的統(tǒng)一與落地。
在ODCC春季全會網(wǎng)絡(luò)工作組會議上,騰訊牽頭成立IO-NET項目工作組,聚焦下一代AI網(wǎng)絡(luò)技術(shù),圍繞面向Agent的新型互聯(lián)體系,推進訓練、推理、業(yè)務(wù)執(zhí)行一體化研究,共建生態(tài)規(guī)范。奇異摩爾作為重要成員,牽頭組建基于IO-NET的IOD芯粒工作組,聯(lián)合產(chǎn)業(yè)伙伴探索通用IOD實現(xiàn)路徑。
在ODCC春季全體會議上,中國信通院云大所和騰訊牽頭,聯(lián)合奇異摩爾、博通、江波龍等產(chǎn)業(yè)鏈頭部企業(yè),共同發(fā)起成立“智算互聯(lián)芯粒實驗室”(ACCL)。奇異摩爾作為核心運營單位,首期重點工作將聚焦騰訊ETH-X Scale Up協(xié)議聯(lián)合XPU廠商、交換機等廠商共同搭建基于Kiwi G2G IO芯粒的原型驗證平臺,構(gòu)建開放測試標準,賦能打通國產(chǎn)化芯片互聯(lián)互通的傳輸瓶頸。(更多閱讀:攻堅智算“芯”瓶頸:奇異摩爾攜手信通院、騰訊成立智算互聯(lián)芯粒實驗室)
此外,奇異摩爾已加入GCC-OpenAlInfra社區(qū),積極參與社區(qū)生態(tài)建設(shè),并加入高速互聯(lián)工作組與由字節(jié)跳動牽頭的DPU工作組,結(jié)合工作組階段性進展,深入?yún)⑴c相關(guān)技術(shù)規(guī)范與標準討論,并在工程實踐與生態(tài)協(xié)同方面貢獻力量。
展望未來,隨著AI模型持續(xù)復雜化、超節(jié)點規(guī)模不斷擴展,智算互聯(lián)的核心價值將愈發(fā)凸顯。奇異摩爾將持續(xù)深耕AI網(wǎng)絡(luò)互聯(lián),深化與產(chǎn)業(yè)鏈上下游企業(yè)的協(xié)同合作,推動超節(jié)點互聯(lián)的標準統(tǒng)一、技術(shù)落地與生態(tài)完善。通過軟硬件全棧協(xié)同的創(chuàng)新路徑,我們將持續(xù)破解智算互聯(lián)瓶頸,助力我國智算產(chǎn)業(yè)實現(xiàn)自主可控與高質(zhì)量發(fā)展,為AI Agent規(guī)?;瘧?yīng)用及大模型高效迭代提供堅實的互聯(lián)支撐,推動整個AI產(chǎn)業(yè)邁向更高效、更普惠、更成熟的發(fā)展新階段。
-
網(wǎng)絡(luò)
+關(guān)注
關(guān)注
14文章
8340瀏覽量
95600 -
AI
+關(guān)注
關(guān)注
91文章
41315瀏覽量
302693 -
奇異摩爾
+關(guān)注
關(guān)注
0文章
85瀏覽量
4075
原文標題:奇異摩爾亮相 2026 Open AI Infra Summit,共話超節(jié)點生態(tài)新未來
文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
開放原子開源基金會旗下項目亮相FOSSASIA Summit 2026,中國開源力量閃耀曼谷
奇異摩爾與圖靈量子達成深度戰(zhàn)略合作
士蘭微電子亮相2026 Open AI Infra Summit
華為數(shù)字能源亮相2026 Open AI Infra Summit
奇異摩爾聯(lián)合成立智算互聯(lián)芯粒實驗室
天合儲能亮相Energy Storage Summit USA 2026
Synaptics亮相Embedded World 2026
開放原子開源基金會旗下項目亮相FOSSASIA Summit 2026
AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版
奇異摩爾邀您相約2026超節(jié)點大會
中科創(chuàng)達TurboX AI眼鏡亮相CES 2026
奇異摩爾Networking for AI生態(tài)沙龍成功舉辦
奇異摩爾攜手中國移動發(fā)布OISA 2.0協(xié)議
奇異摩爾亮相2026 Open AI Infra Summit
評論