日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種基于分布式光交換的高帶寬域架構(gòu)InfiniteHBD

曦智科技 ? 來(lái)源:曦智科技 ? 2025-06-09 10:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

曦智科技聯(lián)合北京大學(xué)、階躍星辰為下一代萬(wàn)億參數(shù)大模型訓(xùn)練的基礎(chǔ)設(shè)施建設(shè)提出全新解決方案。

隨著大模型參數(shù)規(guī)模的擴(kuò)大,分布式訓(xùn)練成為人工智能發(fā)展的核心途徑。分布式訓(xùn)練可以將模型數(shù)據(jù)分配給多個(gè)計(jì)算節(jié)點(diǎn),進(jìn)行并行計(jì)算和數(shù)據(jù)管理,從而顯著加速模型訓(xùn)練的過程,而高帶寬域(High Bandwidht Domain, HBD)的設(shè)計(jì)對(duì)提升模型算力利用率至關(guān)重要。

然而,現(xiàn)有的HBD架構(gòu)在可擴(kuò)展性、成本和容錯(cuò)能力等方面存在根本性限制:

交換機(jī)中心的HBD(如NVIDIA NVL72)成本高昂、不易擴(kuò)展規(guī)模。

以以AI 加速器(包括GPU 與專用ASIC)為中心的HBD(如Google TPUv3和Tesla Dojo)存在嚴(yán)重的故障傳播問題。

2022 年Google發(fā)布TPU v4 集群,首次采用光交換方案(Optical Circuit Switch,以下簡(jiǎn)稱“OCS”),這種交換機(jī)-GPU混合的HBD在互連成本與系統(tǒng)擴(kuò)展性之間采取了折中方案,但仍存在故障爆炸半徑問題,其成本和容錯(cuò)能力仍不甚理想。

70f2da02-41b9-11f0-b715-92fbcf53809c.jpg

在此背景下,曦智科技聯(lián)手北京大學(xué)、階躍星辰的研究團(tuán)隊(duì)提出了一種以光交換(OCS)模組為中心的高帶寬域架構(gòu)InfiniteHBD,通過在光電轉(zhuǎn)換模組中集成OCS能力,InfiniteHBD實(shí)現(xiàn)了動(dòng)態(tài)可重構(gòu)的單點(diǎn)對(duì)多點(diǎn)連接,具備節(jié)點(diǎn)級(jí)故障隔離和低資源碎片化的能力。

InfiniteHBD在可擴(kuò)展性和成本上全面優(yōu)于現(xiàn)有方案:InfiniteHBD的單位成本僅為NVL72的31%,GPU冗余率比NVL72和TPUv4低一個(gè)數(shù)量級(jí),且與NVIDIA DGX(單機(jī)8卡)相比,模型算力利用率最高提升3.37 倍。

該方案以論文形式被國(guó)際通信網(wǎng)絡(luò)領(lǐng)域頂級(jí)會(huì)議SIGCOMM 2025[1]接收。

曦智科技在集成硅光領(lǐng)域擁有十余年的產(chǎn)業(yè)經(jīng)驗(yàn),在InfiniteHBD 方案中,創(chuàng)新性的開發(fā)了基于硅光子技術(shù)的分布式光交換dOCS(distributed Optical Circuit Switch),將基于馬赫曾德(MZI,Mach-Zehnder Interferometer)交換矩陣的光交換芯片集成到商用QSFP-DD 800Gbps光電轉(zhuǎn)換模組中,大幅簡(jiǎn)化了器件結(jié)構(gòu)的同時(shí),有效提升了器件集成度,從而降低了成本和功耗,顯著提升了InfiniteHBD 的性價(jià)比和系統(tǒng)可擴(kuò)展性。

715fa696-41b9-11f0-b715-92fbcf53809c.png

分布式光交換方案對(duì)于建設(shè)超大規(guī)模訓(xùn)練集群具有以下收益:

dOCS自帶光電轉(zhuǎn)換,提供交換能力的同時(shí)可形成跨機(jī)超節(jié)點(diǎn);

光交換芯片采用成熟制程,降低了對(duì)于先進(jìn)制程電交換芯片的依賴;

光交換芯片對(duì)協(xié)議不敏感,適用于當(dāng)前GPU連接協(xié)議碎片化的現(xiàn)狀

InfiniteHBD為高帶寬域架構(gòu)的高效擴(kuò)展提供了新的解決方案,為下一代萬(wàn)億參數(shù)大模型訓(xùn)練的基礎(chǔ)設(shè)施建設(shè)帶來(lái)了重要啟示。 注釋: [1]SIGCOMM,Special Interest Group on Data Communication,即數(shù)據(jù)通信專業(yè)組,是ACM(美國(guó)計(jì)算機(jī)協(xié)會(huì))組織在通信網(wǎng)絡(luò)領(lǐng)域的旗艦會(huì)議。今年的SIGCOMM 將于9 月8日-11日在葡萄牙科英布拉舉行。

關(guān)于曦智科技

曦智科技是全球領(lǐng)先的光電混合算力提供商。公司憑借在集成光子領(lǐng)域的開創(chuàng)性技術(shù)和全球頂尖的集成電路技術(shù)研發(fā)團(tuán)隊(duì),致力于在計(jì)算需求爆發(fā)的時(shí)代,為客戶提供一系列算力躍遷解決方案,與客戶共建更智能、更可持續(xù)的世界。曦智科技從光子矩陣計(jì)算(oMAC)、片上光網(wǎng)絡(luò)(oNOC)和片間光網(wǎng)絡(luò)(oNET)三大核心技術(shù)出發(fā),打造光子計(jì)算和光子網(wǎng)絡(luò)兩大產(chǎn)品線,與大數(shù)據(jù)、云計(jì)算、金融、自動(dòng)駕駛、生物醫(yī)藥、材料研究等領(lǐng)域客戶開展緊密合作,持續(xù)為客戶提供更具創(chuàng)造性的高效算力支撐。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    841

    瀏覽量

    40265
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1697

    瀏覽量

    16838
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3796

    瀏覽量

    5276

原文標(biāo)題:曦科技|基于分布式光交換高帶寬域InfiniteHBD:破局超節(jié)點(diǎn)擴(kuò)展瓶頸

文章出處:【微信號(hào):曦智科技,微信公眾號(hào):曦智科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    分布式伏發(fā)電優(yōu)點(diǎn)、實(shí)現(xiàn)路徑以及趨勢(shì)

    分布式伏發(fā)電是指利用太陽(yáng)能伏板,將太陽(yáng)光直接轉(zhuǎn)換成電能的一種方式,其特點(diǎn)是發(fā)電單元規(guī)模較小,且直接部署在電力需求側(cè)附近,如住宅屋頂、商業(yè)樓宇、工業(yè)廠房等。與傳統(tǒng)的集中式大型
    的頭像 發(fā)表于 04-08 09:18 ?422次閱讀

    伏規(guī)約轉(zhuǎn)換器分布式伏調(diào)控“四可”并網(wǎng)實(shí)施案例

    1.背景近年來(lái),隨著國(guó)家分布式伏的利好政策,各地分布式伏裝機(jī)規(guī)模增加迅猛。分布式伏具有間歇
    的頭像 發(fā)表于 12-19 10:13 ?4391次閱讀
    <b class='flag-5'>光</b>伏規(guī)約轉(zhuǎn)換器<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏調(diào)控“四可”并網(wǎng)實(shí)施案例

    福祿克產(chǎn)品在分布式屋頂伏系統(tǒng)運(yùn)維中的應(yīng)用案例

    分布式伏通常指在用戶場(chǎng)地附近建設(shè),容量相對(duì)較小的伏發(fā)電設(shè)施。屋頂伏作為分布式伏的
    的頭像 發(fā)表于 11-21 17:13 ?1782次閱讀

    Acrel-1000DP分布式伏監(jiān)控系統(tǒng)成功落地奉賢平食品 4.4MW 分布式伏項(xiàng)目

    、概述 上海華電奉賢平食品 4408.085kwp 分布式伏發(fā)電項(xiàng)目(以下簡(jiǎn)稱“本項(xiàng)目”)是響應(yīng)國(guó)家“優(yōu)化能源結(jié)構(gòu),提供更加清潔、可靠的能源”的號(hào)召,投資建設(shè)的
    的頭像 發(fā)表于 11-12 10:17 ?581次閱讀

    如何解決分布式伏計(jì)量難題?

    分布式伏成增長(zhǎng)主力 據(jù)《2025-2030年中國(guó)分布式伏行業(yè)市場(chǎng)前景預(yù)測(cè)及未來(lái)發(fā)展趨勢(shì)研究報(bào)告》顯示,2024年中國(guó)分布式
    的頭像 發(fā)表于 11-07 14:55 ?436次閱讀
    如何解決<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏計(jì)量難題?

    分布式伏環(huán)境監(jiān)測(cè)站的技術(shù)架構(gòu)與應(yīng)用實(shí)踐

    分布式伏環(huán)境監(jiān)測(cè)站的技術(shù)架構(gòu)與應(yīng)用實(shí)踐 柏峰【BF-GFQX】、系統(tǒng)技術(shù)架構(gòu)解析 分布式
    的頭像 發(fā)表于 10-13 10:05 ?761次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏環(huán)境監(jiān)測(cè)站的技術(shù)<b class='flag-5'>架構(gòu)</b>與應(yīng)用實(shí)踐

    伏監(jiān)控案例分享!奉賢平食品4.4MW分布式伏電站:實(shí)時(shí)監(jiān)控+智能運(yùn)維

    摘 要:在“雙碳”和新型電力系統(tǒng)建設(shè)背景下,分布式伏接入比例不斷提高,對(duì)配電網(wǎng)電壓、調(diào)度運(yùn)行及調(diào)峰等環(huán)節(jié)造成強(qiáng)烈沖擊。本文設(shè)計(jì)包含平臺(tái)層、設(shè)備層二層架構(gòu)體系的分布式
    的頭像 發(fā)表于 09-01 17:49 ?1635次閱讀
    <b class='flag-5'>光</b>伏監(jiān)控案例分享!奉賢平<b class='flag-5'>高</b>食品4.4MW<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏電站:實(shí)時(shí)監(jiān)控+智能運(yùn)維

    【節(jié)能學(xué)院】Acrel-1000DP分布式伏監(jiān)控系統(tǒng)在奉賢平食品 4.4MW 分布式伏中應(yīng)用

    摘要:在“雙碳”和新型電力系統(tǒng)建設(shè)背景下,分布式伏接入比例不斷提高,對(duì)配電網(wǎng)電壓、調(diào)度運(yùn)行及調(diào)峰等環(huán)節(jié)造成強(qiáng)烈沖擊。本文設(shè)計(jì)包含平臺(tái)層、設(shè)備層二層架構(gòu)體系的分布式
    的頭像 發(fā)表于 08-23 08:04 ?3685次閱讀
    【節(jié)能學(xué)院】Acrel-1000DP<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏監(jiān)控系統(tǒng)在奉賢平<b class='flag-5'>高</b>食品 4.4MW <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏中應(yīng)用

    分布式伏發(fā)電監(jiān)測(cè)系統(tǒng)技術(shù)方案

    分布式伏發(fā)電監(jiān)測(cè)系統(tǒng)技術(shù)方案 柏峰【BF-GFQX】、系統(tǒng)目標(biāo) :分布式伏發(fā)電監(jiān)測(cè)系統(tǒng)旨在通過智能化的監(jiān)測(cè)手段,實(shí)現(xiàn)對(duì)
    的頭像 發(fā)表于 08-22 10:51 ?3503次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏發(fā)電監(jiān)測(cè)系統(tǒng)技術(shù)方案

    中國(guó)首條&quot;算力軌&quot;通車!國(guó)內(nèi)首個(gè)分布式互連交換超節(jié)點(diǎn)發(fā)布

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)超節(jié)點(diǎn)技術(shù)(SuperPod)是一種通過高帶寬、低時(shí)延互連技術(shù),將大量 GPU芯片整合為統(tǒng)超級(jí)計(jì)算單元的技術(shù)架構(gòu)。它突破了傳統(tǒng)單服務(wù)器
    發(fā)表于 08-01 08:59 ?6660次閱讀
    中國(guó)首條&quot;算力<b class='flag-5'>光</b>軌&quot;通車!國(guó)內(nèi)首個(gè)<b class='flag-5'>分布式</b><b class='flag-5'>光</b>互連<b class='flag-5'>光</b><b class='flag-5'>交換</b>超節(jié)點(diǎn)發(fā)布

    安科瑞分布式伏監(jiān)控系統(tǒng):賦能園區(qū)企業(yè)伏用電智能化管理

    維成本,成為了園區(qū)企業(yè)面臨的重要挑戰(zhàn)。安科瑞分布式伏監(jiān)控系統(tǒng)應(yīng)運(yùn)而生,為園區(qū)企業(yè)提供了套全面、智能的伏用電管理解決方案。(18721098782----安科瑞) 系統(tǒng)
    的頭像 發(fā)表于 07-30 15:57 ?968次閱讀
    安科瑞<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏監(jiān)控系統(tǒng):賦能園區(qū)企業(yè)<b class='flag-5'>光</b>伏用電智能化管理

    分布式伏總出問題?安科瑞分布式伏監(jiān)控系統(tǒng)來(lái)“救場(chǎng)”

    、分布式伏的痛點(diǎn)大揭秘 在 “雙碳” 目標(biāo)的大力推動(dòng)下,分布式伏作為綠色能源領(lǐng)域的重要力量,正以前所未有的速度蓬勃發(fā)展,越來(lái)越多的企業(yè)
    的頭像 發(fā)表于 07-16 16:50 ?971次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏總出問題?安科瑞<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏監(jiān)控系統(tǒng)來(lái)“救場(chǎng)”

    分布式伏發(fā)電監(jiān)控系統(tǒng)

    對(duì)、低壓并網(wǎng)分布式伏電站的升壓系統(tǒng)、伏逆變器等設(shè)備進(jìn)行全面監(jiān)控,采集微機(jī)保護(hù)裝置、自動(dòng)控制設(shè)備、電能質(zhì)量監(jiān)測(cè)裝置、伏逆變器、
    的頭像 發(fā)表于 06-25 13:41 ?1160次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏發(fā)電監(jiān)控系統(tǒng)

    分布式伏監(jiān)測(cè)難?并網(wǎng)型分布式伏系統(tǒng)伏功率預(yù)測(cè)方案

    、分布式伏發(fā)電系統(tǒng) ? 安科瑞 鄒玉麗 ? 分布式伏發(fā)電系統(tǒng)的基本設(shè)備包括伏電池組件、
    的頭像 發(fā)表于 05-20 10:17 ?1482次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏監(jiān)測(cè)難?并網(wǎng)型<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏系統(tǒng)<b class='flag-5'>光</b>伏功率預(yù)測(cè)方案

    分布式伏電力問題層出不窮?安科瑞分布式伏運(yùn)維系統(tǒng)來(lái)“救場(chǎng)”

    、分布式伏電力運(yùn)維,痛點(diǎn)大揭秘? ? 分布式伏作為實(shí)現(xiàn)綠色能源轉(zhuǎn)型的關(guān)鍵環(huán),近年來(lái)在我國(guó)
    的頭像 發(fā)表于 05-07 17:14 ?1109次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏電力問題層出不窮?安科瑞<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏運(yùn)維系統(tǒng)來(lái)“救場(chǎng)”
    瑞安市| 津市市| 鄯善县| 金秀| 徐州市| 洪湖市| 禹城市| 河北省| 达州市| 邢台市| 雷州市| 卓尼县| 楚雄市| 长武县| 高青县| 宁都县| 全州县| 从化市| 奎屯市| 宁远县| 凤凰县| 西丰县| 乐山市| 马山县| 安庆市| 手游| 岢岚县| 福泉市| 兴义市| 渝中区| 蒲江县| 高碑店市| 永胜县| 阿鲁科尔沁旗| 广丰县| 沁水县| 新乡市| 侯马市| 怀安县| 黑龙江省| 东宁县|