日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Rail-Only拓?fù)渑cPCI Switch:GPU集群間高效通信的核心邏輯

星融元 ? 來(lái)源:jf_55437772 ? 作者:jf_55437772 ? 2025-03-26 10:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

當(dāng)前AI推理面臨兩大核心矛盾

算力需求激增:大模型應(yīng)用爆發(fā)(如實(shí)時(shí)交互、多模態(tài)生成),企業(yè)亟需更低延遲、更高吞吐的推理能力;

資源浪費(fèi)嚴(yán)重:傳統(tǒng)架構(gòu)下,GPU算力閑置率超30%,長(zhǎng)文本處理場(chǎng)景首Token延遲飆升至秒級(jí),用戶體驗(yàn)流失率增加40%。

DeepSeek-V3/R1的給我們的啟示:混合專家模型(MoE)雖需320卡起步,卻為超大規(guī)模云計(jì)算廠商提供了差異化競(jìng)爭(zhēng)力——吞吐效率提升50%,單用戶推理成本降低20%。而對(duì)中小客戶,“高性價(jià)比”仍是剛需,Dense模型憑借靈活部署穩(wěn)占80%市場(chǎng)份額。

組網(wǎng)架構(gòu)的“黃金分割”

行業(yè)需求驅(qū)動(dòng)架構(gòu)革新

分離架構(gòu):適合頭部云廠商(如AWS、阿里云),通過(guò)獨(dú)立優(yōu)化Prefill(算力密集型)和Decode(帶寬密集型)集群,實(shí)現(xiàn)超大規(guī)模并發(fā)下的極致性能,客戶可溢價(jià)30%提供“高端推理服務(wù)”。

統(tǒng)一架構(gòu):中小廠商的“降本利器”——單網(wǎng)絡(luò)支持智能流量調(diào)度,硬件投資減少25%,運(yùn)維成本降低40%,兼容80%現(xiàn)有基礎(chǔ)設(shè)施,快速搶占中端市場(chǎng)。

采用星融元CX-N系列交換機(jī)+RoCEv2技術(shù),單設(shè)備支持400G/800G帶寬,滿足“既要大吞吐又要低延遲”的矛盾需求。

從實(shí)驗(yàn)室到生產(chǎn)線:組網(wǎng)設(shè)計(jì)的成本與效益平衡

Rail-Only拓?fù)洌? GPU/組共享PCIe鏈路,服務(wù)器內(nèi)直連減少跳數(shù),適合百卡以下集群,硬件成本降低30%。

wKgZPGfjZk-AVUCAAANHgMm5JfI655.png

GPU服務(wù)器內(nèi)部:每四個(gè)GPU作為一組,共享一個(gè)并行推理網(wǎng)卡,連接到同一個(gè)PCI Switch,兩組GPU之間的通信通過(guò)兩個(gè)PCI Switch之間的直連通道完成;

GPU服務(wù)器之間:同一組號(hào)的GPU之間的通信通過(guò)交換機(jī)直接完成;不同組號(hào)的GPU之間的通信,先通過(guò)PCI Swtitch將流量路由到另一組的網(wǎng)卡,然后通過(guò)交換機(jī)完成;

小規(guī)模場(chǎng)景:低成本敏捷部署

wKgZO2fjZn6AdNiDAAY3TFpXC4I846.png

每臺(tái)推理服務(wù)器有8張GPU,2張400G網(wǎng)卡,雙歸連接到兩臺(tái)CX732Q-N

16個(gè)推理服務(wù)器(128張GPU)和2個(gè)CX732Q-N組成一個(gè)PoD。Prefill和Decode服務(wù)器可能屬于不同PoD

可橫向擴(kuò)展至64個(gè)PoD

中大規(guī)模場(chǎng)景:性能與擴(kuò)展性優(yōu)先

模塊化PoD設(shè)計(jì):以512 GPU為單元構(gòu)建獨(dú)立集群,Prefill與Decode服務(wù)器同PoD內(nèi)一跳互聯(lián),時(shí)延控制在10μs以內(nèi)。

橫向擴(kuò)展能力:可橫向擴(kuò)展至64個(gè)PoD,支持萬(wàn)卡級(jí)集群無(wú)縫擴(kuò)容,滿足云計(jì)算平臺(tái)彈性需求。

wKgZO2fjZq6ADWM0AAbvJN4vMng448.png

未來(lái)展望:開(kāi)放生態(tài)與硬件迭代的雙重助力

盡管DeepSeek尚未開(kāi)源,但其PD分離架構(gòu)為行業(yè)提供了關(guān)鍵思路。未來(lái)趨勢(shì)將圍繞兩大方向:

軟硬件協(xié)同優(yōu)化:如DPU卸載KV緩存?zhèn)鬏斎蝿?wù),進(jìn)一步釋放GPU算力;

邊緣AI輕量化:通過(guò)模型剪枝與專用推理芯片,在10卡以下環(huán)境中實(shí)現(xiàn)MoE模型部署。

【參考文獻(xiàn)】

https://asterfusion.com/a20250306-scale-out/


審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5290

    瀏覽量

    136113
  • PCI
    PCI
    +關(guān)注

    關(guān)注

    5

    文章

    689

    瀏覽量

    134535
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41392

    瀏覽量

    302753
  • 組網(wǎng)
    +關(guān)注

    關(guān)注

    1

    文章

    454

    瀏覽量

    23407
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Java并發(fā)編程的“基石”——多線程概念初識(shí)

    之下,隱藏著一個(gè)龐大而復(fù)雜的“算力帝國(guó)”。如何將成千上萬(wàn)塊 GPU 的算力精準(zhǔn)、高效地分配給無(wú)數(shù)個(gè)并發(fā)的 AI 任務(wù)?這便是 AI 算力調(diào)度的核心使命。在這個(gè)看似屬于 Python 和 C++ 的絕對(duì)
    發(fā)表于 04-16 18:50

    面向高密度算力需求的AI渲染服務(wù)器集群功率MOSFET選型策略與器件適配手冊(cè)

    隨著AI計(jì)算與數(shù)字內(nèi)容創(chuàng)作爆發(fā)式增長(zhǎng),AI渲染服務(wù)器集群已成為數(shù)據(jù)中心核心算力單元。電源分配與散熱系統(tǒng)作為集群“能源與血脈”,為GPU、CPU、高速存儲(chǔ)及液冷泵等關(guān)鍵負(fù)載提供
    的頭像 發(fā)表于 03-24 15:09 ?455次閱讀
    面向高密度算力需求的AI渲染服務(wù)器<b class='flag-5'>集群</b>功率MOSFET選型策略與器件適配手冊(cè)

    深入剖析PI7C9X2G304EL:PCI Express Gen 2 Packet Switch的卓越之選

    深入剖析PI7C9X2G304EL:PCI Express Gen 2 Packet Switch的卓越之選 在電子設(shè)計(jì)的領(lǐng)域中,PCI Express(PCIe)技術(shù)以其高速、高效
    的頭像 發(fā)表于 03-19 17:15 ?591次閱讀

    PI7C9X130:PCI Express與PCI - X的高效橋梁

    PI7C9X130:PCI Express與PCI - X的高效橋梁 在當(dāng)今的電子系統(tǒng)設(shè)計(jì)中,如何實(shí)現(xiàn)不同總線標(biāo)準(zhǔn)之間的高效連接是一個(gè)關(guān)鍵問(wèn)題。PI7C9X130作為一款
    的頭像 發(fā)表于 03-13 16:05 ?303次閱讀

    KubePi:開(kāi)源Kubernetes可視化管理面板,讓集群管理如此簡(jiǎn)單

    的部署、監(jiān)控和維護(hù),讓即使不具備深厚Kubernetes知識(shí)的用戶也能輕松管理集群。 1.2 核心價(jià)值:可視化多集群管理 KubePi允許管理員導(dǎo)入多個(gè)Kubernetes集群,并通過(guò)
    發(fā)表于 02-11 12:53

    UPS電源核心技術(shù)深度解析:從拓?fù)?/b>結(jié)構(gòu)到智能管理的演進(jìn)之路

    ?當(dāng)電網(wǎng)電壓如海浪般波動(dòng),當(dāng)突發(fā)斷電瞬間襲來(lái),一臺(tái)優(yōu)秀的UPS不間斷電源正如精密運(yùn)行的瑞士鐘表,依靠其內(nèi)部協(xié)同運(yùn)作的核心技術(shù)體系,在毫秒完成電力切換與保障。這些技術(shù)不僅是電源行業(yè)的競(jìng)爭(zhēng)壁壘,更是
    的頭像 發(fā)表于 01-07 08:42 ?527次閱讀
    UPS電源<b class='flag-5'>核心</b>技術(shù)深度解析:從<b class='flag-5'>拓?fù)?/b>結(jié)構(gòu)到智能管理的演進(jìn)之路

    讀懂高效通信的星型組網(wǎng)

    一、什么是星型組網(wǎng)?一種網(wǎng)絡(luò)拓?fù)?/b>,所有設(shè)備直接連接至一個(gè)中心節(jié)點(diǎn),形成“中心發(fā)散”的星形結(jié)構(gòu),實(shí)現(xiàn)集中管理、高效通信。二、三大核心特點(diǎn)1.高可靠易維護(hù)節(jié)點(diǎn)獨(dú)立連接,單點(diǎn)故障不影響全網(wǎng);
    發(fā)表于 12-09 14:17

    全球邁入 IPv6-Only 關(guān)鍵窗口期

    、高效”為核心的IPv6-Only時(shí)代,這一倡議的落地,標(biāo)志著全球數(shù)字基礎(chǔ)設(shè)施建設(shè)進(jìn)入全新發(fā)展階段。來(lái)源:全球IPv6論壇官網(wǎng)《倡議》明確了兩大核心行動(dòng)方向:在部
    的頭像 發(fā)表于 11-25 10:23 ?747次閱讀
    全球邁入 IPv6-<b class='flag-5'>Only</b> 關(guān)鍵窗口期

    PPEC Workbench 平臺(tái)拓?fù)?/b>全覆蓋,滿足各類電源開(kāi)發(fā)需求

    電力電子智能化設(shè)計(jì)平臺(tái),以“全拓?fù)?/b>覆蓋 + 免代碼智能化高效開(kāi)發(fā) + 生態(tài)化協(xié)同”為核心,為電力電子行業(yè)數(shù)字電源開(kāi)發(fā)提供了一站式拓?fù)?/b>解決方案。 如今,電源
    發(fā)表于 10-23 11:44

    怎樣確定分布式光伏集群通信網(wǎng)絡(luò)的負(fù)載均衡策略?

    LZ-DZ100電能質(zhì)量在線監(jiān)測(cè)裝 確定分布式光伏集群通信網(wǎng)絡(luò)的負(fù)載均衡策略,需結(jié)合集群的網(wǎng)絡(luò)拓?fù)?/b>、數(shù)據(jù)特征、設(shè)備特性及運(yùn)行需求,通過(guò) “現(xiàn)狀分析→目標(biāo)設(shè)定→策略設(shè)計(jì)→驗(yàn)證優(yōu)化” 的流
    的頭像 發(fā)表于 08-22 10:10 ?735次閱讀
    怎樣確定分布式光伏<b class='flag-5'>集群</b><b class='flag-5'>通信</b>網(wǎng)絡(luò)的負(fù)載均衡策略?

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級(jí)

    400G/800G光模塊已實(shí)現(xiàn)規(guī)?;慨a(chǎn),并基于AI工廠與AI云的核心需求進(jìn)行深度優(yōu)化: 速率突破:采用PAM4調(diào)制技術(shù),單通道速率達(dá)100Gbps,整模塊實(shí)現(xiàn)800Gbps傳輸能力,為GPU集群
    發(fā)表于 08-13 19:01

    PCIe協(xié)議分析儀在數(shù)據(jù)中心中有何作用?

    部分GPU通信因交換機(jī)拓?fù)?/b>不合理導(dǎo)致延遲高。 調(diào)整交換機(jī)端口映射,使相鄰GPU通過(guò)最短路徑通信
    發(fā)表于 07-29 15:02

    摩爾線程吳慶詳解 MUSA 軟件棧:以技術(shù)創(chuàng)新釋放 KUAE 集群潛能,引領(lǐng) GPU 計(jì)算新高度?

    的分享。GPU 計(jì)算軟件開(kāi)發(fā)總監(jiān)吳慶登上講臺(tái),發(fā)表了題為《摩爾線程 MUSA 軟件棧助力 KUAE 集群釋放無(wú)限潛能》的演講。他從專業(yè)視角出發(fā),為在場(chǎng)聽(tīng)眾深入剖析了 MUSA 軟件棧在驅(qū)動(dòng) KUAE 集群
    的頭像 發(fā)表于 07-28 13:47 ?6479次閱讀
    摩爾線程吳慶詳解 MUSA 軟件棧:以技術(shù)創(chuàng)新釋放 KUAE <b class='flag-5'>集群</b>潛能,引領(lǐng) <b class='flag-5'>GPU</b> 計(jì)算新高度?

    如何破解GPU集群集合通信路徑的“黑盒”難題?

    集合通信庫(kù)(如NCCL、HCCL)的運(yùn)行細(xì)節(jié)用戶完全無(wú)感知,形成“黑盒”狀態(tài)。EPS通過(guò)實(shí)時(shí)解析集合通信庫(kù)的底層運(yùn)行狀態(tài),將隱蔽的通信路徑、GPU與網(wǎng)卡狀態(tài)等信息可視化,并提供智能路由
    的頭像 發(fā)表于 05-22 10:13 ?1069次閱讀
    如何破解<b class='flag-5'>GPU</b><b class='flag-5'>集群集合通信</b>路徑的“黑盒”難題?
    临颍县| 色达县| 慈利县| 阳山县| 天台县| 蓬安县| 修武县| 平江县| 新干县| 济南市| 乐安县| 慈溪市| 井陉县| 从江县| 金华市| 台安县| 贵阳市| 万安县| 五家渠市| 永胜县| 循化| 东丰县| 昭觉县| 金塔县| 肃宁县| 开封县| 呈贡县| 屏山县| 昌宁县| 南郑县| 若尔盖县| 噶尔县| 康乐县| 潞西市| 通江县| 信阳市| 交口县| 阿坝县| 林甸县| 潞城市| 比如县|