日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

算力革命:RoCE實(shí)測(cè)推理時(shí)延比InfiniBand低30%的底層邏輯

星融元Asterfusion ? 2025-05-28 14:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能與大數(shù)據(jù)技術(shù)爆發(fā)的時(shí)代,算力基礎(chǔ)設(shè)施的革新成為驅(qū)動(dòng)產(chǎn)業(yè)升級(jí)的核心引擎。作為 AI 數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的關(guān)鍵樞紐,800G 智能交換機(jī)正以其極致的性能、靈活的擴(kuò)展性和智能化的管理能力,重新定義高速網(wǎng)絡(luò)的標(biāo)準(zhǔn)。

本文將深度解析 AI 智算場(chǎng)景打造的800G AI RoCE交換機(jī),從外部規(guī)格的硬件創(chuàng)新到內(nèi)部架構(gòu)的芯片級(jí)設(shè)計(jì),從企業(yè)級(jí)操作系統(tǒng)的功能突破到實(shí)測(cè)數(shù)據(jù)的性能驗(yàn)證,全方位展現(xiàn)其如何通過(guò)領(lǐng)先的技術(shù)架構(gòu)破解 AI 訓(xùn)練與推理中的網(wǎng)絡(luò)效率瓶頸,助力數(shù)據(jù)中心在高帶寬、低延遲、高可靠性的需求下實(shí)現(xiàn)算力資源的最優(yōu)配置。

算力基礎(chǔ)設(shè)施—AI 智算RoCE網(wǎng)絡(luò)交換機(jī)

外觀展示

這款 800G AI 智能交換機(jī)在配備了 64 個(gè) 800G OSFP 網(wǎng)絡(luò)接口,能夠支持25G/50G/100G/200G/400G 等多種速率,可靈活適配不同的網(wǎng)絡(luò)環(huán)境需求。

wKgZPGg25GyAfgIEAAIXun1_7h4777.png

管理接口提供了 RJ45 MGMT Port、USB 2.0 Port 以及 RJ45 Console Port,為設(shè)備的管理和配置提供了豐富的選擇。還具備 2 個(gè) 10G 端口,可作為 INT 端口用于其他管理功能,為設(shè)備的擴(kuò)展應(yīng)用提供了可能。

交換機(jī)設(shè)有 6 個(gè) LED 指示燈,左側(cè)的 LED 指示燈(LINK/ACT)用于展示管理口的網(wǎng)絡(luò)鏈路狀態(tài)和數(shù)據(jù)活動(dòng)情況,右側(cè)的 LED 指示燈(SYS)則顯示系統(tǒng)整體狀態(tài),此外還有 BMC(面板管理控制器狀態(tài))、P(電源模塊狀態(tài))、F(風(fēng)扇模塊狀態(tài))和 L(定位指示燈,用于維護(hù)期間識(shí)別設(shè)備),通過(guò)這些指示燈,運(yùn)維人員可以快速了解設(shè)備的運(yùn)行狀況。

采用 1+1 熱插拔電源設(shè)計(jì),每個(gè)電源額定功率 3200W,且符合 80Plus 鈦金能效標(biāo)準(zhǔn),確保了設(shè)備供電的穩(wěn)定和高效。同時(shí),配備 3+1 個(gè)熱插拔風(fēng)扇模塊,為設(shè)備的散熱提供了可靠保障。

內(nèi)部架構(gòu)

wKgZPGg25HqAXKZBAAOVwicNkcI709.png

采用了 Marvell Teralynx 10 ASIC(以下簡(jiǎn)稱TL10),這是一款 5 納米單芯片可編程處理器,能提供 51.2Tbps 帶寬和約 560 納秒的端口轉(zhuǎn)發(fā)時(shí)延,在業(yè)內(nèi)處于領(lǐng)先水平。更詳細(xì)的內(nèi)部架構(gòu)請(qǐng)參見(jiàn):51.2T 800G AI智算交換機(jī)軟硬件系統(tǒng)設(shè)計(jì)全揭秘 - 星融元Asterfusion

散熱設(shè)計(jì)上,采用 3D 均熱風(fēng)冷散熱,這種高效的風(fēng)冷設(shè)計(jì)使系統(tǒng)在 2180W 滿負(fù)荷運(yùn)行時(shí)仍能有效控制溫度和噪音,即便在高負(fù)荷使用狀態(tài)下,風(fēng)扇轉(zhuǎn)速僅為 60%,保證了設(shè)備的穩(wěn)定運(yùn)行和良好的工作環(huán)境。

精確時(shí)間協(xié)議 PTP 模塊支持熱插拔,PTP 和 SyncE 同步精度高達(dá) 10 納秒,為對(duì)時(shí)間同步要求高的應(yīng)用場(chǎng)景提供了有力支持。

COMe 模塊由 x86 英特爾至強(qiáng)處理器和 AsterNOS 驅(qū)動(dòng),為先進(jìn)的數(shù)據(jù)中心 / 人工智能路由提供智能控制平面。面板管理控制器(BMC)模塊采用可插拔式設(shè)計(jì),適用于模塊化、可升級(jí)的帶外管理,支持性能升級(jí)擴(kuò)展,增強(qiáng)了設(shè)備的可擴(kuò)展性和靈活性。

AI RoCE 交換機(jī)操作系統(tǒng)(AsterNOS)

wKgZPGg25IGAF148AAHlqNfq3kk878.png

基于企業(yè)級(jí)SONiC的增強(qiáng)特性

  • 超高速以太網(wǎng)優(yōu)化:通過(guò)動(dòng)態(tài)流量整形和優(yōu)先級(jí)隊(duì)列技術(shù),實(shí)現(xiàn)網(wǎng)絡(luò)利用率超90%,較傳統(tǒng)以太網(wǎng)提升30%。
  • AI場(chǎng)景專屬功能flowlet級(jí)負(fù)載均衡:根據(jù)GPU集群負(fù)載動(dòng)態(tài)分配流量,減少數(shù)據(jù)擁塞。INT+WCMP路由:結(jié)合帶內(nèi)遙測(cè)與加權(quán)多路徑算法,訓(xùn)練任務(wù)延遲降低20.4%,token生成速率提升27.5%。

wKgZO2g25I6AfQkYAAD_Rju6o6M292.png
  • EasyRoCE :EasyRoCE 是星融元依托開(kāi)源、開(kāi)放的網(wǎng)絡(luò)架構(gòu)與技術(shù),為AI 智算、高性能計(jì)算等場(chǎng)景的RDMA 融合以太網(wǎng)(RoCE)提供的一系列實(shí)用特性和小工具。從前期規(guī)劃實(shí)施到日常運(yùn)維監(jiān)控, EasyRoCE 簡(jiǎn)化了各環(huán)節(jié)的復(fù)雜度并改善了操作體驗(yàn),更提供二次開(kāi)發(fā)和集成空間,供網(wǎng)絡(luò)架構(gòu)師充分利用開(kāi)放網(wǎng)絡(luò)的最新技術(shù)成果
wKgZPGg25JmATYQeAAAwG46x8vk054.png

(RE)RoCE Exporter:以容器的方式運(yùn)行在AsterNOS網(wǎng)絡(luò)操作系統(tǒng)內(nèi),從運(yùn)行AsterNOS的交換機(jī)設(shè)備上導(dǎo)出RoCE網(wǎng)絡(luò)相關(guān)監(jiān)控指標(biāo)(到自定義HTTP端口),供統(tǒng)一監(jiān)控平臺(tái)進(jìn)行可視化呈現(xiàn)。

wKgZPGg25KaAe8wBAAXT32jFjjU430.png
  • 接口收發(fā)帶寬和速率
  • RoCE、PFC、ECN、DSCP配置狀態(tài)信息
  • 擁塞控制信息(ECN標(biāo)記包,PFC幀數(shù)等)
  • 隊(duì)列Buffer信息
  • ……

企業(yè)版 SONiC vs 社區(qū)版

wKgZO2g25K6AIq99AAEo8iooweM796.pngwKgZO2g25KuAf94gAADkNX8502k685.pngwKgZPGg25LWANnhXAAC1P13ADHo064.png

AsterNOS 同時(shí)支持 Linux Bash 和思科風(fēng)格命令行界面(Klish),這種雙風(fēng)格命令行界面幫助網(wǎng)絡(luò)工程師輕松適應(yīng)并快速部署,提升了操作的便利性和效率。

wKgZO2g25L-Af_UoAACsbLS2vwA734.png

800G 數(shù)據(jù)中心交換機(jī)(TL10平臺(tái))實(shí)測(cè)數(shù)據(jù)

wKgZO2g25MaALdsjAAK8GsXLvBQ086.png

CX864E-N蛇形吞吐測(cè)試

wKgZPGg25M2AYQRKAALdQVgFLNY035.png

CX864E-N的端口轉(zhuǎn)發(fā)時(shí)延

實(shí)測(cè)數(shù)據(jù)展示了該交換機(jī)在不同測(cè)試場(chǎng)景下的出色表現(xiàn),各項(xiàng)指標(biāo)均達(dá)到較高水平,驗(yàn)證了其性能的穩(wěn)定性和可靠性。

DeepSeek模型推理指標(biāo)對(duì)比:IB vs RoCE

  • 推理時(shí)延:90% token 間隔延遲,指 90% token 間隔時(shí)間的最大值,用以衡量模型連續(xù)生成 token 的穩(wěn)定性和連貫性。推理時(shí)延越低,系統(tǒng)的穩(wěn)定性越高。
  • Token 平均生成速率(Token Generation Rate):?jiǎn)挝粸?token 每秒(tokens/s)。反映了模型推理的整體吞吐能力,TGR 越高,表示系統(tǒng)單位時(shí)間內(nèi)處理能力越強(qiáng)。
wKgZO2g25NSAb_W9AAAkJr1HFTo508.pngwKgZPGg25NyAe5IqAAAcyS1SqJI623.png

與IB網(wǎng)絡(luò)場(chǎng)景下數(shù)據(jù)對(duì)比可見(jiàn),星融元RoCEv2組網(wǎng),推理時(shí)延明顯優(yōu)于IB,token 連貫性更好;token生成速度、中文字符速度明顯優(yōu)于IB。

800G AI智能交換機(jī)通過(guò)硬件革新與AsterNOS軟件協(xié)同,為AI算力集群與超大規(guī)模數(shù)據(jù)中心提供“高吞吐、低時(shí)延、易運(yùn)維”的一站式解決方案。其模塊化設(shè)計(jì)、企業(yè)級(jí)SONiC支持及RoCEv2性能優(yōu)勢(shì),正加速AI基礎(chǔ)設(shè)施向開(kāi)放解耦、智能高效的下一代架構(gòu)演進(jìn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • InfiniBand
    +關(guān)注

    關(guān)注

    1

    文章

    31

    瀏覽量

    9587
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1697

    瀏覽量

    16838
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    時(shí)小于1毫秒,工信部發(fā)布全光網(wǎng)絡(luò)重磅利好政策

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)當(dāng)下,人工智能(AI)技術(shù)飛速發(fā)展,成為驅(qū)動(dòng)數(shù)字經(jīng)濟(jì)發(fā)展的核心要素。AI應(yīng)用持續(xù)拓展,對(duì)底層網(wǎng)絡(luò)的傳輸
    的頭像 發(fā)表于 10-20 07:17 ?1.1w次閱讀
    時(shí)<b class='flag-5'>延</b>小于1毫秒,工信部發(fā)布全光<b class='flag-5'>算</b><b class='flag-5'>力</b>網(wǎng)絡(luò)重磅利好政策

    科技云報(bào)到:AI革命,終結(jié)云計(jì)算20年降價(jià)史

    跟進(jìn),AI、高端存儲(chǔ)等核心產(chǎn)品價(jià)格大幅上調(diào),一場(chǎng)由人工智能驅(qū)動(dòng)的定價(jià)革命,正在徹底重塑云計(jì)算產(chǎn)業(yè)的
    的頭像 發(fā)表于 04-03 17:05 ?3023次閱讀

    邊緣AI臨界點(diǎn):深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價(jià)值

    310P芯片的底層架構(gòu),深度剖析這款產(chǎn)品的技術(shù)細(xì)節(jié)、門檻及其在實(shí)際產(chǎn)業(yè)落地中的真實(shí)價(jià)值。 一、176TOPS的產(chǎn)業(yè)門檻:為何這是邊緣
    發(fā)表于 03-10 14:19

    Hailo-8卡 + RK3588實(shí)測(cè)!26TOPS加持,助力AI視覺(jué)升級(jí)!

    近年來(lái),AI視覺(jué)在邊緣端應(yīng)用廣泛,行業(yè)對(duì)AI推理硬件的要求也日益提升。傳統(tǒng)CPU在CNN等視覺(jué)模型推理任務(wù)中逐漸顯露瓶頸,而專用AI加速器成為破局的關(guān)鍵。 Hailo-8 AI加速
    的頭像 發(fā)表于 03-02 16:46 ?478次閱讀
    Hailo-8<b class='flag-5'>算</b><b class='flag-5'>力</b>卡 + RK3588<b class='flag-5'>實(shí)測(cè)</b>!26TOPS加持,助力AI視覺(jué)升級(jí)!

    力爭(zhēng)百萬(wàn) Tokens 推理成本降低百倍:云天勵(lì)飛發(fā)布未來(lái)三年大芯片戰(zhàn)略,首曝 DeepVerse 路線圖

    集中于攻克大模型落地的“成本壁壘”,致力于通過(guò)底層架構(gòu)創(chuàng)新,力爭(zhēng)實(shí)現(xiàn)百萬(wàn) Tokens 推理成本降低 100 倍以上的目標(biāo),推動(dòng) AI 從技術(shù)嘗鮮走向普惠生產(chǎn)。產(chǎn)業(yè)變局:推理競(jìng)速,從
    的頭像 發(fā)表于 02-03 20:25 ?3199次閱讀
    力爭(zhēng)百萬(wàn) Tokens <b class='flag-5'>推理</b>成本降低百倍:云天勵(lì)飛發(fā)布未來(lái)三年大<b class='flag-5'>算</b><b class='flag-5'>力</b>芯片戰(zhàn)略,首曝 DeepVerse 路線圖

    積木+3D堆疊!GPNPU架構(gòu)創(chuàng)新,應(yīng)對(duì)AI推理需求

    落地的關(guān)鍵瓶頸。在此背景下,云天勵(lì)飛推出其第五代芯片架構(gòu)——GPNPU(General-Purpose Neural Processing Unit,通用神經(jīng)網(wǎng)絡(luò)處理單元),以一場(chǎng)底層架構(gòu)的革命,試圖重塑AI
    的頭像 發(fā)表于 12-11 08:57 ?8127次閱讀

    湘軍,讓變成生產(chǎn)?

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    在英偉達(dá)Thor平臺(tái)部署EtherCAT主站:實(shí)測(cè)高性能、抖動(dòng)與占用

    在機(jī)器人與邊緣AI應(yīng)用中,底層通信的實(shí)時(shí)性決定了系統(tǒng)的響應(yīng)速度與控制精度。JetsonThor作為NVIDIA最新一代嵌入式平臺(tái),具備強(qiáng)大的與實(shí)時(shí)推理能力,為EtherCAT網(wǎng)絡(luò)提
    的頭像 發(fā)表于 10-31 15:38 ?751次閱讀
    在英偉達(dá)Thor平臺(tái)部署EtherCAT主站:<b class='flag-5'>實(shí)測(cè)</b>高性能、<b class='flag-5'>低</b>抖動(dòng)與<b class='flag-5'>低</b>占用

    在英偉達(dá)Thor平臺(tái)部署EtherCAT主站:實(shí)測(cè)高性能、抖動(dòng)與占用

    在機(jī)器人與邊緣AI應(yīng)用中,底層通信的實(shí)時(shí)性決定了系統(tǒng)的響應(yīng)速度與控制精度。JetsonThor作為NVIDIA最新一代嵌入式平臺(tái),具備強(qiáng)大的與實(shí)時(shí)推理能力,為EtherCAT網(wǎng)絡(luò)提
    的頭像 發(fā)表于 10-31 09:24 ?25次閱讀
    在英偉達(dá)Thor平臺(tái)部署EtherCAT主站:<b class='flag-5'>實(shí)測(cè)</b>高性能、<b class='flag-5'>低</b>抖動(dòng)與<b class='flag-5'>低</b>占用

    在高性能 AI 平臺(tái)上部署 EtherCAT 主站:實(shí)測(cè)抖動(dòng)、占用方案

    在機(jī)器人與邊緣AI應(yīng)用中,底層通信的實(shí)時(shí)性決定了系統(tǒng)的響應(yīng)速度與控制精度。JetsonThor作為NVIDIA最新一代嵌入式平臺(tái),具備強(qiáng)大的與實(shí)時(shí)推理能力,為EtherCAT網(wǎng)絡(luò)提
    的頭像 發(fā)表于 10-30 15:35 ?699次閱讀
    在高性能 AI 平臺(tái)上部署 EtherCAT 主站:<b class='flag-5'>實(shí)測(cè)</b><b class='flag-5'>低</b>抖動(dòng)、<b class='flag-5'>低</b>占用方案

    國(guó)產(chǎn)AI芯片真能扛住“內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?

    反而壓到了310W。更有意思的是它的異構(gòu)架構(gòu):NPU+CPU+DVPP的組合,居然能同時(shí)扛住訓(xùn)練和推理場(chǎng)景,之前做自動(dòng)駕駛算法時(shí),用它跑模型時(shí)直接降了20%。 但疑惑也有:這種
    發(fā)表于 10-27 13:12

    光交換機(jī):納秒速率、時(shí)與高密度端口重構(gòu)AI網(wǎng)絡(luò)

    速率(光電交換機(jī)可達(dá)納秒級(jí),光機(jī)械交換機(jī)達(dá)毫秒級(jí))、時(shí)架構(gòu)(時(shí)低于10微秒)、高能效(功耗較InfiniBand或以太網(wǎng)方案降低65
    的頭像 發(fā)表于 09-26 09:11 ?7996次閱讀

    與電力的終極博弈,填上了AIDC的“電力黑洞”

    ),專注于提供人工智能訓(xùn)練與推理所需的服務(wù)、數(shù)據(jù)服務(wù)和算法服務(wù)。AIDC采用異構(gòu)計(jì)算架構(gòu),結(jié)合GPU、FPGA、ASIC等多種AI加速芯片,形成高并發(fā)分布式系統(tǒng),以滿足大模型訓(xùn)練和推理
    的頭像 發(fā)表于 09-22 02:43 ?9050次閱讀

    科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型

    北京2025年7月30日 /美通社/ -- 近日,北京積科技有限公司(以下簡(jiǎn)稱"積科技")宣布其服務(wù)平臺(tái)上線赤兔
    的頭像 發(fā)表于 07-30 21:44 ?1075次閱讀

    RoCE網(wǎng)絡(luò)規(guī)劃還在手動(dòng)IP?這套工具讓運(yùn)維效率飆升

    隨著AI集群規(guī)模指數(shù)級(jí)增長(zhǎng),網(wǎng)絡(luò)架構(gòu)復(fù)雜度陡增。傳統(tǒng)網(wǎng)絡(luò)規(guī)劃依賴人工計(jì)算與經(jīng)驗(yàn)判斷,存在效率、易出錯(cuò)、可視化弱三大痛點(diǎn)。尤其在RoCE(RDMA over Converged E
    的頭像 發(fā)表于 06-30 14:33 ?2164次閱讀
    <b class='flag-5'>RoCE</b>網(wǎng)絡(luò)規(guī)劃還在手動(dòng)<b class='flag-5'>算</b>IP?這套工具讓運(yùn)維效率飆升
    梧州市| 额敏县| 荥经县| 宝山区| 沈阳市| 团风县| 沙田区| 柯坪县| 民乐县| 水城县| 扶沟县| 潢川县| 衡山县| 平原县| 宁陵县| 英超| 华池县| 台安县| 灵山县| 徐州市| 合山市| 乐至县| 西丰县| 丽水市| 库伦旗| 贵定县| 张家口市| 纳雍县| 墨脱县| 伊川县| 荣成市| 宁远县| 肇州县| 天等县| 山阳县| 资阳市| 黔西县| 通辽市| 莲花县| 盐山县| 霍邱县|