日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

揭秘超以太網聯(lián)盟(UEC)1.0 規(guī)范最新進展(2024Q4)

星融元 ? 來源:jf_55437772 ? 作者:jf_55437772 ? 2024-11-18 16:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近期,由博通、思科、Arista、微軟、Meta等國際頂級半導體、設備和云廠商牽頭成立的超以太網聯(lián)盟(UEC)在OCP Global Summit上對外公布其最新進展——UEC規(guī)范1.0的預覽版本。讓我們一睹為快吧!

UEC 旨在提出一種“升級版”的以太網通信協(xié)議棧用以應對AI智算、HPC等領域對RDMA網絡的性能挑戰(zhàn)——當前大規(guī)模計算節(jié)點互聯(lián)場景下主要有InfiniBand和基于以太網協(xié)議的RoCE兩大技術路線。有關IB和RoCE協(xié)議棧的詳盡對比可參閱:

[高性能網絡傳輸:RoCE與IB協(xié)議棧對比解析]
相比較為封閉的IB架構,以太網在互操作性和帶寬成本上的優(yōu)勢已在市場層面得到了廣泛認可,尤其是大規(guī)模的AI算力中心場景。當前全球TOP500的超級計算機中RoCE和IB的占比相當,以端口帶寬總量計算,IB占比為39.2%,RoCE已達48.5%。

盡管IB和RoCE在高性能傳輸?shù)膿砣刂?、QoS皆有應對設計,但也暴露出一些缺陷。例如亂序需要重傳、不夠完美的負載分擔、Go-back-N問題,DCQCN 部署調優(yōu)復雜等等。

面向GPU Scale-out網絡的UEC 1.0 規(guī)范從軟件API、運輸層到鏈路層以及網絡安全和擁塞控制皆有涉及,較傳統(tǒng)RDMA網絡有了大量改進,我們將挑出重點介紹。

什么是超級以太網系統(tǒng)

一個超級以太網系統(tǒng)的組成如下。一個集群(Cluster)由節(jié)點(Node)和網絡(Fabric)組成,節(jié)點通過網卡(Fabric Interface)連接到網卡,一個網卡中可以有多個邏輯的網絡端點(Fabric End Point,F(xiàn)EP)。網絡由若干平面(Plane)組成,每個平面是多個FEP的集合,通常通過交換機互聯(lián)。

超以太網協(xié)議棧概覽

? 物理層與傳統(tǒng)以太網完全兼容,可選支持FEC(前向糾錯)統(tǒng)計功能

? 鏈路層可選支持鏈路層重傳(LLR),并支持包頭壓縮,為此擴展了LLDP的協(xié)商能力

? 網絡層依然是IP協(xié)議,沒有變化

? 傳輸層是全新的,作為UEC協(xié)議棧的核心數(shù)據(jù)包傳輸子層(Packet Delivery)和消息語義子層(Message Semantics)。包傳輸子層實現(xiàn)新一代擁塞控制、靈活的包順序等功能,消息語義子層支持xCCL和MPI等消息。可選支持安全傳輸。另外,在網集合通信(In Network Collective,INC)也在這一層實現(xiàn)

? ** 軟件API層** 。提供UEC擴展的Libfabrics 2.0

物理層

UEC 1.0規(guī)范下的物理層與傳統(tǒng)以太網(符合IEEE802.3標準)完全兼容,支持每通道100Gbps和200Gbps速率,在此基礎上實現(xiàn)800Gbps和更高的端口速率。

另外可選支持物理層性能指標統(tǒng)計功能(PHY metrics)。這些指標基于 FEC 碼字進行計算,不受流量模式和鏈路利用率的影響。估計算法基于FEC錯誤計數(shù)器的數(shù)據(jù),從而得出不可糾正錯誤率(UCR )和數(shù)據(jù)包錯誤平均間隔(MTBPE)。這些指標衡量了物理層的傳輸性能和可靠性,用于上層的遙測和擁塞控制等。為了支持新的 UEC 鏈路層功能,UEC規(guī)范中也對協(xié)調子層(RS)進行了相應的修改。

鏈路層

UEC鏈路層最大的變化是引入了LLR(Link Level Retry)協(xié)議。它可以讓以太網不依賴PFC,實現(xiàn)無損傳輸。

LLR 機制是基于幀的。每個幀都分配了一個序列號,接收端成功接收這一幀后,檢查幀的序列號是否符合預期,如果正確,發(fā)送確認消息(ACK),如果發(fā)現(xiàn)幀亂序或者丟失,則發(fā)送否定確認消息 (NACK)。發(fā)送端具有超時機制,用于保證在 NACK 丟失時重傳。

傳輸層:UET,新一代協(xié)議棧的核心

前文提過,傳統(tǒng)的RDMA網絡傳輸層(包括IB和RoCE)在多路徑傳輸、負載分擔、擁塞控制以及參數(shù)調優(yōu)等方面存在著不足之處。隨著AI/HPC集群規(guī)模增長,網絡的確定性和可預測性越來越困難,需要全新的方法來解決。

UEC傳輸層(UEC Transport Layer,簡稱UET)運行在IP和UDP協(xié)議之上, 支持實現(xiàn)以下幾大技術目標:

? 支持高達 100 萬個 GPU/TPU 的算力集群

? 往返時間低于 10μs

? 單接口帶寬800Gbps及以上

? 網絡利用率超過85%

選擇性重傳

(Selective Retransmit)

傳統(tǒng)傳輸協(xié)議,如TCP需要嚴格的傳輸順序,并采用了Go-Back-N機制。而一個RDMA消息通常包含多個數(shù)據(jù)包,只要有一個數(shù)據(jù)包錯誤,則從這個數(shù)據(jù)包起的所有數(shù)據(jù)包都要重傳。這讓偶爾的傳輸錯誤被放大,加劇了網絡擁塞。UEC采用選擇性重傳機制,僅傳輸錯誤的數(shù)據(jù)包。

亂序交付

(Out-of-Order Delivery)

UET不僅支持有序傳輸,也支持無序傳輸。這是因為現(xiàn)代網絡中通常有多路徑存在,同一個流的數(shù)據(jù)包經過不同路徑傳輸,就可能造成亂序。如果還要求嚴格的順序傳輸,就無法利用多路徑來實現(xiàn)負載分擔。此外,選擇性重傳也需要無序傳輸?shù)闹С?。為了實現(xiàn)無序傳輸,需要接收方有更大的數(shù)據(jù)包緩沖區(qū),從而將亂序的數(shù)據(jù)包組成一個完整的RDMA消息。

UET支持四種傳輸方式:

? ROD (Reliable Ordered Delivery)

– 需要擁塞控制、有序、可靠、無重傳(依舊采用Go-Back-N)

? RUD (Reliable Unordered Delivery)

– 需要擁塞控制、無序、可靠、無重傳

? RUDI (RUD for Idempotent Operations)

– 可選擁塞控制、無序、可靠、重傳

? UUD (Unreliable Unordered Delivery)

– 可選擁塞控制、無序、不可靠、重傳

包噴灑

(Packet Spraying)

包噴灑是一種基于包的多路徑傳輸。由于傳統(tǒng)傳輸協(xié)議不支持無序傳輸,同一個數(shù)據(jù)流必須按照同一個路徑傳輸,否則就會造成亂序,引發(fā)重傳。而在AI/HPC應用中,存在大量的“大象流”,它們數(shù)據(jù)量大、持續(xù)時間長,如果能使用多路徑傳輸一個流,將顯著提高整個網絡的利用率。

由于支持了RUD,UET就可以將同一個流的不同包分散到多個路徑上同時傳輸,實現(xiàn)包噴灑功能。這讓交換機可以充分發(fā)揮ECMP甚至WCMP(Weighted Cost Multi- Pathing)路由能力,將去往同一目的地的數(shù)據(jù)包通過多條路徑發(fā)送,大幅度提高網絡利用率。

擁塞控制

(Congestion Control)

UET 擁塞控制包含以下重要特性,由端側硬件和交換機配合完成,有效減小了尾部延遲。

? **Incast管理。**它用于解決集合通信(Collective)中下行鏈路上的扇入問題。AI和HPC應用經常采用集合通信在多個節(jié)點之間同步信息,當多個發(fā)送者同時向一個接收者發(fā)送流量,就會產生Incast擁塞。

? **速率調整加速。**現(xiàn)有的擁塞控制算法,在發(fā)生網絡擁塞后調整速率的過程較長,而 UET 可以快速上升到線速。方法是測量端到端延遲來調節(jié)發(fā)送速率,以及根據(jù)接收方的能力通知發(fā)送方調整速率。

? **基于遙測。**源自網絡的擁塞信息可以通告擁塞的位置和原因,縮短擁塞信令路徑并向終端節(jié)點提供更多信息,從而實現(xiàn)響應速度更快的擁塞控制。

? 基于包噴灑的自適應路由 。當擁塞發(fā)生時,通過包噴灑技術將流量重新路由到其它路徑上,繞過擁塞點。

端到端的安全

UEC在傳輸層內置安全。它是基于作業(yè)(Job)的,可以對整個作業(yè)的流量進行端到端的AES加密,充分利用 IPSec 和PSP(Packet Security Protocol)的能力,減小安全加密的開銷,提供可擴展安全域,并且可以由硬件卸載。

在網計算

(In Network Collectives)

在網計算最早應用在HPC集群,業(yè)界主要有兩個思路,一是基于網卡的,二是基于交換機。

UEC V1.0 的目標是后者,即將集合操作卸載到各級交換機上完成,避免過多的收發(fā)次數(shù),降低節(jié)點交互頻率和處理時延開銷,減少約一半數(shù)據(jù)傳輸量,從而加速All-Reduce操作。

在部署實現(xiàn)上,目前AI智算領域唯一大規(guī)模商用的案例僅有英偉達的SHARP(在ASIC層面實現(xiàn)的硬件加速),以太網設備廠家仍處在探索階段,例如將算力內置于交換機或外接,甚至P4可編程都是可能的思路方向。

軟件層:Extended Libfabrics 2.0

在軟件層,UEC提供簡化的API。它簡化了RDMA操作,并為AI和HPC應用提供專用的API,如xCCL, MPI, PGAS和OpenShmem等。

硬件升級:支持UEC的交換機和網卡

UEC在規(guī)范中定義了支持超級以太網交換機的架構,可以看到大體是繼承了SONiC的架構。這部分的主要關注在于控制平面上支持INC和SDN控制器;數(shù)據(jù)平面升級了SAI(Switch Abstraction Interface)API調用硬件提供的INC等能力。

UEC同樣定義了網絡端點(Fabric End Point)的軟硬件架構。在硬件層,網卡升級支持UEC功能。在操作系統(tǒng)內核態(tài),實現(xiàn)網卡驅動。在用戶態(tài),基于libfabric擴展實現(xiàn)INC管理等功能,支持上層的xCCL/MPI/SHMEM等應用。

總的來說,UEC v1.0規(guī)范重構了數(shù)據(jù)中心以太網以完全替代傳統(tǒng)的RDMA網絡,用更高的性能、更低的成本實現(xiàn)穩(wěn)定可靠、具有百萬節(jié)點的AI/HPC集群。

星融元RoCE交換機與UEC

作為UEC成員單位,星融元提供的超低時延RoCE交換機(CX-N系列)全系采用高性能的標準白盒網絡硬件,搭載為生產環(huán)境深度調優(yōu)的企業(yè)級SONiC發(fā)行版——多項 Easy RoCE 特性,全面兼容現(xiàn)有規(guī)范并提供靈活、廣大的升級空間,未來將平滑演進與新一代以太網標準保持同步。

[搶先圍觀!星融元51.2T 800G RoCE交換機測試]

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 以太網
    +關注

    關注

    41

    文章

    6203

    瀏覽量

    181624
  • 通信
    +關注

    關注

    18

    文章

    6457

    瀏覽量

    140284
  • 網絡
    +關注

    關注

    14

    文章

    8340

    瀏覽量

    95601
  • RDMA
    +關注

    關注

    0

    文章

    102

    瀏覽量

    9669
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    是德科技與Broadcom合作完成新一代鏈路層技術驗證

    是德科技(NYSE: KEYS )近日宣布,在OFC 2026上,該公司與Broadcom合作成功完成了業(yè)界首個基于以太網聯(lián)盟UEC規(guī)范、在800GE線速下實現(xiàn)鏈路層重傳(LLR
    的頭像 發(fā)表于 03-20 09:58 ?478次閱讀

    連接標準聯(lián)盟正式發(fā)布Aliro 1.0規(guī)范

    連接標準聯(lián)盟(CSA)正式發(fā)布Aliro 1.0規(guī)范。作為一套全新通信協(xié)議與憑證標準,Aliro將徹底改變用戶在生活各類場景中與門禁設備的交互方式。盡管智能門鎖解鎖的便捷性備受關注,但 Aliro 的愿景更為宏大:旨在打通辦公大
    的頭像 發(fā)表于 03-02 15:57 ?717次閱讀

    國芯科技DPNPU新IP產品最新進展,單核支持0.5~4.8TOPS靈活算力配置

    國芯科技DPNPU新IP產品 最新進展,單核支持0.5~4.8TOPS 靈活算力配置 ? 電子發(fā)燒友網綜合報道 國芯科技發(fā)布公告稱,其自主研發(fā)的神經網絡處理器DPNPU(Dataflow
    的頭像 發(fā)表于 01-09 09:19 ?5563次閱讀
    國芯科技DPNPU新IP產品<b class='flag-5'>最新進展</b>,單核支持0.5~4.8TOPS靈活算力配置

    從協(xié)議到實踐——EtherNet/IP與NetStaX的最新進展

    從協(xié)議到實踐——EtherNet/IP與NetStaX的最新進展
    的頭像 發(fā)表于 12-19 15:26 ?1732次閱讀
    從協(xié)議到實踐——EtherNet/IP與NetStaX的<b class='flag-5'>最新進展</b>

    汽車以太網PHY新秀:DP83TG721-Q1深度解析

    汽車以太網PHY新秀:DP83TG721-Q1深度解析 在汽車電子領域,以太網技術的應用正日益廣泛,對高性能以太網物理層收發(fā)器的需求也愈發(fā)迫切。德州儀器(TI)推出的DP83TG721
    的頭像 發(fā)表于 12-15 17:25 ?2704次閱讀

    DP83TC816-Q1:汽車級以太網PHY收發(fā)器的卓越之選

    DP83TC816-Q1:汽車級以太網PHY收發(fā)器的卓越之選 在汽車電子領域,隨著智能化和網聯(lián)化的發(fā)展,以太網技術的應用越來越廣泛。今天,我們就來深入了解一款優(yōu)秀的汽車級
    的頭像 發(fā)表于 12-15 14:15 ?694次閱讀

    芯科科技分享在物聯(lián)網領域的最新進展

    Labs(芯科科技)亞太區(qū)業(yè)務副總裁王祿銘、中國大陸區(qū)總經理周巍及臺灣區(qū)總經理寶陸格就公司技術路線、產品策略及市場趨勢回答了媒體提問。三位高管圍繞安全認證、無線連接、邊緣計算等議題,介紹了公司在物聯(lián)網領域的最新進展。
    的頭像 發(fā)表于 11-13 10:48 ?2023次閱讀

    DisplayPort汽車擴展標準新進展,顯示系統(tǒng)靈活性和效率大幅提升

    電子發(fā)燒友網報道(文/李彎彎)2025年10月27日,VESA(視頻電子標準協(xié)會)在深圳益田威斯汀酒店舉辦新聞發(fā)布會,詳細介紹了DisplayPort汽車擴展標準(DP AE)的最新進展,同時分享了
    的頭像 發(fā)表于 11-08 10:43 ?1.1w次閱讀
    DisplayPort汽車擴展標準<b class='flag-5'>新進展</b>,顯示系統(tǒng)靈活性和效率大幅提升

    上海光機所在激光驅動離子加速方面取得新進展

    圖1 實驗原理示意圖 近期,中國科學院上海光學精密機械研究所超強激光科學與技術全國重點實驗室賓建輝研究員團隊在激光驅動離子加速方面取得新進展。相關研究成果分別以“Enhanced proton
    的頭像 發(fā)表于 08-06 09:36 ?757次閱讀
    上海光機所在激光驅動離子加速方面取得<b class='flag-5'>新進展</b>

    芯科科技攜手連接標準聯(lián)盟亮相2025廣州建博會

    )的聯(lián)合展示區(qū),首度登場國內首屈一指的建筑相關行業(yè)應用展覽,共同將智能家居標準Matter的最新進展推廣至中國居建裝全產業(yè)鏈。
    的頭像 發(fā)表于 07-22 17:13 ?1307次閱讀

    AI網絡管理新范式:精要解讀以太網聯(lián)盟UEC1.0 規(guī)范(2025Q2)

    隨著AI與高性能計算(HPC)集群對網絡帶寬、時延和擁塞管理的要求日益嚴苛,傳統(tǒng)以太網在超大規(guī)模場景下面臨瓶頸。為此,以太網聯(lián)盟UEC) 在Linux聯(lián)合開發(fā)基金會(JDF)下成立
    的頭像 發(fā)表于 07-11 18:41 ?2555次閱讀
    AI網絡管理新范式:精要解讀<b class='flag-5'>超</b><b class='flag-5'>以太網聯(lián)盟</b>(<b class='flag-5'>UEC</b>)<b class='flag-5'>1.0</b> <b class='flag-5'>規(guī)范</b>(2025<b class='flag-5'>Q</b>2)

    東風汽車轉型突破取得新進展

    上半年,東風汽車堅定高質量發(fā)展步伐,整體銷量逐月回升,經營質量持續(xù)改善,自主品牌和新能源滲透率和收益性進一步提升,半年累計終端銷售汽車111.6萬輛,轉型突破取得新進展
    的頭像 發(fā)表于 07-10 15:29 ?1073次閱讀

    是德科技解讀IEEE P802.3dj最新以太網標準

    基于1985 年首次發(fā)布的 IEEE Std 802.3 最初標準,IEEE Std 802.3df 和 IEEE P802.3dj 標準代表了以太網標準的最新進展。這些新標準正在為下一代以太網
    的頭像 發(fā)表于 05-30 13:57 ?3621次閱讀
    是德科技解讀IEEE P802.3dj最新<b class='flag-5'>以太網</b>標準

    FMCW激光雷達,工業(yè)應用新進展

    電子發(fā)燒友網報道(文/梁浩斌)FMCW激光雷達有了新進展。近日FMCW激光雷達廠商Aeva宣布,通過與SICK?AG和LMI等工業(yè)自動化領域領導者合作,其應用于工業(yè)自動化的高精度傳感器Eve?1系列
    的頭像 發(fā)表于 05-18 00:02 ?6192次閱讀

    英特爾持續(xù)推進核心制程和先進封裝技術創(chuàng)新,分享最新進展

    近日,在2025英特爾代工大會上,英特爾展示了多代核心制程和先進封裝技術的最新進展,這些突破不僅體現(xiàn)了英特爾在技術開發(fā)領域的持續(xù)創(chuàng)新,也面向客戶需求提供了更高效、更靈活的解決方案。 在制程技術方面
    的頭像 發(fā)表于 05-09 11:42 ?1020次閱讀
    英特爾持續(xù)推進核心制程和先進封裝技術創(chuàng)新,分享<b class='flag-5'>最新進展</b>
    利川市| 济南市| 镇雄县| 开远市| 竹北市| 西吉县| 石家庄市| 平凉市| 海阳市| 桂平市| 常州市| 盐山县| 阳东县| 望城县| 伊金霍洛旗| 木兰县| 金沙县| 安多县| 凤凰县| 云和县| 平定县| 沂水县| 绥阳县| 鞍山市| 罗定市| 小金县| 宁阳县| 台南市| 马边| 子长县| 额尔古纳市| 本溪市| 图木舒克市| 曲沃县| 财经| 丰城市| 泾川县| 滨州市| 大兴区| 泸溪县| 石泉县|