自適應路由交換是一種智能的網(wǎng)絡數(shù)據(jù)轉(zhuǎn)發(fā)技術(shù)。它能夠讓網(wǎng)絡設備(如路由器、交換機)實時地根據(jù)當前網(wǎng)絡的狀況(如鏈路擁堵、故障),自動地、動態(tài)地為數(shù)據(jù)包選擇一條最優(yōu)的傳輸路徑。
深入理解:與傳統(tǒng)方式的對比
自適應路由交換也可以稱為“動態(tài)路由交換”為了更好地理解“自適應”,我們先來了解一下什么是靜態(tài)路由交換。
靜態(tài)路由交換
工作方式:網(wǎng)絡管理員手動配置好固定的路徑。比如,命令數(shù)據(jù)從A到B必須經(jīng)過路徑C ( A -> C -> B)
- 優(yōu)點:不消耗設備計算資源。
- 缺點:不靈活。如果路徑中的C點發(fā)生故障或者嚴重擁堵,數(shù)據(jù)包依然會“固執(zhí)地”試圖走這條路徑,導致通信中斷或延遲,直到管理員手動修改配置。
它是構(gòu)建中小型網(wǎng)絡或特定網(wǎng)絡區(qū)域的經(jīng)典、可靠且低成本的方法。但在大型、動態(tài)的網(wǎng)絡中,通常會被動態(tài)路由協(xié)議所取代或補充。
自適應路由交換
工作方式:網(wǎng)絡設備之間會運行動態(tài)路由協(xié)議(如 OSPF, BGP 等)。這些協(xié)議會讓設備互相通信,告知彼此自己所連接的鏈路狀態(tài)、帶寬、延遲等信息。每個設備都會根據(jù)這些信息,建立一個“網(wǎng)絡地圖”。
- 優(yōu)點:靈活、智能、高可靠性,容錯率高當某條鏈路中斷時,設備能立刻從“地圖”上發(fā)現(xiàn),并在毫秒級內(nèi)自動將數(shù)據(jù)流轉(zhuǎn)發(fā)到其他可用路徑??梢酝瑫r利用多條路徑來傳輸數(shù)據(jù),避免單條鏈路擁堵,提升整體網(wǎng)絡效率。
- 缺點:配置相對復雜,設備需要消耗計算資源來運行路由算法和交換信息。
自適應路由交換的關(guān)鍵機制都有哪些?
網(wǎng)絡狀態(tài)感知
只有準確感知網(wǎng)絡狀態(tài),才能實現(xiàn)自適應的路由選擇。
- 隊列深度:交換機會持續(xù)監(jiān)控其輸出端口的隊列長度。隊列長度是衡量擁塞程度的最直接、最簡單的指標。
- 鏈路利用率:通過監(jiān)控端口在特定時間窗口內(nèi)的實際流量與理論帶寬的比值來衡量。這有助于了解鏈路的負載情況,為路由決策提供依據(jù)。
- 帶內(nèi)網(wǎng)絡遙測(INT):這是一種先進的感知機制。數(shù)據(jù)包在傳輸過程中會“攜帶”路徑上各節(jié)點的狀態(tài)信息,如延遲、隊列深度等。【鏈接】
- 顯式擁塞通知(ECN):當交換機隊列超過設定的閾值時,它會在經(jīng)過的數(shù)據(jù)包頭部打上標記。這是一種間接的、端到端的感知機制,通過這種方式,發(fā)送端可以根據(jù)擁塞情況調(diào)整發(fā)送速率,避免進一步加重擁塞?!綞CN:顯式擁塞通知機制原理解析】
總的來說,網(wǎng)絡狀態(tài)感知通過以上幾種方式,為自適應路由交換系統(tǒng)提供了全面、準確的網(wǎng)絡狀態(tài)信息。
路由決策
根據(jù)感知到的信息決定數(shù)據(jù)包的走向。
- 集中式?jīng)Q策:一個中央控制器收集全網(wǎng)信息,計算最優(yōu)路徑,并將流表下發(fā)給交換機。
- 分布式?jīng)Q策:每個交換機基于本地信息和來自鄰居交換機的有限信息(如通過PFC暫停幀或特定信令傳遞的信息),自主地做出路由決策不需要依賴中央控制器。
負載均衡
它是決定如何將流量分配到不同路徑上的關(guān)鍵部分,通常有以下幾種方式:解鎖AI數(shù)據(jù)中心潛力:網(wǎng)絡利用率如何突破90%? - 星融元Asterfusion
- 逐流負載均衡:傳統(tǒng)的 ECMP 路由通常采用逐流負載分擔機制,其核心是基于數(shù)據(jù)包的特征字段(例如 IP 五元組等信息)作為計算因子去進行哈希運算,根據(jù)哈希值選擇轉(zhuǎn)發(fā)鏈路。
- 逐包負載均衡:逐包的負載均衡技術(shù)則是將數(shù)據(jù)包均勻地負載到各條鏈路上,又被形象地稱為“數(shù)據(jù)包噴灑”(Packet Spray)。問題在于逐包負載均衡無法保證報文依照原有時序到達接收端。
- Flowlet負載均衡:不同于傳統(tǒng)負載均衡的逐流負載分擔或逐包負載分擔,基于子流的負載均衡不光是對數(shù)據(jù)流進行分割以實現(xiàn)更精細均勻的負載分擔,而且保持了報文到達的時序性。是目前最主流的先進機制。
如何為每個Flowlet選擇“最佳”路徑?
這就是INT發(fā)揮作用的地方了。
與傳統(tǒng)通過SNMP輪詢或NetFlow采樣不同,INT直接將測量指令和數(shù)據(jù)嵌入到正在轉(zhuǎn)發(fā)的數(shù)據(jù)包中。
- 數(shù)據(jù)包在進入網(wǎng)絡時被“植入”一個INT頭部。
- 當該數(shù)據(jù)包經(jīng)過每個支持INT的網(wǎng)絡設備(交換機)時,設備會將自己的信息(如入口/出口時間戳、隊列深度、鏈路利用率等)寫入到這個數(shù)據(jù)包的INT頭部中。
- 最終,接收端或網(wǎng)絡邊緣設備可以將這些信息收集起來,形成一個精確的、逐跳的路徑狀態(tài)視圖。
工作流程示例
- 主機A開始向主機B發(fā)送一個TCP流。
- 第一個數(shù)據(jù)包被標記INT,它經(jīng)過路徑 Switch1 -> Switch2 -> Switch4,并在INT頭中記錄了這條路徑上各交換機的隊列深度。
- INT信息被發(fā)送到控制器。控制器發(fā)現(xiàn)Switch2到Switch4的鏈路隊列很長。
- 此時,TCP流出現(xiàn)了一個短暫的間隙(Flowlet邊界)。
- 當下一個數(shù)據(jù)包(屬于第二個Flowlet)到達Switch1時,控制器已經(jīng)計算出一條新的、不擁塞的路徑:Switch1 -> Switch3 -> Switch4。
- Switch1將所有屬于第二個Flowlet的數(shù)據(jù)包都轉(zhuǎn)發(fā)到Switch3。
- 后續(xù)的Flowlet會重復此過程,始終選擇當前最優(yōu)的路徑。

高效、無損的自適應路由:基于INT的Flowlet 負載均衡技術(shù)
| 技術(shù) | 優(yōu)點 | 缺點 |
| 自適應路由 | 動態(tài)避障,高網(wǎng)絡利用率 | 容易導致數(shù)據(jù)包亂序,損害TCP性能 |
| Flowlet | 細粒度負載均衡,天然避免亂序 | 路由決策依賴準確、及時的網(wǎng)絡狀態(tài)信息 |
| INT | 提供精確、實時、逐跳的網(wǎng)絡狀態(tài)信息 | 增加數(shù)據(jù)包開銷,需要硬件支持 |
CX-N系列RoCE交換機 支持基于INT的Flowlet非常先進的數(shù)據(jù)中心網(wǎng)絡負載均衡技術(shù),它巧妙地結(jié)合了三者的優(yōu)勢:
- 利用 Flowlet 解決了自適應路由的亂序問題。
- 利用 INT 為Flowlet路由提供了精準、及時的決策依據(jù)。
最終實現(xiàn)了高效、無損的自適應路由,顯著提升了大規(guī)模數(shù)據(jù)中心網(wǎng)絡的性能。
-
數(shù)據(jù)中心
+關(guān)注
關(guān)注
18文章
5780瀏覽量
75214 -
Int
+關(guān)注
關(guān)注
0文章
27瀏覽量
16499
發(fā)布評論請先 登錄
適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡
小型數(shù)據(jù)中心晶振選型關(guān)鍵參數(shù)全解
中型數(shù)據(jù)中心中的差分晶體振蕩器應用與匹配方案
數(shù)據(jù)中心子系統(tǒng)的組成
如何在降低TCO的同時提高數(shù)據(jù)中心性能?
未來數(shù)據(jù)中心與光模塊發(fā)展假設
數(shù)據(jù)中心是什么
什么是數(shù)據(jù)中心
添加熱監(jiān)控電路降低數(shù)據(jù)中心的能耗
什么是數(shù)據(jù)中心?關(guān)于數(shù)據(jù)中心的關(guān)鍵技術(shù)
通過NVIDIA Spectrum Ethernet的自適應路由加速網(wǎng)絡
通過博通和希捷實現(xiàn)卓越的數(shù)據(jù)中心性能雙執(zhí)行器硬盤存儲
賽靈思Alveo數(shù)據(jù)中心智能網(wǎng)卡自適應加速解決方案
基于INT與Flowlet的自適應路由:提升數(shù)據(jù)中心性能的關(guān)鍵
評論