日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA SuperNIC推進現代AI基礎設施發(fā)展

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2024-11-06 13:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在生成式 AI 時代,加速網絡對于為大規(guī)模分布式 AI 工作負載構建高性能計算平臺至關重要。NVIDIA 在加速網絡領域繼續(xù)保持領先地位,提供先進的以太網和 InfiniBand 解決方案,可最大限度地提高 AI 工廠和云數據中心的性能和效率。

這些解決方案的核心是NVIDIA SuperNIC,一種專為超大規(guī)模 AI 工作負載而優(yōu)化的新型網絡加速器。這些 SuperNIC 是NVIDIA Spectrum-X 以太網和Quantum-X800 InfiniBand 網絡平臺的關鍵組件,旨在提供前所未有的可擴展性和性能。

ConnectX-8 SuperNIC 是 NVIDIA SuperNIC 產品系列中的新成員,與 BlueField-3 SuperNIC 一起,共同推動加速的大規(guī)模 AI 計算網絡的新一輪創(chuàng)新浪潮。ConnectX-8 SuperNIC 的總數據吞吐量為 800 Gb/s,可為萬億級參數的 AI 模型提供所需的速度、網絡健壯性和可擴展性,并與 NVIDIA 交換機無縫集成,以實現最佳性能。

本文將探討 NVIDIA SuperNIC 的獨特屬性及其在推進現代 AI 基礎設施發(fā)展方面的關鍵作用。

RoCE 對于 AI 工作負載的重要性

對于 AI 模型訓練來說,在數據中心內的 GPU 之間高速傳輸龐大的數據集是 AI 方案縮短訓練時間和加快上市時間的關鍵。

NVIDIA SuperNIC 具備了出色的硬件 RoCE 加速功能,可實現高達 800 Gb/s 的 GPUDirect RDMA 通信速度,解決了旁路 CPU 在 GPU 之間實現直接數據傳輸面臨的挑戰(zhàn)。

這種直接通信的方法可最大限度地減少 CPU 開銷并降低延遲,在 GPU 顯存之間實現更快、更高效的數據傳輸。在實際應用中,此功能可實現更高的并行度,在 AI 工作負載多節(jié)點擴展時,不會出現傳統(tǒng)的基于 CPU 的數據傳輸常見的的通信瓶頸。

通過 Spectrum-X RoCE 動態(tài)路由

提升 AI 性能

NVIDIA SuperNIC 的直接數據放置(DDP)功能是 Spectrum-X 平臺提升 AI 網絡性能的關鍵之一。

隨著生成式 AI 工作負載擴展到了數千個節(jié)點以上,以等價多路徑(ECMP)為代表的傳統(tǒng) IP 路由協(xié)議再難以處理 AI 模型生成的大規(guī)模、持續(xù)的數據流(俗稱大象流)。這些流可能會使網絡資源不堪重負,并導致?lián)砣?,從而降低整體網絡性能。

Spectrum-X RoCE 動態(tài)路由可以在可用的網絡路徑中動態(tài)調整流量的分配,確保需要高帶寬的流以最佳方式路由,以防止網絡擁塞。該方法利用 NVIDIA Spectrum-4 以太網交換機可在多個路徑上均勻分發(fā)數據包的負載均衡功能,避免了傳統(tǒng)靜態(tài)路由機制造成的瓶頸。

然而,使用這樣的數據包分發(fā)的方式,可能會導致數據包亂序問題的出現。

NVIDIA SuperNIC 通過在數據包到達接收端時將其直接按序放入緩沖區(qū)來解決了這一問題,確保了應用能收到正確順序的數據。這種 NVIDIA 交換機和 SuperNIC 之間的緊密合作,實現了高效、高速的 AI 工作負載通信,確保大規(guī)模 AI 模型能夠持續(xù)地處理數據,而不會中斷或降低性能。

解決 AI 網絡的擁塞問題

由于 AI 工作負載的突發(fā)性,因此極易受到網絡擁塞的影響。AI 模型訓練(尤其是通過集合通信在多個 GPU 之間進行同步和共享數據時)會產生頻繁且短暫流量峰值,這需要先進的擁塞管理機制來保持網絡的性能。傳統(tǒng)的擁塞控制方法(例如基于 TCP 的流量控制)無法處理這種 AI 獨特的流量模型。

為了解決這一問題,Spectrum-X 采用了基于 Spectrum-4 交換機的實時遙測功能的先進擁塞控制機制,使得 SuperNIC 能夠根據當前的網絡利用率主動地調整數據發(fā)送的速率,防止擁塞,避免問題的發(fā)生。

通過使用帶內高頻遙測數據,SuperNIC 可以以微秒級精度作出反應,確保即使在高流量條件下也能優(yōu)化網絡帶寬并盡可能降低延遲。

使用增強的可編程 I/O 加速 AI 網絡

隨著 AI 工作負載日益復雜,網絡基礎設施不僅必須在速度上不斷發(fā)展,還需要在適應性方面進步,以支持數千個節(jié)點之間的各種通信模式。

NVIDIA SuperNIC 處于這項創(chuàng)新的前沿,提供增強的可編程 I/O 功能,這些功能對于現代 AI 數據中心環(huán)境至關重要。這些 SuperNIC 具有加速數據包處理管線,能夠以線速運行,吞吐量高達 800 Gb/s。

通過將數據包處理任務從 CPU 卸載到 SuperNIC,此管道可顯著降低網絡延遲并提高整體系統(tǒng)效率。管道的可編程性由 NVIDIA DOCA 軟件框架提供支持,為網絡專業(yè)人員提供了大規(guī)模構建和優(yōu)化網絡的靈活性。

NVIDIA SuperNIC 采用數據路徑加速器(DPA),可增強可編程性。DPA 是一種高度并行的 I/O 處理器,配備 16 個超線程核心,專為處理 I/O 密集型工作負載而設計。它可以通過 DOCA 針對設備仿真、擁塞控制和流量管理等各種低代碼應用程序輕松進行編程。這種可編程性使組織能夠根據其 AI 工作負載的特定需求定制網絡基礎設施,確保數據在保持峰值性能的同時跨網絡高效流動。

保護 AI 網絡連接

保護 AI 模型對于保護敏感數據和知識產權免遭潛在的漏洞和對抗性攻擊至關重要。當您的組織構建 AI 工廠和云數據中心時,您需要有效的安全解決方案來解決可能損害模型性能和可信度的漏洞,最終保護競爭優(yōu)勢和用戶隱私。

傳統(tǒng)的網絡加密方法通常難以擴展到 100 Gb/s 以上,從而使關鍵數據處于危險之中。相比之下,NVIDIA SuperNIC 可提供加速網絡和在線加密加速,速度高達 800 Gb/s,確保數據在傳輸過程中保持加密狀態(tài),同時實現峰值 AI 性能。

NVIDIA SuperNIC 為 IPsec、TLS 和可擴展的 PSP 加密操作提供硬件加速支持,為保護人工智能網絡環(huán)境提供成熟的解決方案。

PSP 由 Google 開發(fā),并為開源社區(qū)做出了貢獻。PSP 從一開始就采用無狀態(tài)設計,非常適合支持超大規(guī)模數據中心環(huán)境的需求。該架構允許獨立處理每個請求,從而增強在分布式系統(tǒng)中管理加密操作的可擴展性和彈性。

結束語

在生成式 AI 的動態(tài)格局中,NVIDIA SuperNIC 作為 NVIDIA Spectrum-X 和 Quantum-X800 網絡平臺不可或缺的一部分,為網絡的變革時代奠定了基礎。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5696

    瀏覽量

    110144
  • 網絡
    +關注

    關注

    14

    文章

    8340

    瀏覽量

    95611
  • AI
    AI
    +關注

    關注

    91

    文章

    41397

    瀏覽量

    302753

原文標題:NVIDIA SuperNIC 驅動新一代 AI 網絡發(fā)展

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Arm攜手Google Cloud推進代理式AI基礎設施規(guī)?;涞?/a>

    Kubernetes Engine (GKE) 上線 Agent Sandbox。作為定制化部署框架,它能夠高效、安全地運行復雜的多步驟 AI 系統(tǒng)。這套全新的代理式基礎設施,搭載Google 基于 Arm
    的頭像 發(fā)表于 05-06 09:41 ?269次閱讀
    Arm攜手Google Cloud<b class='flag-5'>推進</b>代理式<b class='flag-5'>AI</b><b class='flag-5'>基礎設施</b>規(guī)?;涞? />    </a>
</div>                              <div   id=

    NVIDIA與Google Cloud攜手推進代理式與物理AI發(fā)展

    NVIDIA Blackwell GPU 以及由 NVIDIA Nemotron 和 NeMo 提供支持、基于 Gemini Enterprise Agent Platform 的代理式 AI 來構建
    的頭像 發(fā)表于 04-27 15:35 ?428次閱讀

    NVIDIA與電信領導企業(yè)共建AI網格

    AT&T、T-Mobile、Comcast、Spectrum 等公司正在使用 NVIDIA AI 基礎設施構建 AI 網格,Personal AI
    的頭像 發(fā)表于 04-10 16:16 ?350次閱讀

    現代汽車和起亞與NVIDIA深化戰(zhàn)略合作

    GTC — NVIDIA 宣布深化與現代汽車集團 (下稱現代汽車) 和起亞的合作,共同推進基于 NVIDIA DRIVE Hyperion?
    的頭像 發(fā)表于 03-19 15:44 ?438次閱讀

    NVIDIA發(fā)布Vera Rubin DSX AI Factory參考設計

    NVIDIA 今日宣布推出 NVIDIA Vera Rubin DSX AI Factory 參考設計,這是一份用于構建協(xié)同設計的 AI 基礎設施
    的頭像 發(fā)表于 03-18 14:42 ?683次閱讀

    華為推動電信云加速向AI基礎設施演進

    隨著AI技術持續(xù)突破,人工智能正成為全球產業(yè)升級的核心驅動力。從通用大模型到行業(yè)智能應用,AI已成為新一輪科技變革和產業(yè)升級的核心驅動力。業(yè)界正加快推進體系化探索,圍繞AI
    的頭像 發(fā)表于 02-27 09:43 ?434次閱讀

    NVIDIA BlueField-4數據處理器重塑新型AI原生存儲基礎設施

    NVIDIA 宣布,NVIDIA BlueField?-4 數據處理器作為全棧 NVIDIA BlueField 平臺的一部分,為 NVIDIA 推理上下文記憶存儲平臺提供支持,這是一
    的頭像 發(fā)表于 01-09 10:33 ?657次閱讀

    NVIDIA攜手OpenAI構建AI基礎設施

    NVIDIA 首席執(zhí)行官黃仁勛、OpenAI 首席執(zhí)行官 Sam Altman 和 OpenAI 總裁 Greg Brockman 宣布了一項新的合作伙伴關系,旨在推動 OpenAI 的發(fā)展,并支持幾乎所有行業(yè)和用戶大規(guī)模使用 AI
    的頭像 發(fā)表于 09-23 14:38 ?1118次閱讀

    NVIDIA通過全新 Omniverse庫、Cosmos物理AI模型及AI計算基礎設施,為機器人領域開啟新篇章

    NVIDIA 通過全新 Omniverse 庫、Cosmos 物理 AI 模型及 AI 計算基礎設施,為機器人領域開啟新篇章 ? ·?全新 NVID
    的頭像 發(fā)表于 08-12 11:29 ?2035次閱讀
    <b class='flag-5'>NVIDIA</b>通過全新 Omniverse庫、Cosmos物理<b class='flag-5'>AI</b>模型及<b class='flag-5'>AI</b>計算<b class='flag-5'>基礎設施</b>,為機器人領域開啟新篇章

    NVIDIA DOCA 3.0版本的亮點解析

    NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎設施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發(fā)布,每
    的頭像 發(fā)表于 07-04 14:27 ?1418次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA 3.0版本的亮點解析

    Arm如何助力AI基礎設施變革

    眾所周知,人工智能 (AI) 有望革新人類活動的方方面面。然而,要充分釋放這一潛力,就必須面對一個基本事實:支撐傳統(tǒng)計算的基礎設施已無法滿足未來 AI 發(fā)展的需求。
    的頭像 發(fā)表于 07-03 14:29 ?1164次閱讀

    NVIDIA技術助力企業(yè)創(chuàng)建主權AI智能體

    AI Factory 的經驗證設計將加速基礎設施與軟件(包括全新 NVIDIA NIM 微服務和經擴展的 NVIDIA Blueprint)相結合,為各國和企業(yè)簡化了全棧式
    的頭像 發(fā)表于 06-16 14:28 ?1557次閱讀

    歐洲聯(lián)手NVIDIA打造AI基礎設施

    NVIDIA 于近日宣布,其正在攜手歐洲各國、科技和行業(yè)領導者,共同建造 NVIDIA Blackwell AI 基礎設施,以強化數字主權、支撐經濟增長,并推動歐洲大陸成為
    的頭像 發(fā)表于 06-16 14:25 ?1683次閱讀

    維諦加速推進人工智能基礎設施演進,助力NVIDIA 800 VDC 電源架構發(fā)布

    :VRT)今日宣布與NVIDIA在人工智能發(fā)展路線圖方面達成高度戰(zhàn)略協(xié)同。NVIDIA發(fā)布全新規(guī)劃,旨在為下一代AI數據中心部署800VDC電源基礎
    的頭像 發(fā)表于 05-22 14:18 ?1327次閱讀
    維諦加速<b class='flag-5'>推進</b>人工智能<b class='flag-5'>基礎設施</b>演進,助力<b class='flag-5'>NVIDIA</b> 800 VDC 電源架構發(fā)布

    NVIDIA CEO黃仁勛展望AI基礎設施產業(yè)

    NVIDIA CEO 黃仁勛在 COMPUTEX 的主題演講中,描繪了 AI 未來的宏偉愿景,同時展示了新平臺與新合作。
    的頭像 發(fā)表于 05-22 10:11 ?1004次閱讀
    山东省| 溧水县| 浦北县| 漯河市| 华宁县| 邵阳市| 偃师市| 南平市| 大新县| 延津县| 商都县| 黔南| 正宁县| 昌邑市| 博兴县| 红原县| 长沙市| 贞丰县| 千阳县| 井陉县| 进贤县| 杭州市| 肇源县| 波密县| 澄迈县| 霸州市| 韩城市| 屏东县| 濉溪县| 凤冈县| 盘山县| 高州市| 祁连县| 延长县| 陆良县| 澄江县| 无极县| 聂荣县| 上虞市| 镇雄县| 溧水县|