日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DGX-2為什么被稱為全球最大GPU

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:未知 ? 作者:胡薇 ? 2018-10-25 15:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今年早些時(shí)候,NVIDIA首席執(zhí)行官黃仁勛發(fā)布了NVIDIA? DGX-2?服務(wù)器,并稱其為“全球最大GPU”。DGX-2在單一系統(tǒng)中包含了16個(gè)NVIDIA Tesla? V100 32 GB GPU和其他頂級(jí)組件(兩個(gè)24核Xeon CPU、1.5 TB DDR4 DRAM內(nèi)存和30 TB NVMe存儲(chǔ)),通過基于NVSwitch的NVLink結(jié)構(gòu)連接,可提供2 petaFLOPS的性能,堪稱最強(qiáng)大的超級(jí)計(jì)算機(jī)之一。

NVSwitch使DGX-2成為了最大的GPU,這意味著其總體并非各部分的簡單加成。事實(shí)證明,讓DGX-2服務(wù)器能夠稱得上“全球最大GPU”的,正是其中看似最不起眼的部分。讓我們來看看創(chuàng)新NVIDIA NVSwitch?芯片及其他工程特性如何使DGX-2成為了全球最大的GPU。

注:本文中的信息來自于Alex Ishii 和 Denis Foley 在Hot Chip 2018大會(huì)上的專題演示“NVSwitch and DGX?2 – NVIDIA NVLink-Switching Chip and Scale-Up GPU-Compute Server”。

單一GPU

讓我們先看看單一多核GPU如何與CPU交互,如圖1所示。程序員通過NVIDIA CUDA?技術(shù)明確地展現(xiàn)了并行工作。工作流經(jīng)PCIe I / O端口進(jìn)入GPU,其中數(shù)據(jù)由GPU驅(qū)動(dòng)程序分發(fā)到可用的圖形處理群集(GPC)和流式多處理器(SM)內(nèi)核。XBAR的采用讓GPU / SM內(nèi)核能夠在L2高速緩存和高帶寬GPU內(nèi)存(HBM2)上交換數(shù)據(jù)。

GPC和GPU內(nèi)存之間的高帶寬可實(shí)現(xiàn)大規(guī)模計(jì)算能力和快速同步,但規(guī)模受限,因其要求數(shù)據(jù)必須適合本地GPU內(nèi)存,才能有效使用XBAR提供的高帶寬。

圖1. 連接到CPU的單一GPU

雙GPU(PCIe和NVLink)

圖2顯示了添加另一個(gè)GPU是如何增加可用GPU內(nèi)存量的。在所示配置中,GPU只能以PCIe提供的32 GBps的最大雙向帶寬,訪問其他GPU上的內(nèi)存。此外,這些交互會(huì)與總線上的CPU操作競(jìng)爭,甚至進(jìn)一步占用可用帶寬。

圖2. 通過PCIe總線連接的雙GPU

NVIDIA NVLink?技術(shù)使GPC無需通過PCIe總線即可訪問遠(yuǎn)程GPU內(nèi)存,如圖3所示。NVLinks實(shí)現(xiàn)了XBAR之間的有效橋接。V100 GPU上最多可采用六個(gè)NVLink,GPU之間的雙向帶寬可達(dá)300 GBps。但是,在具有兩個(gè)以上GPU的系統(tǒng)中,六個(gè)可用的NVLink必須先分成較小的鏈接組,每個(gè)組專用于訪問不同的特定單一GPU。這就限制了可使用直接連接來構(gòu)建的機(jī)器規(guī)模,并降低了每對(duì)GPU之間的帶寬。

圖3. 通過NVLink技術(shù)連接的雙GPU

Super Crossbar將GPU連接在一起

理想的情況是提供某種交叉,讓更多GPU能夠訪問所有GPU內(nèi)存,所有GPU都可能在單一GPU驅(qū)動(dòng)程序?qū)嵗目刂葡?,如圖4所示。有了這樣的交叉,可在沒有其他進(jìn)程干預(yù)的情況對(duì)GPU內(nèi)存進(jìn)行訪問,且可用帶寬將足夠高,可提供類似于上文所述的雙GPU情況下的性能擴(kuò)展。

圖4. 尋找交叉開關(guān)設(shè)備

最終目標(biāo)是提供以下所有內(nèi)容:

更大的問題規(guī)模容量。大小受整個(gè)GPU集合的GPU內(nèi)存容量限制,而非單一GPU容量。

強(qiáng)大的可擴(kuò)展性。與現(xiàn)有解決方案相比,NUMA效應(yīng)將大大降低。總內(nèi)存帶寬實(shí)際上會(huì)隨GPU數(shù)量而增長。

使用便利。針對(duì)較少數(shù)量的GPU編寫的應(yīng)用程序?qū)⒏子谝浦?。此外,豐富的資源可助力快速開展實(shí)驗(yàn)。

以上16-GPU配置(假設(shè)有32GB V100 GPU)產(chǎn)生的總?cè)萘渴蛊淠軌蚯八从械剡\(yùn)行“一個(gè)超強(qiáng)GPU”的計(jì)算。

NVIDIA NVSwitch介紹

NVSwitch(圖5)是一款GPU橋接設(shè)備,可提供所需的NVLink交叉網(wǎng)絡(luò)。端口邏輯模塊中的數(shù)據(jù)包轉(zhuǎn)換使得進(jìn)出多GPU的流量看似是通過單一GPU的。

圖5. 帶有標(biāo)注的NVSwitch芯片裸片

NVSwitch芯片并行運(yùn)行,以支持?jǐn)?shù)量日益增加的GPU之間的互連。可使用三個(gè)NVSwitch芯片構(gòu)建一個(gè)8 GPU封閉系統(tǒng)。兩條NVLink路徑將每個(gè)GPU連接至每臺(tái)交換機(jī),流量在所有NVLink和NVSwitch之間交叉。 GPU使用任意對(duì)之間的300 GBps雙向帶寬成對(duì)通信,因?yàn)镹VSwitch芯片提供了從任何源到任何目的地的唯一路徑。

圖6. NVSwitch框圖

實(shí)現(xiàn)了對(duì)分帶寬

讓每個(gè)GPU從另一個(gè)GPU讀取數(shù)據(jù),而不會(huì)有兩個(gè)GPU從同一遠(yuǎn)程GPU讀取數(shù)據(jù),就實(shí)現(xiàn)了無干擾的成對(duì)通信能力。使用16個(gè)GPU實(shí)現(xiàn)的1.98 TBps讀取帶寬與128B傳輸在理論上80%的雙向NVLink效率相匹配。

圖7. 實(shí)現(xiàn)的對(duì)分帶寬結(jié)果

使用cuFFT(16K X 16K)

實(shí)現(xiàn)更強(qiáng)大的可擴(kuò)展性

通過在越來越多的GPU上(更高的GFLOPS,相應(yīng)的總運(yùn)行時(shí)間卻更短)、以及搭載V100 GPU的NVIDIA DGX-1服務(wù)器上運(yùn)行“iso-problem instance”計(jì)算進(jìn)行對(duì)比,即能證明其強(qiáng)大的可擴(kuò)展性能,如圖8所示。如果沒有NVSwitch網(wǎng)絡(luò)提供的NVLink交叉,由于問題分散在更多GPU上,傳輸數(shù)據(jù)所需的時(shí)間要長于在本地對(duì)相同數(shù)據(jù)進(jìn)行簡單計(jì)算所需的時(shí)間。

圖8. 使用NVLink與Hybrid Cube Mesh的cuFFT結(jié)果

全歸約基準(zhǔn)測(cè)試

圖9也體現(xiàn)了NVLink交叉的優(yōu)勢(shì)。全歸約基準(zhǔn)測(cè)試是對(duì)機(jī)器學(xué)習(xí)應(yīng)用程序中采用的重要通信原語進(jìn)行的測(cè)量。與兩臺(tái)配備八個(gè)GPU的服務(wù)器(通過InfiniBand連接)相比,NVLink交叉讓16 GPU DGX-2服務(wù)器能夠提供更高帶寬和更低延遲。 針對(duì)較小的信息,NVLink網(wǎng)絡(luò)的效率明顯優(yōu)于InfiniBand。

圖9. 全歸約基準(zhǔn)測(cè)試結(jié)果顯示NVLink與InfiniBand帶寬效率的顯著差異

HPC和AI訓(xùn)練基準(zhǔn)測(cè)試的加速

圖10所示,與總GPU數(shù)相同的兩臺(tái)DGX-1(采用V100)服務(wù)器相比,HPC和AI訓(xùn)練基準(zhǔn)測(cè)試性能得以提升,速度達(dá)到了其2到2.7倍。對(duì)比所用的DGX-1服務(wù)器各采用了8個(gè)Tesla V100 32 GB GPU和雙槽Xeon E5 2698v4處理器。服務(wù)器通過四個(gè)EDR IB / GbE端口連接。

圖10. HPC和AI訓(xùn)練基準(zhǔn)測(cè)試的加速

總結(jié)

正因有了NVSwitch芯片,DGX-2才可謂全球最大GPU。NVSwitch是一種暢通無阻的設(shè)備,具有18個(gè)NVLink端口,每端口51.5 GBps,聚合雙向帶寬達(dá)928 GBps。采用了NVSwitch芯片的DGX-2可提供512 GB的總?cè)萘?,針?duì)特定應(yīng)用的性能表現(xiàn)超過InfiniBand連接的一對(duì)DGX-1服務(wù)器的兩倍。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5696

    瀏覽量

    110142
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5283

    瀏覽量

    136105

原文標(biāo)題:全球最大GPU 背后的秘密:NVSwitch如何實(shí)現(xiàn)NVIDIA DGX-2的超強(qiáng)功力?

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    國產(chǎn)來襲!2nm AI GPU?

    的時(shí)間和成本內(nèi)實(shí)現(xiàn)。 ? 近日,據(jù)媒體報(bào)道,上海棣山科技有限公司(以下簡稱“棣山科技”)對(duì)外披露其2nm高端AI GPU芯片最新研發(fā)進(jìn)展。據(jù)悉,該公司自主攻關(guān)的這款芯片已達(dá)到國際前沿設(shè)計(jì)水平,目前核心研發(fā)工作仍處于原型驗(yàn)證關(guān)鍵階段。 ? 國產(chǎn)
    的頭像 發(fā)表于 04-15 07:02 ?8550次閱讀

    首屆中國NVIDIA DGX Spark黑客松大賽開啟報(bào)名

    倒計(jì)時(shí)啟動(dòng)!首屆中國 NVIDIA DGX Spark 黑客松(Hackathon)將于 3 月 13 日 - 3 月 28 日正式開啟報(bào)名!本屆賽事以“算力破局、AI 落地”為核心導(dǎo)向,依托
    的頭像 發(fā)表于 03-14 16:39 ?2752次閱讀

    如何在 VisionFive v2 上使用外部 GPU?

    如果舊的 amd gpu 在 VisionFive V2 上運(yùn)行,我想使用帶有開源 amd 驅(qū)動(dòng)程序的 amd gpu。我需要什么以及如何將 GPU 連接到 VisionFive v
    發(fā)表于 03-13 06:38

    NVIDIA DGX Spark助力高等教育領(lǐng)域重大項(xiàng)目

    全球各地的頂尖高校,NVIDIA DGX Spark 桌面超級(jí)計(jì)算機(jī)正將數(shù)據(jù)中心級(jí)的 AI 能力帶到實(shí)驗(yàn)室臺(tái)前、教師辦公室里和學(xué)生的終端設(shè)備上。在地球最南端的南極,也有一臺(tái) DGX Spark 正在威斯康星大學(xué)麥迪遜分校運(yùn)營的
    的頭像 發(fā)表于 03-09 16:33 ?713次閱讀

    如何在DGX Spark上運(yùn)行NVIDIA Omniverse

    首先感謝 Vigor 同學(xué)第一時(shí)間的分享,以下是具體如何在 DGX Spark 上運(yùn)行 Omniverse 的方法。
    的頭像 發(fā)表于 12-17 10:13 ?968次閱讀
    如何在<b class='flag-5'>DGX</b> Spark上運(yùn)行NVIDIA Omniverse

    NVIDIA DGX Spark系統(tǒng)恢復(fù)過程與步驟

    在使用 NVIDIA DGX Spark 的過程中,可能會(huì)出現(xiàn)配置故障,而導(dǎo)致開發(fā)中斷的問題,本篇教程將帶大家了解如何一步步完成系統(tǒng)恢復(fù)。
    的頭像 發(fā)表于 11-28 09:46 ?6001次閱讀
    NVIDIA <b class='flag-5'>DGX</b> Spark系統(tǒng)恢復(fù)過程與步驟

    NVIDIA DGX Spark助力構(gòu)建自己的AI模型

    2025 年 1 月 6 日,NVIDIA 正式宣布其 Project DIGITS 項(xiàng)目,并于 3 月 18 日更名為 NVIDIA DGX Spark,進(jìn)一步公布了產(chǎn)品細(xì)節(jié)。DGX Spark
    的頭像 發(fā)表于 11-21 09:25 ?1595次閱讀
    NVIDIA <b class='flag-5'>DGX</b> Spark助力構(gòu)建自己的AI模型

    NVIDIA DGX Spark快速入門指南

    NVIDIA DGX Spark 已正式向 AI 開發(fā)者交付,對(duì)于剛?cè)胧值娜?DGX Spark,該如何進(jìn)行初始化設(shè)置?本篇文章將引導(dǎo)您完成 DGX Spark 首次設(shè)置。在初始設(shè)置的過程中,您
    的頭像 發(fā)表于 11-17 14:11 ?7180次閱讀
    NVIDIA <b class='flag-5'>DGX</b> Spark快速入門指南

    NVIDIA黃仁勛向SpaceX馬斯克交付DGX Spark

    革新于星艦基地開始。NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛親手將全球迄今為止最小的 AI 超級(jí)計(jì)算機(jī) NVIDIA DGX Spark 交付給埃隆·馬斯克,拉開了該產(chǎn)品上市的序幕。
    的頭像 發(fā)表于 10-21 11:12 ?1173次閱讀

    NVIDIA DGX Spark新一代AI超級(jí)計(jì)算機(jī)正式交付

    NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛在 SpaceX 向埃隆·馬斯克交付 DGX Spark。
    的頭像 發(fā)表于 10-21 10:41 ?1555次閱讀

    NVIDIA DGX Spark桌面AI計(jì)算機(jī)開啟預(yù)訂

    DGX Spark 現(xiàn)已開啟預(yù)訂!麗臺(tái)科技作為 NVIDIA 授權(quán)分銷商,提供從產(chǎn)品到服務(wù)的一站式解決方案,助力輕松部署桌面 AI 計(jì)算機(jī)。
    的頭像 發(fā)表于 09-23 17:20 ?1580次閱讀
    NVIDIA <b class='flag-5'>DGX</b> Spark桌面AI計(jì)算機(jī)開啟預(yù)訂

    NVIDIA計(jì)劃打造全球首個(gè)工業(yè)AI云平臺(tái)

    NVIDIA 宣布,其正在為歐洲制造商構(gòu)建全球首個(gè)工業(yè) AI 云。這家總部位于德國的 AI 工廠將配備 1 萬個(gè) GPU,包括通過 NVIDIA DGX B200 系統(tǒng) 和 NVIDIA RTX PRO 服務(wù)器版,幫助歐洲行業(yè)領(lǐng)
    的頭像 發(fā)表于 06-16 14:17 ?1655次閱讀

    NVIDIA推出AI平臺(tái)DGX Cloud Lepton

    CoreWeave、Crusoe、Firmus、Foxconn、GMI Cloud、Lambda、Nebius、Nscale、SoftBank Corp. 和 Yotta Data Services 為 DGX Cloud Lepton Marketplace 提供數(shù)以萬計(jì)的 G
    的頭像 發(fā)表于 05-22 09:42 ?1216次閱讀

    NVIDIA發(fā)布AI優(yōu)先DGX個(gè)人計(jì)算系統(tǒng)

    NVIDIA 宣布,多家行業(yè)領(lǐng)先系統(tǒng)制造商將打造 NVIDIA DGX Spark。
    的頭像 發(fā)表于 05-22 09:39 ?1285次閱讀
    凯里市| 安达市| 垦利县| 罗江县| 奉节县| 化州市| 文化| 石狮市| 城固县| 板桥市| 朝阳市| 福州市| 恩平市| 万年县| 宜黄县| 涪陵区| 电白县| 景泰县| 新绛县| 辛集市| 贵州省| 辽阳县| 三门峡市| 铜山县| 凤庆县| 屏南县| 依兰县| 隆尧县| 老河口市| 镇雄县| 富平县| 榆中县| 出国| 宁化县| 临夏县| 十堰市| 德阳市| 金寨县| 仁布县| 福州市| 恩平市|