日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

了解NVIDIA首款服務(wù)器CPU

NVIDIA英偉達(dá) ? 來(lái)源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-08-25 15:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

新的芯片設(shè)計(jì)反映了 NVIDIA 在 AI、高性能計(jì)算和邊緣計(jì)算領(lǐng)域平臺(tái)創(chuàng)新的廣度和深度。

在為期兩天的四場(chǎng)演講中,NVIDIA 高級(jí)工程師介紹了現(xiàn)代數(shù)據(jù)中心和網(wǎng)絡(luò)邊緣系統(tǒng)在加速計(jì)算方面的創(chuàng)新。

虛擬 Hot Chips 大會(huì)是處理器和系統(tǒng)架構(gòu)師的年度聚會(huì)。NVIDIA 高級(jí)工程師在演講中披露了 NVIDIA 首款服務(wù)器 CPU、Hopper GPU、新版 NVSwitch 互連芯片和 NVIDIA Jetson Orin 系統(tǒng)模塊 (SoM) 的性能數(shù)據(jù)和其他技術(shù)細(xì)節(jié)。

這些演講就 NVIDIA 平臺(tái)如何在性能、效率、規(guī)模和安全性方面達(dá)到更高水平提供了新見(jiàn)解。

具體來(lái)說(shuō),演講展示了某種設(shè)計(jì)理念,即在 GPU、 CPU 和 DPU 充當(dāng)對(duì)等處理器的整個(gè)芯片、系統(tǒng)和軟件堆棧中進(jìn)行創(chuàng)新。他們共同創(chuàng)建的平臺(tái)已經(jīng)在云服務(wù)提供商、超級(jí)計(jì)算中心、企業(yè)數(shù)據(jù)中心和自主系統(tǒng)內(nèi)運(yùn)行 AI、數(shù)據(jù)分析和高性能計(jì)算工作。

了解 NVIDIA 首款服務(wù)器 CPU

數(shù)據(jù)中心需要靈活的 CPU、GPU 和其他加速器集群共享海量?jī)?nèi)存池,以提供當(dāng)今工作負(fù)載所需的高效性能。

為滿(mǎn)足這一需求,NVIDIA 的杰出工程師兼 15 年資深員工 Jonathon Evans 介紹了 NVIDIA NVLink-C2C。它以每秒 900 GB 的速度連接 CPU 和 GPU,歸功于每比特僅消耗 1.3 皮焦耳的數(shù)據(jù)傳輸,其能效是現(xiàn)有 PCIe 5.0 標(biāo)準(zhǔn)的 5 倍。

NVLink-C2C 連接兩個(gè) CPU 芯片,可創(chuàng)建具有 144 個(gè) Arm Neoverse 核心和 512 GB 內(nèi)存的 NVIDIA Grace CPU——用于解決全球大型計(jì)算問(wèn)題的處理器。

為更大限度地提高效率,Grace CPU 使用 LPDDR5X 內(nèi)存。它可實(shí)現(xiàn)每秒 1 TB 的內(nèi)存帶寬,同時(shí)將整個(gè)復(fù)合體的功耗保持在 500 瓦。

一個(gè)鏈接,多種用途

NVLink-C2C 還在 NVIDIA Grace Hopper 超級(jí)芯片中將 Grace CPU 和 Hopper GPU 芯片作為內(nèi)存共享對(duì)等體關(guān)聯(lián),更大限度地加速像 AI 訓(xùn)練這樣對(duì)性能要求很高的作業(yè)。

任何人都可以使用 NVLink-C2C 構(gòu)建定制小芯片,以協(xié)調(diào)地連接 NVIDIA GPU、CPU、DPU 和 SoC,擴(kuò)展這一新的集成產(chǎn)品類(lèi)別?;ミB將支持 Arm 和 x86 處理器各自使用的 AMBA CHI 和 CXL 協(xié)議。

Grace 和 Grace Hopper 的首個(gè)內(nèi)存基準(zhǔn)測(cè)試

為了在系統(tǒng)層面進(jìn)行擴(kuò)展,新的 NVIDIA NVSwitch 將多臺(tái)服務(wù)器連接到一臺(tái) AI 超級(jí)計(jì)算機(jī)。它使用 NVLink,互聯(lián)速度為每秒 900 GB,是 PCIe 5.0 帶寬的 7 倍以上。

NVSwitch 使用戶(hù)能夠?qū)?32 個(gè) NVIDIA DGX H100 系統(tǒng)連接到一臺(tái) AI 超級(jí)計(jì)算機(jī)中,這臺(tái)超級(jí)計(jì)算機(jī)可以提供百億億次級(jí)峰值 AI 性能。

NVIDIA 的兩位資深工程師 Alexander Ishii 和 Ryan Wells 介紹該交換機(jī)如何助力用戶(hù)構(gòu)建可支持多達(dá) 256 個(gè) GPU 的系統(tǒng),以處理要求嚴(yán)苛的工作負(fù)載,例如訓(xùn)練具有超過(guò) 1 萬(wàn)億參數(shù)的 AI 模型。

該交換機(jī)包括使用 NVIDIA SHARP 技術(shù)加速數(shù)據(jù)傳輸?shù)囊?。SHARP 是網(wǎng)絡(luò)計(jì)算功能,最初在 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)上使用。它可以使通信密集型 AI 應(yīng)用的數(shù)據(jù)吞吐量翻倍。

NVSwitch 系統(tǒng)支持百億億次級(jí) AI 超級(jí)計(jì)算機(jī)

Jack Choquette 是在 NVIDIA 任職 14 年的杰出高級(jí)工程師,他詳細(xì)介紹了 NVIDIA H100 Tensor Core GPU(也稱(chēng)為 Hopper)。

除使用新的互連技術(shù)擴(kuò)展到新的高度外,它還包括許多先進(jìn)功能,可提升加速器的性能、效率和安全性。

與上一代相比,Hopper 的新 Transformer 引擎和升級(jí)版 Tensor Core 可在使用全球大型神經(jīng)網(wǎng)絡(luò)模型進(jìn)行 AI 推理時(shí),將速度提升 30 倍。此外,它采用全球首款 HBM3 內(nèi)存系統(tǒng),可提供高達(dá) 3 TB 的內(nèi)存帶寬,這是 NVIDIA 有史以來(lái)幅度超大的代際提升。

其他新功能包括:

Hopper 添加了針對(duì)多租戶(hù)、多用戶(hù)配置的虛擬化支持。

新的 DPX 指令集可加快選定映射、DNA 和蛋白質(zhì)分析應(yīng)用的遞歸循環(huán)速度。

Hopper 還支持通過(guò)機(jī)密計(jì)算增強(qiáng)安全性。

Choquette 在職業(yè)生涯早期曾是任天堂 64 游戲機(jī)的首席芯片設(shè)計(jì)師,他還介紹了一些 Hopper 進(jìn)步背后的并行計(jì)算技術(shù)。

Michael Ditty 是 Orin 的首席架構(gòu)師并在 NVIDIA 任職 17 年,他講解了 NVIDIA Jetson AGX Orin(適用于邊緣 AI、機(jī)器人開(kāi)發(fā)和高級(jí)自主機(jī)器的引擎)的新性能規(guī)格。

NVIDIA Jetson AGX Orin 集成了 12 個(gè) Arm Cortex-A78 核心和一個(gè) NVIDIA Ampere 架構(gòu) GPU,可為 AI 推理作業(yè)提供每秒高達(dá) 275 萬(wàn)億次運(yùn)算。相較上一代,能效提升 2.3 倍,性能提升高達(dá) 8 倍。

新的生產(chǎn)模塊包含高達(dá) 32 GB 的內(nèi)存,是兼容系列的一部分,可縮小至口袋大小的 5W Jetson Nano 開(kāi)發(fā)者套件。

NVIDIA Orin 的性能基準(zhǔn)測(cè)試

所有新芯片都支持 NVIDIA 軟件堆棧,該堆??杉铀?700 多個(gè)應(yīng)用,為 250 萬(wàn)名開(kāi)發(fā)者所用。

它基于 CUDA 編程模型,包含數(shù)十個(gè)面向垂直市場(chǎng)的 NVIDIA SDK,例如汽車(chē) (DRIVE) 和醫(yī)療健康 (Clara),以及推薦系統(tǒng) (Merlin) 和對(duì)話(huà)式 AI (Riva) 等技術(shù)。

各大云服務(wù)和系統(tǒng)制造商均提供 NVIDIA AI 平臺(tái)。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11332

    瀏覽量

    226005
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5696

    瀏覽量

    110143
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10371

    瀏覽量

    91775
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41328

    瀏覽量

    302731

原文標(biāo)題:Hot Chips | NVIDIA 分享關(guān)于 Grace CPU、Hopper GPU、NVLink Switch 最新細(xì)節(jié)

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    歷史首次!AMD服務(wù)器CPU市占率達(dá)50%

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)近日,根據(jù)市場(chǎng)研究機(jī)構(gòu)PassMark對(duì)于服務(wù)器CPU 市場(chǎng)占有率調(diào)查的數(shù)據(jù)顯示,截至2025年一季度AMD 在服務(wù)器CPU 市場(chǎng)市占率首次達(dá)到50%
    的頭像 發(fā)表于 08-11 03:20 ?1.1w次閱讀
    歷史首次!AMD<b class='flag-5'>服務(wù)器</b><b class='flag-5'>CPU</b>市占率達(dá)50%

    詳解Arm AGI CPU 1OU雙節(jié)點(diǎn)參考服務(wù)器

    近日發(fā)布的Arm AGI CPU 是 Arm 面向人工智能 (AI) 數(shù)據(jù)中心的量產(chǎn)級(jí)芯片產(chǎn)品。與此同時(shí),Arm 也同步推出一模塊化、基于標(biāo)準(zhǔn)的 1OU 雙節(jié)點(diǎn)參考
    的頭像 發(fā)表于 04-01 15:09 ?572次閱讀

    Supermicro率先發(fā)布NVIDIA BlueField-4 STX存儲(chǔ)服務(wù)器,提升AI推理性能

    Vera CPUNVIDIA ConnectX-9 SuperNIC。 Supermicro的這款存儲(chǔ)服務(wù)器基于去年推出的、采用NVIDIA BlueField-3的Petasca
    的頭像 發(fā)表于 03-19 15:46 ?192次閱讀
    Supermicro率先發(fā)布<b class='flag-5'>NVIDIA</b> BlueField-4 STX存儲(chǔ)<b class='flag-5'>服務(wù)器</b>,提升AI推理性能

    NVIDIA推出Vera CPU以顯著提升系統(tǒng)性能與能效

    NVIDIA 今日發(fā)布 NVIDIA Vera CPU,這是全球專(zhuān)為代理式 AI 與強(qiáng)化學(xué)習(xí)時(shí)代打造的處理
    的頭像 發(fā)表于 03-18 14:33 ?1900次閱讀

    全球首創(chuàng)!RISC-V+AI架構(gòu)高性能服務(wù)器CPU成功點(diǎn)亮

    電子發(fā)燒友網(wǎng)報(bào)道 長(zhǎng)久以來(lái),全球高端服務(wù)器CPU市場(chǎng)一直被x86和ARM架構(gòu)所主導(dǎo),我國(guó)在核心算力領(lǐng)域長(zhǎng)期受制于人,高端芯片供應(yīng)鏈安全面臨重大挑戰(zhàn)。 ? 近日,藍(lán)芯算力(深圳)科技有限公司宣布,公司
    的頭像 發(fā)表于 02-28 09:22 ?6735次閱讀

    全液冷服務(wù)器系統(tǒng)架構(gòu)設(shè)計(jì)案例分享

    服務(wù)器的全液冷,一般都需要液冷板覆蓋CPU、內(nèi)存(DIMM)、硬盤(pán)(SSD)、電源、IO以及其他SOC的散熱。今天給大家分享一浪潮的全液冷冷板服務(wù)器的液冷系統(tǒng)架構(gòu)。
    的頭像 發(fā)表于 01-27 15:33 ?830次閱讀
    全液冷<b class='flag-5'>服務(wù)器</b>系統(tǒng)架構(gòu)設(shè)計(jì)案例分享

    致遠(yuǎn)儀器 PA310功率計(jì):成為國(guó)產(chǎn)支持SPECpower? 服務(wù)器能效測(cè)試的功率分析儀器

    本文導(dǎo)讀致遠(yuǎn)儀器PA310功率計(jì)新增SPECpower基準(zhǔn)支持,成為國(guó)產(chǎn)支持SPECpower服務(wù)器能效測(cè)試的功率分析儀器,為服務(wù)器產(chǎn)業(yè)鏈的研發(fā)、選型與認(rèn)證等環(huán)節(jié),提供精準(zhǔn)可靠的國(guó)
    的頭像 發(fā)表于 11-19 11:42 ?1826次閱讀
    致遠(yuǎn)儀器 PA310功率計(jì):成為國(guó)產(chǎn)<b class='flag-5'>首</b><b class='flag-5'>款</b>支持SPECpower? <b class='flag-5'>服務(wù)器</b>能效測(cè)試的功率分析儀器

    多核服務(wù)器CPU親和性配置與負(fù)載均衡優(yōu)化

    某大廠(chǎng)的資深架構(gòu)師小王最近遇到了一個(gè)頭疼的問(wèn)題:新采購(gòu)的雙路AMD EPYC 7763(128核心)服務(wù)器,在高并發(fā)場(chǎng)景下的性能表現(xiàn)竟然還不如之前的32核服務(wù)器。經(jīng)過(guò)深入排查,發(fā)現(xiàn)問(wèn)題出在CPU親和性配置上。通過(guò)正確的配置,最終
    的頭像 發(fā)表于 08-27 14:45 ?1055次閱讀

    華納云服務(wù)器角色服務(wù)器失敗的原因和解決辦法

    是常見(jiàn)的,這可能導(dǎo)致數(shù)據(jù)丟失、系統(tǒng)停機(jī)和效率降低等嚴(yán)重后果。因此,了解服務(wù)器角色故障的原因和影響,并采取有效的預(yù)防措施,對(duì)于確保業(yè)務(wù)連續(xù)性和數(shù)據(jù)安全性至關(guān)重要。 一、服務(wù)器角色故障的原因 1. 硬件故障:硬盤(pán)驅(qū)動(dòng)
    的頭像 發(fā)表于 07-17 18:18 ?713次閱讀
    岳普湖县| 三都| 司法| 通道| 利川市| 花莲县| 深州市| 同江市| 刚察县| 丰顺县| 斗六市| 寻乌县| 南皮县| 东港市| 洞头县| 略阳县| 松原市| 安丘市| 博乐市| 孙吴县| 曲阜市| 平定县| 张家界市| 涡阳县| 合作市| 嘉定区| 新泰市| 晋城| 澎湖县| 巴南区| 奉化市| 香港| 武强县| 伽师县| 西华县| 安阳市| 锡林郭勒盟| 全南县| 桂阳县| 临安市| 白水县|