日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達Grace Hopper CPU架構(gòu)

半導(dǎo)體產(chǎn)業(yè)縱橫 ? 來源:半導(dǎo)體產(chǎn)業(yè)縱橫 ? 作者:半導(dǎo)體產(chǎn)業(yè)縱橫 ? 2022-08-23 16:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英偉達的 Grace CPU 和 Grace Hopper Superchip 有望在 2023 年初發(fā)布。

英偉達在下周的 Hot Chips 34 發(fā)布會之前宣布了有關(guān)Grace CPU Superchip的新細節(jié),并透露該芯片采用4N工藝制造。英偉達還分享了有關(guān)架構(gòu)、數(shù)據(jù)結(jié)構(gòu)、性能和效率基準(zhǔn)的更多信息。Grace芯片和服務(wù)器將在2023年上半年投入市場。

英偉達的Grace CPU是該公司第一款專為數(shù)據(jù)中心設(shè)計的CPU專用Arm芯片,在一塊主板上有兩個芯片,共144個核心,而Grace Hopper超級芯片則將Hopper GPU和Grace CPU結(jié)合在同一塊板上。在披露中,英偉達最終正式確認 Grace CPU 使用 TSMC 4N 工藝。臺積電在其5nm節(jié)點系列中列出了“N4”4nm工藝,將其描述為5nm節(jié)點的增強版。英偉達使用該節(jié)點的專用變體,稱為“4N”,專門針對其GPU和CPU進行了優(yōu)化。

隨著摩爾定律的減弱,這些類型的專用節(jié)點變得越來越普遍,隨著每個新節(jié)點的出現(xiàn),晶體管的縮小變得越來越困難,成本也越來越高。為了實現(xiàn)英偉達4N等定制工藝節(jié)點,芯片設(shè)計公司和代工廠攜手合作,使用設(shè)計技術(shù)協(xié)同優(yōu)化(DTCO)為其特定產(chǎn)品輸入定制功率、性能和面積(PPA)特性。

英偉達此前曾透露,其 Grace CPU 使用現(xiàn)成的Arm Neoverse內(nèi)核作為其Grace CPU,但該公司尚未指定使用哪種特定版本。然而,英偉達披露,Grace使用Arm v9內(nèi)核并支持SVE2,Neoverse N2平臺是Arm第一個支持Arm V7和SVE2等擴展的IP。N2 Perseus 平臺采用 5nm 設(shè)計(N4 屬于 TSMC 的 5nm 系列)并支持 PCIe Gen 5.0、DDR5、HBM3、CCIX 2.0 和 CXL 2.0。Perseus 設(shè)計針對每功率性能(瓦特)和每面積性能進行了優(yōu)化。Arm 表示,其下一代核心 Poseidon 要到 2024 年才會上市,考慮到 Grace 2023 年初的發(fā)布日期,這些核心不太可能成為候選者。

英偉達Grace Hopper CPU 架構(gòu)

英偉達的新NVDIA calable Coherency Fabric (SCF) 是一種網(wǎng)狀互連,與Arm Neoverse核心使用的標(biāo)準(zhǔn)CMN-700相干網(wǎng)狀網(wǎng)絡(luò)非常相似。

英偉達SCF 在各種 Grace 芯片單元(如 CPU 內(nèi)核、內(nèi)存和 I/O)之間提供 3.2 TB/s 的雙向帶寬,更不用說將芯片連接到主板上其他單元(無論是另一個Grace CPU還是Hopper GPU)的NVLink-C2C接口。

1010cdb0-2070-11ed-ba43-dac502259ad0.png

該網(wǎng)格支持 72+ 個內(nèi)核,每個 CPU 有 117MB 的總 L3 緩存。英偉達表示,上面圖片中的第一個方框圖是“出于說明目的的可能拓撲結(jié)構(gòu)”,其對齊方式與第二個方框圖不完全一致。

此圖顯示了具有8個SCF緩存分區(qū)(SCC)的芯片,這些分區(qū)看起來是L3緩存片以及8個CPU單元。SCC 和內(nèi)核以兩個一組連接到緩存交換節(jié)點 (CSN),然后 CSN 駐留在 SCF 網(wǎng)狀結(jié)構(gòu)上,以提供CPU核心和芯片其余部分的存儲器之間的接口。SCF 還通過 Coherent NVLink 支持多達四個插槽的一致性。

103d07a4-2070-11ed-ba43-dac502259ad0.png

英偉達還分享了上圖,顯示每個Grace CPU支持多達68個PCIe通道和多達4個PCIe 5.0 x16連接。每個x16連接支持高達128 GB/s的雙向吞吐量(x16鏈路可以分成兩個x8鏈路),還有16個雙通道LPDDR5X內(nèi)存控制器(MC)。然而,這張圖與第一張圖不同——它將 L3 緩存顯示為連接到四核 CPU 集群的兩個連續(xù)塊,這比之前的圖更有意義,芯片中總共有 72 個內(nèi)核。但是,我我們在第一張圖中沒有看到單獨的SCF分區(qū)或CSN節(jié)點。

英偉達官方表示,Scalable Coherency Fabric (SCF) 是其專有設(shè)計,但 Arm 允許其合作伙伴通過調(diào)整核心數(shù)量、緩存大小和使用不同類型的內(nèi)存(如 DDR5 和 HBM)來定制 CMN-700 網(wǎng)格,以及選擇各種接口,如 PCIe 5.0、CXL 和 CCIX。這意味著 英偉達有可能為片上結(jié)構(gòu)使用高度定制的 CMN-700 實現(xiàn)。

英偉達Grace Hopper 擴展 GPU 內(nèi)存

GPU 需要高的內(nèi)存吞吐量,因此,英偉達將目光轉(zhuǎn)向提高內(nèi)存吞吐量,不僅是芯片內(nèi)部,還包括CPU和GPU之間。Grace CPU 有 16 個雙通道 LPDDR5X 內(nèi)存控制器,最多可支持 32 個通道,支持高達 512 GB 的內(nèi)存和高達 546 GB/s 的吞吐量。英偉達表示,由于容量和成本等多種因素,它選擇了 LPDDR5X 而不是 HBM2e。同時,與標(biāo)準(zhǔn) DDR5 內(nèi)存相比,LPDDR5X 提供了 53% 的帶寬和 1/8 的每 GB 功耗,使其成為更好的選擇。

英偉達還推出了擴展 GPU 內(nèi)存 (EGM),它允許 NVLink 網(wǎng)絡(luò)上的任何 Hopper GPU 訪問網(wǎng)絡(luò)上任何 Grace CPU 的 LPDDR5X 內(nèi)存。

英偉達的目標(biāo)是提供一個統(tǒng)一的內(nèi)存池,可以在 CPU 和 GPU 之間共享,從而在簡化編程模型的同時提供更高的性能。Grace Hopper CPU+GPU 芯片支持具有共享頁表的統(tǒng)一內(nèi)存,這意味著芯片可以與 CUDA 應(yīng)用程序共享地址空間和頁表,并允許使用系統(tǒng)分配器來分配 GPU 內(nèi)存。

英偉達NVLink-C2C

CPU 內(nèi)核是計算引擎,但互連是決定計算未來的戰(zhàn)場。移動數(shù)據(jù)比實際計算數(shù)據(jù)消耗更多的能量,因此更快、更有效地移動數(shù)據(jù),甚至避免數(shù)據(jù)傳輸,是一個關(guān)鍵目標(biāo)。

英偉達的Grace CPU由一塊板上的兩個 CPU 組成,而 Grace Hopper Superchip 則由同一塊板上的一個 Grace CPU 和一個 Hopper GPU 組成,旨在通過專有的NVLink芯片到芯片(C2C)互連最大化單元之間的數(shù)據(jù)傳輸,并提供一致性內(nèi)存,以減少或消除數(shù)據(jù)傳輸。

106865fc-2070-11ed-ba43-dac502259ad0.png

英偉達分享了有關(guān)其 NVLink-C2C 互連的新細節(jié),這是一種支持內(nèi)存一致性的芯片到芯片和芯片到芯片互連,可提供高達 900 GB/s 的吞吐量(是 PCIe 5.0 x16 鏈路帶寬的 7 倍)。該接口使用 NVLink 協(xié)議,英偉達使用其 SERDES 和 LINK 設(shè)計技術(shù)精心設(shè)計了該接口,重點關(guān)注能源和面積效率。NVLink-C2C 也支持行業(yè)標(biāo)準(zhǔn)協(xié)議,如 CXL 和 Arm 的 AMBA 相干集線器接口(CHI — Neoverse CMN-700 網(wǎng)格的CHI-key)。它還支持多種類型的連接,從基于PCB的互連到硅中介層和晶圓級實現(xiàn)。

功率效率是所有數(shù)據(jù)結(jié)構(gòu)的一個關(guān)鍵指標(biāo),如今,英偉達共享鏈路傳輸?shù)臄?shù)據(jù)每比特消耗1.3微微焦耳(pJ/b)。這是 PCIe 5.0 接口效率的 5 倍,但它是未來將上市的 UCIe 互連(0.5 到 0.25 pJ/b)功率的兩倍多。封裝類型各不相同,C2C link為 英偉達提供了性能和效率的完美結(jié)合,以滿足其特定的使用情況。

英偉達Grace CPU 基準(zhǔn)測試

1093537a-2070-11ed-ba43-dac502259ad0.png

10bad5f8-2070-11ed-ba43-dac502259ad0.png

10caddcc-2070-11ed-ba43-dac502259ad0.png

英偉達的新基準(zhǔn)是SpecIntRate 2017基準(zhǔn)中單臺Grace CPU的370分。這英偉達已經(jīng)共享了一個多CPU基準(zhǔn),在SPECTINTRATE2017基準(zhǔn)中,兩個Grace CPU的得分為740。顯然,這表明兩個芯片的線性縮放改進。

AMD目前的第二代EPYC Milan芯片是數(shù)據(jù)中心目前的性能領(lǐng)導(dǎo)者,發(fā)布的規(guī)格結(jié)果從382到424片不等,這意味著高端x86芯片仍將保持領(lǐng)先地位。然而,英偉達的解決方案將具有許多其他優(yōu)勢,如功率效率和更GPU友好的設(shè)計。

英偉達分享了其內(nèi)存吞吐量基準(zhǔn),表明Grace CPU在CPU內(nèi)存吞吐量測試中可以提供約500 GB/s的吞吐量。英偉達還聲稱,該芯片還可以將高達506Gb/s的組合讀/寫吞吐量推送到連接的Hopper GPU,并在讀吞吐量測試期間將CPU到GPU的帶寬計時為429Gb/s,在寫入時為407Gb/秒。

Grace Hopper ARM系統(tǒng)準(zhǔn)備好了嗎?

英偉達還宣布 Grace CPU Superchip 將遵守獲得 System Ready 認證的必要要求。以獲得系統(tǒng)就緒認證。該認證意味著Arm芯片將與操作系統(tǒng)和軟件一起“正常工作”,從而簡化部署。Grace 還將支持虛擬化擴展,包括嵌套虛擬化和 S-EL2 支持。英偉達還列出了對以下內(nèi)容的支持:

nRAS v1.1 通用中斷控制器 (GIC) v4.1

n內(nèi)存分區(qū)和監(jiān)控 (MPAM)

n系統(tǒng)內(nèi)存管理單元 (SMMU) v3.1

nArm 服務(wù)器基礎(chǔ)系統(tǒng)架構(gòu) (SBSA) 可實現(xiàn)符合標(biāo)準(zhǔn)的硬件和軟件接口

此外,為了在基于 Grace CPU 的系統(tǒng)上啟用標(biāo)準(zhǔn)引導(dǎo)流程,Grace CPU被設(shè)計為支持Arm服務(wù)器基本引導(dǎo)要求(SBBR)。

對于緩存和帶寬分區(qū)以及帶寬監(jiān)控,Grace CPU還支持Arm內(nèi)存分區(qū)和監(jiān)控(MPAM)。Grace CPU 還包括 Arm 性能監(jiān)控單元,允許對 CPU 內(nèi)核以及片上系統(tǒng) (SoC) 架構(gòu)中的其他子系統(tǒng)進行性能監(jiān)控。這使得標(biāo)準(zhǔn)工具(例如 Linux perf)能夠用于性能調(diào)查。英偉達的 Grace CPU 和 Grace Hopper Superchip 有望在 2023 年初發(fā)布,其中 Hopper 變體適用于 AI 訓(xùn)練、推理和 HPC,而雙 CPU Grace 系統(tǒng)則專為 HPC 和云計算工作負載而設(shè)計。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11332

    瀏覽量

    225994
  • 架構(gòu)
    +關(guān)注

    關(guān)注

    1

    文章

    537

    瀏覽量

    26646
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4116

    瀏覽量

    99660

原文標(biāo)題:詳解英偉達Grace Hopper CPU 超級芯片設(shè)計

文章出處:【微信號:ICViews,微信公眾號:半導(dǎo)體產(chǎn)業(yè)縱橫】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    RV生態(tài)又一里程碑:英偉達官宣CUDA將兼容RISC-V架構(gòu)!

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)英偉達生態(tài)護城河CUDA,從最初支持x86、Power?CPU架構(gòu),到2019年宣布支持Arm?CPU,不斷拓展在數(shù)據(jù)中心的應(yīng)用生態(tài)。 在2019年至今的
    的頭像 發(fā)表于 07-19 00:04 ?6857次閱讀
    RV生態(tài)又一里程碑:<b class='flag-5'>英偉</b>達官宣CUDA將兼容RISC-V<b class='flag-5'>架構(gòu)</b>!

    英偉+聯(lián)發(fā)科,打入游戲本市場?

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)近日有消息稱,英偉與聯(lián)發(fā)科合作,將推出面向筆記本市場的APU,并最快在今年四季度或明年初進入市場。 ? 同時,據(jù)稱英偉已經(jīng)與戴爾旗下游戲本品牌Alie
    的頭像 發(fā)表于 06-05 09:08 ?5651次閱讀

    麥格納宣布擴大與英偉的戰(zhàn)略合作

    麥格納宣布擴大與英偉的戰(zhàn)略合作,為整車廠基于英偉DRIVE Hyperion平臺的項目落地提供支持。
    的頭像 發(fā)表于 01-09 12:59 ?548次閱讀

    英偉重磅出手!AI 推理存儲全面覺醒

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)近日,有消息稱,英偉將以大約200億美元收購人工智能芯片初創(chuàng)公司Groq,這將是英偉迄今為止規(guī)模最大的一筆收購。但
    的頭像 發(fā)表于 12-26 08:44 ?1.2w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>重磅出手!AI 推理存儲全面覺醒

    NVIDIA新聞:英偉10億美元入股諾基亞 英偉推出全新量子設(shè)備

    給大家分享一些NVIDIA新聞: 英偉10億美元入股諾基亞 在當(dāng)?shù)貢r間10月28日,英偉正式宣布將以10億美元入股諾基亞;據(jù)悉英偉
    的頭像 發(fā)表于 10-29 17:12 ?2474次閱讀

    英偉發(fā)布 NVQLink 開放系統(tǒng)架構(gòu);國內(nèi)首個汽車芯片標(biāo)準(zhǔn)驗證平臺投入使用

    英偉發(fā)布 NVQLink 開放系統(tǒng)架構(gòu) 在華盛頓特區(qū)舉行的英偉全球技術(shù)大會上,英偉
    發(fā)表于 10-29 10:33 ?1353次閱讀

    納微半導(dǎo)體助力英偉打造800 VDC電源架構(gòu)

    納微半導(dǎo)體正式發(fā)布專為英偉800 VDC AI工廠電源架構(gòu)打造的全新100V氮化鎵,650V氮化鎵和高壓碳化硅功率器件,以實現(xiàn)突破性效率、功率密度與性能表現(xiàn)。
    的頭像 發(fā)表于 10-15 15:54 ?3208次閱讀
    納微半導(dǎo)體助力<b class='flag-5'>英偉</b><b class='flag-5'>達</b>打造800 VDC電源<b class='flag-5'>架構(gòu)</b>

    英偉加速800V HVDC架構(gòu)落地,三家本土企業(yè)打入供應(yīng)鏈!

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)在今年5月份的COMPUTEX 2025上,英偉宣布將推動數(shù)據(jù)中心電源架構(gòu)往800V DC發(fā)展,為未來千兆瓦級數(shù)據(jù)中心提供電力支持,并公布了一系列合作伙伴名單。而剛剛
    的頭像 發(fā)表于 10-15 09:15 ?1.4w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>加速800V HVDC<b class='flag-5'>架構(gòu)</b>落地,三家本土企業(yè)打入供應(yīng)鏈!

    英偉最新B30A芯片曝光:算力角逐中的新變數(shù)

    目前允許在中國銷售的H20型號。這一消息瞬間點燃了行業(yè)內(nèi)外的關(guān)注熱情,為本就競爭激烈的AI芯片領(lǐng)域增添了新的變數(shù)。 ? 架構(gòu)升級:站在巨人肩膀上的革新 B30A芯片將基于英偉去年GTC大會上發(fā)布的新一代計算
    的頭像 發(fā)表于 08-22 16:41 ?1799次閱讀

    英偉自研HBM基礎(chǔ)裸片

    CPU直接連接。 ? 英偉可能會在2027年上半年首先采用SK海力士供應(yīng)的標(biāo)準(zhǔn)HBM4E,然后從2027年下
    的頭像 發(fā)表于 08-21 08:16 ?3061次閱讀

    英偉:CUDA 已經(jīng)開始移植到 RISC-V 架構(gòu)

    ,著重介紹了將 CUDA 移植到 RISC-V 架構(gòu)的相關(guān)工作和計劃,展現(xiàn)了對 RISC-V 架構(gòu)的高度重視與積極布局。 ? Frans Sijstermanns 首先回顧了英偉
    發(fā)表于 07-17 16:30 ?4025次閱讀

    英偉擬再推中國特供GPU,今年6月量產(chǎn)!

    。 ??????????????????????????????????????????????????? 最新消息顯示,英偉擬新推出一款專門面向中國市場的人工智能芯片,且最早將于今年6月開始量產(chǎn)。這款芯片屬于英偉
    發(fā)表于 05-27 00:03 ?4916次閱讀

    NVIDIA Grace CPU C1獲得廣泛支持

    NVIDIA 在本周 COMPUTEX 上重點展示了其全新的 Grace CPU C1,并獲得多家主要原始設(shè)計制造商合作伙伴的大力支持。
    的頭像 發(fā)表于 05-22 10:01 ?954次閱讀

    英偉Q3將發(fā)布新一代人工智能系統(tǒng)

    5月19日消息,據(jù)外媒報道,在臺北國際電腦展上;黃仁勛宣布英偉將于2025年第三季度推出下一代GB300人工智能系統(tǒng)。 據(jù)悉,GB300 雖然與上一代 GB200 擁有相同的物理占地面積、相同
    的頭像 發(fā)表于 05-19 18:02 ?787次閱讀
    铜梁县| 农安县| 山阴县| 慈溪市| 遂川县| 文化| 社旗县| 安新县| 南漳县| 开平市| 民乐县| 奉新县| 怀化市| 日照市| 涿州市| 旌德县| 吉水县| 宁南县| 临夏县| 西乡县| 泾阳县| 浪卡子县| 张家川| 湾仔区| 乃东县| 宜川县| 泸西县| 习水县| 鹤山市| 吉水县| 泗阳县| 宽甸| 东莞市| 依安县| 陇南市| 金山区| 上蔡县| 乐至县| 昌吉市| 尼勒克县| 依安县|