日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD發(fā)布全新架構(gòu)計(jì)算卡Instinct MI100:AI性能暴漲7倍

璟琰乀 ? 來(lái)源:快科技 ? 作者:上方文Q ? 2020-11-17 09:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在游戲領(lǐng)域,基于RDNA 2架構(gòu)的Radeon RX 6000系列顯卡已經(jīng)開(kāi)始閃亮登場(chǎng)。在高性能計(jì)算領(lǐng)域,基于CDNA全新架構(gòu)的新一代計(jì)算卡Instinct MI100也終于登臺(tái)了!

AMD Radeon Instinct系列計(jì)算卡已經(jīng)發(fā)展了多款型號(hào),但是在此之前,AMD GPU一直都是一套架構(gòu)打天下,游戲、計(jì)算不分家,自然不利于不同方向的深度優(yōu)化。

今年3月份,AMD宣布了首個(gè)專(zhuān)門(mén)針對(duì)數(shù)據(jù)中心高性能計(jì)算而設(shè)計(jì)的CDNA架構(gòu),從此與RDNA游戲架構(gòu)分道揚(yáng)鑣。二者雖然還有一些共通點(diǎn),但在設(shè)計(jì)、優(yōu)化上已經(jīng)涇渭分明,在各自領(lǐng)域的性能、能效也更高。

而在產(chǎn)品命名方面,AMD計(jì)算卡也放棄了Radeon字樣,不再稱(chēng)呼Radeon Instinct,而是簡(jiǎn)單地叫做Instinct。

AMD Instinct可以說(shuō)是專(zhuān)為HPC高性能計(jì)算而生的,志在推動(dòng)超級(jí)計(jì)算機(jī)進(jìn)入百億億次計(jì)算時(shí)代(ExaScale)。

回顧歷史,21世紀(jì)的前10個(gè)年頭屬于萬(wàn)億次計(jì)算時(shí)代(TeraScale),完全依賴(lài)CPU運(yùn)算;最近10個(gè)年頭屬于千萬(wàn)億次計(jì)算時(shí)代(PetaScale),GPU加速運(yùn)算展露鋒芒。

不過(guò)近兩年,傳統(tǒng)的GPU加速計(jì)算也已經(jīng)初顯疲態(tài),性能增強(qiáng)曲線也緩了下來(lái),必須實(shí)現(xiàn)全新的突破。

CDNA架構(gòu)和MI100加速卡就是這樣的突破性產(chǎn)品,也是AMD開(kāi)拓新未來(lái)的新旗艦。

AMD Instinct MI100是其迄今為止性能最高的HPC GPU,F(xiàn)P64雙精度浮點(diǎn)性能首次突破10TFlops(也就是每秒1億億次),并在架構(gòu)設(shè)計(jì)上專(zhuān)門(mén)加入了Matrix Core(矩陣核心),用于加速HPC、AI運(yùn)算,號(hào)稱(chēng)在混合精度和FP16半精度的AI負(fù)載上,性能提升接近7倍。

另外,新卡的外觀設(shè)計(jì)也令人眼前一亮,更有質(zhì)感的拉絲外殼,深灰色調(diào),非常沉穩(wěn)大氣。

它集成多達(dá)120個(gè)計(jì)算單元、7680個(gè)流處理器,搭配32GB HBM2,帶寬高達(dá)1.23TB/s,同時(shí)支持PCIe 4.0,集成Infinity Fabric x16高速互聯(lián)通道,峰值帶寬達(dá)276GB/s(相當(dāng)于PCIe 4.0 x16的大約4倍),而整卡功耗控制在300W。

計(jì)算性能方面,F(xiàn)MA64/FP64雙精度為11.5TFlops(每秒1.15億億次),F(xiàn)MA32/FP32單精度為23.1TFlops(每秒2.31億億次),F(xiàn)P32 Matrix單精度矩陣計(jì)算為46.1TFlops(每秒4.61億億次),F(xiàn)P16 Matrix半精度矩陣計(jì)算為184.6TFlops(每秒18.46億億次),Bfloat16浮點(diǎn)為92.3TFlops(每秒9.23億億次)。

這些數(shù)字是什么概念呢?

就拿11.5TFlops的雙精度性能來(lái)說(shuō),2000年排名世界第一的超級(jí)計(jì)算機(jī)ASCI White,這個(gè)指標(biāo)也不過(guò)12.3TFlops,但卻是付出了600萬(wàn)瓦的功耗、106噸的身材才獲得的,Instinct MI100卻只要300瓦、1.16千克。

換言之,如今的一塊卡,就相當(dāng)于20年前的一個(gè)大規(guī)模計(jì)算集群!

AMD上代計(jì)算卡Instinct MI50采用的還是Vega 20核心,60個(gè)計(jì)算單元,3840個(gè)流處理器,32GB HBM2顯存帶寬1TB/s,Infinity Fabric總線帶寬92GB/s,功耗300W。

Instinct MI100的核心規(guī)模翻了一番,顯存帶寬提升了超過(guò)20%,Infinity Fabric帶寬提升了整整2倍,但是功耗卻完全沒(méi)變(工藝應(yīng)當(dāng)也還是7nm),新架構(gòu)的能效可見(jiàn)一斑。

新卡的性能更是不可同日而語(yǔ),F(xiàn)P64雙精度、FP32單精度性能均提升74%,F(xiàn)P32矩陣性能提升接近2.5倍,AI負(fù)載性能更是幾乎7倍的飛躍。

在美國(guó)能源部旗下的橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室,AMD MI100計(jì)算卡已經(jīng)在支撐多項(xiàng)百億億次科研項(xiàng)目,涉及NAMD分子動(dòng)力學(xué)模擬、CHOLLA星系形成研究、PIConGPU激光放射癌癥療法、GESTS流體動(dòng)力學(xué)等等諸多前沿科技。

AMD Instinct MI100計(jì)算卡還有一個(gè)絕佳搭檔,那就是AMD自家的霄龍數(shù)據(jù)中心處理器,慧與、戴爾、超威、技嘉等多家行業(yè)巨頭都有提供這種雙A方案。

當(dāng)然了,只有硬件,是做不成高性能計(jì)算的,AMD同時(shí)一直在推進(jìn)一站式軟件解決方案ROCm。

從2016年初入江湖的1.x版本,2018年奠定基礎(chǔ)的2.0版本,到2019年專(zhuān)注于機(jī)器學(xué)習(xí)的3.0版本,再到如今最新的4.0版本,AMD ROCm已經(jīng)打造成了一整套針對(duì)機(jī)器學(xué)習(xí)、高性能計(jì)算的百億億次級(jí)開(kāi)發(fā)方案,規(guī)劃中的各項(xiàng)功能特性也基本都已經(jīng)實(shí)現(xiàn)。

軟件優(yōu)化的力量無(wú)疑是巨大的,可以充分釋放硬件潛力,比如說(shuō)上代MI50,搭配ROCm 3.0的話性能相比于搭配ROCm 2.0可以提升3-4倍,而最新的MI100、ROCm 4.0聯(lián)合,更是可以輕松帶來(lái)5-8倍的性能提升。

AMD ROCm生態(tài)的進(jìn)步速度非???,已經(jīng)有眾多領(lǐng)域的頭部廠商采納和支持,而且它沿襲了AMD一貫的原則,那就是完全開(kāi)源開(kāi)放,非常方便代碼遷移,比如說(shuō)HACC(宇宙學(xué))只用了一個(gè)下午,SPECFEM3D(地震學(xué))半天就搞定,CHOLLA(天體物理學(xué))花了幾天,QUDA(量子物理學(xué))也不過(guò)21天。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5708

    瀏覽量

    140456
  • 顯卡
    +關(guān)注

    關(guān)注

    17

    文章

    2523

    瀏覽量

    71730
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    性能狂飆!AMD新品叫板英偉達(dá)GB200,角逐5000億AI加速器賽道

    AMD線上會(huì)議截圖 本次大會(huì)上,蘇姿豐重點(diǎn)宣布了MI350 系列和 MI400 系列 AI 芯片的強(qiáng)大性能,她表示這些芯片將與英偉達(dá)(Nvi
    的頭像 發(fā)表于 06-14 00:44 ?6626次閱讀
    <b class='flag-5'>性能</b>狂飆!<b class='flag-5'>AMD</b>新品叫板英偉達(dá)GB200,角逐5000億<b class='flag-5'>AI</b>加速器賽道

    偉創(chuàng)力與AMD進(jìn)一步深化戰(zhàn)略合作

    近日,偉創(chuàng)力宣布與全球領(lǐng)先的高性能與自適應(yīng)計(jì)算芯片公司 AMD(超威半導(dǎo)體) 進(jìn)一步深化戰(zhàn)略合作,在美國(guó)本土制造 AMD Instinct
    的頭像 發(fā)表于 03-11 15:11 ?454次閱讀

    AMD銳龍AI嵌入式P100系列處理器產(chǎn)品簡(jiǎn)介

    AMD 銳龍 AI 嵌入式 P100 系列處理器代表了 AMD 在車(chē)規(guī)級(jí)(通過(guò) AECQ 100 認(rèn)證)和工業(yè)級(jí)(寬溫)嵌入式處理器領(lǐng)域的下
    的頭像 發(fā)表于 01-23 09:19 ?2561次閱讀
    <b class='flag-5'>AMD</b>銳龍<b class='flag-5'>AI</b>嵌入式P<b class='flag-5'>100</b>系列處理器產(chǎn)品簡(jiǎn)介

    AMD 推出銳龍 AI 嵌入式處理器產(chǎn)品組合,為汽車(chē)、工業(yè)和物理 AI 領(lǐng)域提供 AI 驅(qū)動(dòng)的沉浸式體驗(yàn)

    新聞亮點(diǎn) ·?全新 AMD 銳龍 AI 嵌入式 P100 和 X100 系列處理器融入了高性能
    的頭像 發(fā)表于 01-07 14:30 ?696次閱讀
    <b class='flag-5'>AMD</b> 推出銳龍 <b class='flag-5'>AI</b> 嵌入式處理器產(chǎn)品組合,為汽車(chē)、工業(yè)和物理 <b class='flag-5'>AI</b> 領(lǐng)域提供 <b class='flag-5'>AI</b> 驅(qū)動(dòng)的沉浸式體驗(yàn)

    AMD下一代AI芯片MI455X,2nm工藝,性能提升10

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)1月6日,在2026年國(guó)際消費(fèi)電子產(chǎn)品展覽會(huì)(CES 2026)上,AMD CEO蘇姿豐在分享中指出:“期望在未來(lái)五年內(nèi),將計(jì)算能力提升至10YottaFlops以上
    的頭像 發(fā)表于 01-07 08:42 ?7326次閱讀
    <b class='flag-5'>AMD</b>下一代<b class='flag-5'>AI</b>芯片<b class='flag-5'>MI</b>455X,2nm工藝,<b class='flag-5'>性能</b>提升10<b class='flag-5'>倍</b>

    AMD UltraScale架構(gòu):高性能FPGA與SoC的技術(shù)剖析

    AMD UltraScale架構(gòu):高性能FPGA與SoC的技術(shù)剖析 在當(dāng)今的電子設(shè)計(jì)領(lǐng)域,高性能FPGA和MPSoC/RFSoC的需求日益增長(zhǎng)。AM
    的頭像 發(fā)表于 12-15 14:35 ?777次閱讀

    AMD Vitis AI 5.1測(cè)試版現(xiàn)已開(kāi)放下載

    AMD Vitis AI 5.1全新發(fā)布——新增了對(duì) AMD Versal AI Edge 系列神經(jīng)網(wǎng)絡(luò)處理單元( NPU )的支持。Vit
    的頭像 發(fā)表于 11-08 09:24 ?1471次閱讀

    AMD Vitis AI 5.1測(cè)試版發(fā)布

    AMD Vitis AI 5.1全新發(fā)布——新增了對(duì) AMD Versal AI Edge 系列神經(jīng)網(wǎng)絡(luò)處理單元 (NPU) 的支持。Vit
    的頭像 發(fā)表于 10-31 12:46 ?1023次閱讀

    BPI-AIM7 RK3588 AI與 Nvidia Jetson Nano 生態(tài)系統(tǒng)兼容的低功耗 AI 模塊

    AI Module7? 傳統(tǒng)邊緣計(jì)算設(shè)備往往難以在性能和能效之間取得平衡。RK3588 的突破性設(shè)計(jì)改變了這一局面: 1. 異構(gòu)計(jì)算
    發(fā)表于 10-11 09:08

    適應(yīng)邊緣AI全新時(shí)代的GPU架構(gòu)

    電子發(fā)燒友網(wǎng)站提供《適應(yīng)邊緣AI全新時(shí)代的GPU架構(gòu).pdf》資料免費(fèi)下載
    發(fā)表于 09-15 16:42 ?47次下載

    曙光存儲(chǔ)支持西湖大學(xué)高性能計(jì)算中心部署完成全新存儲(chǔ)系統(tǒng)

    近日,曙光存儲(chǔ)支持西湖大學(xué)高性能計(jì)算中心部署完成全新存儲(chǔ)系統(tǒng),為AI研發(fā)、科學(xué)計(jì)算和信息化平臺(tái)等提供存力支持。
    的頭像 發(fā)表于 08-25 11:48 ?1484次閱讀

    后摩智能發(fā)布全新端邊大模型AI芯片

    7月25日,WAIC 2025 前夕,后摩智能正式發(fā)布全新端邊大模型 AI 芯片——后摩漫界M50,同步推出力擎系列 M.2、力謀系列加速
    的頭像 發(fā)表于 07-26 16:09 ?1844次閱讀

    重磅!AMD將恢復(fù)向中國(guó)出口MI308芯片!

    出貨?!?此前美國(guó)政府針對(duì)Instinct MI308產(chǎn)品出貨至中國(guó)進(jìn)行出口管制,該產(chǎn)品與英偉達(dá)H20一樣禁止向中國(guó)銷(xiāo)售。 ? 如今,MI308也將恢復(fù)供貨,以滿(mǎn)足國(guó)內(nèi)AI基礎(chǔ)設(shè)施建設(shè)
    的頭像 發(fā)表于 07-15 20:52 ?3847次閱讀

    ROHM推出全新100V功率MOSFET助力AI服務(wù)器和工業(yè)電源高效能

    近期,ROHM半導(dǎo)體公司發(fā)布了一款全新100V功率MOSFET——RY7P250BM。這款器件專(zhuān)為48V電源架構(gòu)中的熱插拔電路設(shè)計(jì),廣泛應(yīng)
    的頭像 發(fā)表于 07-03 10:23 ?1181次閱讀
    ROHM推出<b class='flag-5'>全新</b><b class='flag-5'>100</b>V功率MOSFET助力<b class='flag-5'>AI</b>服務(wù)器和工業(yè)電源高效能

    全新AMD Vitis統(tǒng)一軟件平臺(tái)2025.1版本發(fā)布

    全新 AMD Vitis 統(tǒng)一軟件平臺(tái) 2025.1 版正式上線!此最新版本為使用 AMD Versal AI 引擎的高性能 DSP 應(yīng)用提
    的頭像 發(fā)表于 06-24 11:44 ?1973次閱讀
    锡林郭勒盟| 三门峡市| 眉山市| 揭西县| 桦川县| 阿克陶县| 南陵县| 丰顺县| 石门县| 太康县| 泰顺县| 安福县| 长武县| 高邮市| 筠连县| 太保市| 库尔勒市| 天长市| 永靖县| 河间市| 九江县| 莱州市| 乌什县| 沧源| 承德县| 辽阳市| 海盐县| 姜堰市| 友谊县| 平邑县| 方城县| 栾川县| 桐庐县| 瓦房店市| 东辽县| 通辽市| 漯河市| 当雄县| 东光县| 丰县| 淮滨县|