日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過全棧創(chuàng)新推動高性能計算

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-06-21 15:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

高性能計算(HPC)已成為科學(xué)發(fā)現(xiàn)的基本工具。

無論是發(fā)現(xiàn)新的拯救生命的藥物,對抗氣候變化,還是創(chuàng)建精確的世界模擬,這些解決方案都需要巨大且快速增長的處理能力。它們越來越超出傳統(tǒng)計算方法的范圍。

這就是為什么業(yè)界接受 NVIDIA GPU加速計算的原因。與人工智能相結(jié)合,它為科學(xué)進步帶來了性能上百萬倍的飛躍。如今,2700個應(yīng)用程序可以從 NVIDIA GPU 的加速中受益,而且這個數(shù)字在不斷增長的300萬開發(fā)者社區(qū)的支持下繼續(xù)上升。

HPC 應(yīng)用程序性能改進

要在整個 HPC 應(yīng)用程序范圍內(nèi)實現(xiàn)數(shù)倍的加速,需要在堆棧的各個級別進行不懈的創(chuàng)新。這從芯片和系統(tǒng)開始,一直到應(yīng)用程序框架本身。

NVIDIA 平臺每年都在繼續(xù)提供顯著的性能改進,在體系結(jié)構(gòu)和整個 NVIDIA 軟件堆棧方面都取得了不懈的進步。與六年前發(fā)布的 P100 相比, H100 Tensor Core GPU 預(yù)計性能將提高 26 倍,比摩爾定律快 3 倍多。

pYYBAGKxbzWACbucAAB-hWVUDoU496.png

圖 1 NVIDIA HPC + AI 平臺性能從 P100 到 H100

圖 2 NVIDIA HPC SDK 為每個功能提供了開發(fā)人員資產(chǎn)。

NVIDIA 平臺的核心是功能豐富且高性能的軟件堆棧。為了促進 GPU 在最廣泛的 HPC 應(yīng)用中的加速,該平臺包括 NVIDIA HPC SDK 。 SDK 提供了無與倫比的開發(fā)人員靈活性,支持使用標(biāo)準(zhǔn)語言、指令和 CUDA 創(chuàng)建和移植 GPU 加速的應(yīng)用程序。

NVIDIA HPC SDK 的強大功能在于一整套高度優(yōu)化的 GPU 加速數(shù)學(xué)庫 ,使您能夠充分發(fā)揮 NVIDIA GPU 的性能潛力。為了獲得最佳的多 GPU 和多節(jié)點性能, NVIDIA HPC SDK 還提供了功能強大的通信庫:

NVSHMEM 為跨越多個 GPU 內(nèi)存的數(shù)據(jù)創(chuàng)建全局地址空間。

NVIDIA 集體通信庫( NCCL ) 優(yōu)化了 GPU 之間的通信。

總之,該平臺提供了最高的性能和靈活性,以支持不斷增長的 GPU 加速 HPC 應(yīng)用程序。

HPC 性能和能效

為了展示 NVIDIA 全棧創(chuàng)新如何轉(zhuǎn)化為 accelerated HPC 的最高性能,我們比較了 HPE 服務(wù)器與四個 NVIDIA GPU 服務(wù)器的性能,以及基于其他供應(yīng)商同等數(shù)量加速器模塊的類似配置服務(wù)器的性能。

我們使用各種數(shù)據(jù)集測試了一組五個廣泛使用的 HPC 應(yīng)用程序。雖然 NVIDIA 平臺可以加速 2700 個跨行業(yè)的應(yīng)用程序,但我們在比較中可以使用的應(yīng)用程序受到其他供應(yīng)商加速器可用軟件和應(yīng)用程序版本選擇的限制。

對于除分子動力學(xué)模擬軟件 NAMD 以外的所有工作負(fù)載,我們的結(jié)果是使用多個數(shù)據(jù)集的結(jié)果幾何平均值計算的,以最小化異常值的影響,并代表客戶體驗。

我們還在多 GPU 和單 GPU 場景中測試了這些應(yīng)用程序。

在多 GPU 場景中,測試系統(tǒng)中的所有加速器都用于運行單個模擬,基于 A100 Tensor Core GPU 的服務(wù)器提供的性能比備選方案高出 2.1 倍。

poYBAGKxbzyATqPHAABoKvu2OeU771.png

圖 3 NVIDIA A100 four- GPU 性能比較

在計算性能不斷進步的推動下,分子動力學(xué)領(lǐng)域正朝著在更長的模擬時間內(nèi)模擬更大的原子系統(tǒng)的方向發(fā)展。這些進展使研究人員能夠模擬越來越多的生化機制,如光合電子傳遞和視覺信號轉(zhuǎn)導(dǎo)。這些和其他過程長期以來一直是科學(xué)辯論的主題,因為它們已經(jīng)超出了模擬的范圍,模擬是驗證的主要工具。這是由于完成模擬所需的時間過長。

然而,我們認(rèn)識到,并非所有這些應(yīng)用程序的用戶在每次模擬時都使用多個 GPU 來運行它們。為了獲得最佳吞吐量,最佳執(zhí)行方法通常是為每個模擬分配一個 GPU 。

當(dāng)在 NVIDIA A100上的單個加速器模塊上運行這些相同的應(yīng)用程序時,基于 NVIDIA A100的系統(tǒng)的性能提高了1.9倍。

poYBAGKxb0KAC18OAABliRdEc-I637.png

圖 4 NVIDIA A100 單 – GPU 性能比較

能源成本占數(shù)據(jù)中心和超級計算中心總體擁有成本( TCO )的很大一部分,這突出了節(jié)能計算平臺的重要性。我們的測試表明, NVIDIA 平臺提供的每瓦吞吐量比其他產(chǎn)品高出 2.8 倍。

pYYBAGKxb0qARA-FAABX2KZXRmk192.png

圖 5 NVIDIA A100 能效比較

顯示 A100 與 MI250 的效率比– NVIDIA 的效率越高越好。對每個應(yīng)用程序的多個數(shù)據(jù)集(不同)進行 Geomean 。效率是指 GPU 使用 NVIDIA SMI 和 ROCm 中的等效功能測量的性能/功耗(瓦特)|

AMD MI250 在千兆字節(jié) M262-HD5-00 上測量,具有( 2 )個 AMD EPYC 7763 和 4 個 AMD Instinct ? MI250 OAM ( 128 GB HBM2e ) 500W GPU 帶 AMD Infinity 結(jié)構(gòu)? 技術(shù) NVIDIA 在 ProLiant XL645d Gen10 Plus 上運行,使用雙 EPYC 7713 CPU 和 4x A100 ( 80 GB ) SXM4

LAMMPS develop \ u db00b49 ( AMD ) develop \ u 2a35ec2 ( NVIDIA )數(shù)據(jù)集 ReaxFF / c 、 Tersoff 、 Leonard Jones 、 SNAP | NAMD 3.0alpha9 數(shù)據(jù)集 STMV \ u NVE | OpenMM 7.7.0 數(shù)據(jù)集的集成運行: amber20 STMV 、 amber20 Cellular 、 apoa1pme 、 pme |

GROMACS 2021.1 ( AMD ) 2022 ( NVIDIA )數(shù)據(jù)集 ADH-Dodec (氫鍵), STMV (氫鍵)|琥珀色 20 。 xx \ U rocm \ U mr \ U 202108 ( AMD )和 20.12-AT \ U 21.12 ( NVIDIA )數(shù)據(jù)集 Cellular \ u NVE 、 STMV \ u NVE | 1x MI250 有 2x GCD

NVIDIA A100 GPU 卓越的性能和電源效率是多年不懈的軟硬件協(xié)同優(yōu)化的結(jié)果,以最大限度地提高應(yīng)用程序性能和效率。

A100 還以單處理器的形式出現(xiàn)在操作系統(tǒng)中,只需要啟動一個 MPI 列即可充分利用其性能。而且,由于節(jié)點中所有 GPU 之間的 600 GB / s NVLink 連接 , A100 在規(guī)模上提供了優(yōu)異的性能。

AI 和 HPC 融合

正如加速計算為建模和仿真應(yīng)用帶來了數(shù)倍的加速一樣, AI 和 HPC 的結(jié)合將帶來性能的下一步功能提升,開啟下一波科學(xué)發(fā)現(xiàn)。

關(guān)于作者

Ashraf Eassa 是NVIDIA 加速計算集團內(nèi)部的高級產(chǎn)品營銷經(jīng)理。

Chris 是 NVIDIA HPC 和 AI 的高級技術(shù)營銷經(jīng)理。此前,他在 IBM 擔(dān)任聚合 HPC 和 AI 的產(chǎn)品經(jīng)理,將 HPC 、 AI 和優(yōu)化產(chǎn)品推向市場,專注于電子設(shè)計、航空航天和汽車行業(yè)。 Chris 擁有航空工程碩士學(xué)位,專注于設(shè)計優(yōu)化。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 電源
    +關(guān)注

    關(guān)注

    185

    文章

    19027

    瀏覽量

    264892
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20362

    瀏覽量

    255492
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5717

    瀏覽量

    110200
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    沐曦股份攜手合作伙伴完成全產(chǎn)品兼容性互認(rèn)證

    近日,沐曦股份攜手粵港澳大灣區(qū)國家技術(shù)創(chuàng)新中心工業(yè)軟件產(chǎn)業(yè)發(fā)展中心(以下簡稱“國創(chuàng)工軟”)、國產(chǎn)高性能服務(wù)器與操作系統(tǒng)合作伙伴,以及十灃科技、邁曦軟件、適創(chuàng)科技、舜云科技四家國產(chǎn)CAE(計算機輔助工程)工業(yè)仿真軟件領(lǐng)軍企業(yè),在沐
    的頭像 發(fā)表于 04-23 14:27 ?396次閱讀
    沐曦股份攜手合作伙伴完成全<b class='flag-5'>棧</b>產(chǎn)品兼容性互認(rèn)證

    Vibe Coding AI開發(fā)實戰(zhàn)

    Coding AI開發(fā)模式憑借其獨特的優(yōu)勢,正成為開發(fā)者們提升效率、加速創(chuàng)新的新利器。(搜星 課it。top) Vibe Coding:重新定義開發(fā)范式 Vibe Coding,字面意思是“氛圍編程
    發(fā)表于 04-15 16:02

    中科曙光助力海南師范大學(xué)國產(chǎn)超智融合計算平臺正式上線

    近日,由中科曙光提供技術(shù)支撐的海南師范大學(xué)國產(chǎn)超智融合計算平臺正式上線。該平臺由人工智能學(xué)院承建,旨在構(gòu)建“智慧教育—智慧生態(tài)—AI”三位一體研究體系,為海南自貿(mào)港科研創(chuàng)新注入強勁
    的頭像 發(fā)表于 04-10 17:13 ?1220次閱讀

    國產(chǎn)高性能ONFI IP解決方案解析

    1. 什么是ONFI IP?其在AI時代的作用是什么?ONFI (Open NAND Flash Interface) 是連接閃存控制器與NAND顆粒的關(guān)鍵高速接口協(xié)議。在AI和高性能計算(HPC
    發(fā)表于 01-13 16:15

    摩爾線程在MDC 2025重磅發(fā)布創(chuàng)新成果

    12月20日,在首屆MUSA開發(fā)者大會上,摩爾線程創(chuàng)始人、董事長兼CEO張建中發(fā)表主題演講,系統(tǒng)展示了以自主MUSA統(tǒng)一架構(gòu)為核心的創(chuàng)新成果,全面展現(xiàn)公司在技術(shù)和生態(tài)上的關(guān)鍵突破與前瞻布局。
    的頭像 發(fā)表于 12-22 18:04 ?1623次閱讀

    AMD攜式AI解決方案亮相進博會,賦能人工智能+

    2025年11月5日,上海: 第八屆中國國際進口博覽會在上海正式啟幕。作為全球高性能與自適應(yīng)計算領(lǐng)導(dǎo)者,AMD連續(xù)五年亮相進博會。今年,以“AMD賦能人工智能+”為主題,AMD全面展示貫穿云、端
    的頭像 發(fā)表于 11-06 12:53 ?394次閱讀
    AMD攜<b class='flag-5'>全</b><b class='flag-5'>棧</b>式AI解決方案亮相進博會,賦能人工智能+

    數(shù)據(jù)復(fù)用高性能池化層設(shè)計思路分享

    大家好,本團隊此次分享的內(nèi)容為可實現(xiàn)數(shù)據(jù)復(fù)用高性能池化層設(shè)計思路,核心部分主要由以下3個部分組成; 1.SRAM讀取模塊;——池化使用的存儲為SRAM 基于SRAM讀與寫時序,約束池化模塊讀與寫
    發(fā)表于 10-29 07:10

    自動駕駛中常提的“”是個啥?有必要“”嗎?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)落地,越來越多車企公布了自己的自動駕駛方案,在很多車企的宣傳中,會使用“自研”的說法來證明自己的實力。所謂“”,字面意思是全套技術(shù)
    的頭像 發(fā)表于 08-27 09:43 ?1515次閱讀
    自動駕駛中常提的“<b class='flag-5'>全</b><b class='flag-5'>棧</b>”是個啥?有必要“<b class='flag-5'>全</b><b class='flag-5'>棧</b>”嗎?

    黑芝麻智能AI機器人計算平臺榮膺國際大獎

    黑芝麻智能AI機器人計算平臺榮膺新加坡年度"GO! Technology Utilisation Winner",作為面向新一代機器人實時AI推理打造的
    的頭像 發(fā)表于 08-07 17:35 ?2453次閱讀

    AI應(yīng)用創(chuàng)新技術(shù)融合分論壇即將召開

    2025開放原子開源生態(tài)大會即將啟幕,其中 “AI應(yīng)用創(chuàng)新技術(shù)融合分論壇”將于 7月24日重磅亮相。論壇聚焦人工智能技術(shù)與開源生態(tài)的深度融合,邀請各領(lǐng)域用戶、技術(shù)專家、開發(fā)者分享AI應(yīng)用
    的頭像 發(fā)表于 07-23 09:54 ?1160次閱讀

    知合計算:RISC-V架構(gòu)創(chuàng)新,阿基米德系列劍指高性能計算

    在2025 RISC-V中國峰會上,知合計算處理器設(shè)計總監(jiān)劉暢就高性能RISC-V處理器架構(gòu)探索與實踐進行了精彩分享。 在以X86和ARM為代表的處理器架構(gòu)之下,RISC-V在高性能計算
    的頭像 發(fā)表于 07-18 14:17 ?3076次閱讀
    知合<b class='flag-5'>計算</b>:RISC-V架構(gòu)<b class='flag-5'>創(chuàng)新</b>,阿基米德系列劍指<b class='flag-5'>高性能</b><b class='flag-5'>計算</b>

    高性能計算集群在AI領(lǐng)域的應(yīng)用前景

    隨著人工智能技術(shù)的飛速發(fā)展,高性能計算集群(HPC)在AI領(lǐng)域的應(yīng)用前景日益受到關(guān)注。HPC提供的計算能力與AI的智能分析能力相結(jié)合,為解決復(fù)雜問題和推動科學(xué)研究提供了新的動力。1、H
    的頭像 發(fā)表于 06-23 13:07 ?1464次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>計算</b>集群在AI領(lǐng)域的應(yīng)用前景

    使用樹莓派構(gòu)建 Slurm 高性能計算集群:分步指南!

    在這篇文章中,我將分享我嘗試使用樹莓派構(gòu)建Slurm高性能計算集群的經(jīng)歷。一段時間前,我開始使用這個集群作為測試平臺,來創(chuàng)建一個更大的、支持GPU計算高性能
    的頭像 發(fā)表于 06-17 16:27 ?2030次閱讀
    使用樹莓派構(gòu)建 Slurm <b class='flag-5'>高性能</b><b class='flag-5'>計算</b>集群:分步指南!

    佑駕創(chuàng)新獲長安汽車量產(chǎn)定點 為其提供高性能輔助駕駛域控制器產(chǎn)品

    佑駕創(chuàng)新(2431.HK)近日宣布,與長安汽車達成重要合作,獲得其旗下新能源自主品牌主力車型的定點項目。佑駕創(chuàng)新作為選定供應(yīng)商,將為其提供高性能輔助駕駛域控制器產(chǎn)品,共同助推全場景輔助駕駛技術(shù)
    的頭像 發(fā)表于 06-06 09:54 ?1723次閱讀

    高性能計算面臨的芯片挑戰(zhàn)

    高性能計算(簡稱HPC)聽起來像是科學(xué)家在秘密實驗室里才會用到的東西,但它實際上是當(dāng)今世界上最重要的技術(shù)之一。從預(yù)測天氣到研發(fā)新藥,甚至訓(xùn)練人工智能,高性能計算系統(tǒng)都能幫助解決普通
    的頭像 發(fā)表于 05-27 11:08 ?1291次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>計算</b>面臨的芯片挑戰(zhàn)
    舒兰市| 八宿县| 阿合奇县| 新泰市| 鹰潭市| 宾阳县| 汽车| 大英县| 乌海市| 乐陵市| 江安县| 凤庆县| 博白县| 潮安县| 龙泉市| 望江县| 临邑县| 星座| 梁平县| 高平市| 鲁甸县| 县级市| 浪卡子县| 汶川县| 阜平县| 广宗县| 马龙县| 保亭| 信宜市| 广德县| 富平县| 朝阳区| 张家界市| 西乌珠穆沁旗| 绥化市| 南岸区| 焦作市| 晋中市| 曲松县| 罗源县| 托克托县|