日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Summit系統(tǒng)創(chuàng)造性能新記錄,突破了每秒100千萬(wàn)億的次浮點(diǎn)運(yùn)算!

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:未知 ? 作者:工程師黃明星 ? 2018-07-23 17:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室的Summit系統(tǒng)呈獻(xiàn)了又一場(chǎng)超級(jí)計(jì)算盛宴,創(chuàng)造了又一項(xiàng)性能記錄,該系統(tǒng)首次突破了每秒100千萬(wàn)億次浮點(diǎn)運(yùn)算性能的壁壘。

在最新發(fā)布的Top500榜單中,大部分系統(tǒng)的新處理能力均來(lái)自GPU。目前世界七大超級(jí)計(jì)算機(jī)中有五款都在采用GPU,包括美國(guó)、歐洲和日本的頂尖系統(tǒng)。

而對(duì)于Summit,GPU滿足了其95%的浮點(diǎn)運(yùn)算性能要求。隨著摩爾定律的不斷放緩,加速計(jì)算顯然已經(jīng)成為助推器,將很快推動(dòng)我們進(jìn)入百億億次級(jí)計(jì)算時(shí)代。

Summit系統(tǒng)創(chuàng)造性能新記錄,突破了每秒100千萬(wàn)億的次浮點(diǎn)運(yùn)算!

這樣的計(jì)算性能由NVIDIA Volta Tensor Core GPU提供,其多精度計(jì)算能力將能同時(shí)應(yīng)對(duì)高性能計(jì)算所需的高精度計(jì)算挑戰(zhàn),以及深度學(xué)習(xí)所需的高效處理的要求。

加速計(jì)算登峰造極

每年兩次的超級(jí)計(jì)算展見(jiàn)證了加速計(jì)算近年來(lái)的飛速發(fā)展。在ISC 2018上,這一領(lǐng)域再次實(shí)現(xiàn)了突破。

Summit顯然是最有力的證據(jù)。該系統(tǒng)采用27648塊Volta Tensor Core GPU,其測(cè)得的雙精度性能達(dá)到每秒122千萬(wàn)億次浮點(diǎn)運(yùn)算。它每秒的性能相當(dāng)于地球上所有人以每秒執(zhí)行一次計(jì)算的速度執(zhí)行一整年的任務(wù)。

AI性能更加令人矚目,運(yùn)算速度可達(dá)到300億億次。這相當(dāng)于整個(gè)地球上的人在15年內(nèi)每秒進(jìn)行一次計(jì)算。

至省與至簡(jiǎn)

多精度計(jì)算開(kāi)辟了新的可能性。但是,如果GPU無(wú)法提供非凡的效率,相應(yīng)的效用將受限。

在最新的Green500榜單,GPU為全球20個(gè)最具環(huán)保效益的系統(tǒng)中的17個(gè)提供支持。Summit不僅是世界上速度最快的系統(tǒng),而且在新確立的“三級(jí)”類(lèi)別(Green500 榜單中最嚴(yán)格的級(jí)別)中是世界上最高效的系統(tǒng)。

在過(guò)去10年中,GPU已經(jīng)幫助美國(guó)橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室將其超級(jí)計(jì)算機(jī)的能源效率提高了50倍,這些計(jì)算機(jī)包括僅支持CPU的Jaguar及由GPU加速的Titan和Summit。

而所有這些僅僅是一個(gè)開(kāi)始。實(shí)現(xiàn)百億億次級(jí)計(jì)算需要在能源效率方面實(shí)現(xiàn)更大突破。以Green500榜單中系統(tǒng)的平均效率計(jì)算,為百億億次級(jí)計(jì)算提供動(dòng)力將需要超過(guò)3億瓦的電能,這相當(dāng)于25萬(wàn)個(gè)美國(guó)家庭的電力需求。需要將能效提高10倍才能使百億億次級(jí)計(jì)算在3千萬(wàn)瓦條件下運(yùn)行。

GPU正在幫助Summit實(shí)現(xiàn)這一目標(biāo)。

破解難題

最新頂尖系統(tǒng)具備的處理能力曾經(jīng)令人無(wú)法想象,但現(xiàn)在的研究人員將能夠借助這些系統(tǒng)解決一些科學(xué)上最棘手的難題。

比如,遺傳學(xué)。帕金森癥和阿爾茨海默癥等可以稱(chēng)得上是“毀滅性”疾病,而GPU的計(jì)算能力將可以破解這樣的難題,找出人類(lèi)基因組的數(shù)十億個(gè)AGCT DNA對(duì)與諸如此類(lèi)疾病之間的聯(lián)系。Summit已在梳理個(gè)人基因,以實(shí)現(xiàn)在阿片成癮(美國(guó)人的主要致死原因之一)研究方面的進(jìn)展。

又如,材料。超導(dǎo)材料可用于為MRI設(shè)備、粒子加速器或磁聚變裝置開(kāi)發(fā)功能強(qiáng)大的科學(xué)磁體。然而,目前的材料十分易碎、難以制造,并且只能在非常低的溫度下工作。Summit正在幫助模擬和發(fā)現(xiàn)具有類(lèi)金屬特性且可在室溫下工作的新型超導(dǎo)材料。

再如,癌癥研究。對(duì)抗癌癥的關(guān)鍵在于開(kāi)發(fā)可以自動(dòng)提取、分析和分類(lèi)健康數(shù)據(jù)的工具,以便揭示各種疾病因素(例如基因、生物學(xué)標(biāo)記和環(huán)境)之間隱藏的關(guān)系。通過(guò)與基于文本的報(bào)告和醫(yī)學(xué)影像等非結(jié)構(gòu)化數(shù)據(jù)配合使用,在Summit上擴(kuò)展的深度學(xué)習(xí)算法將有助于醫(yī)學(xué)研究人員全面了解美國(guó)癌癥患者的整體情況。

Summit系統(tǒng)創(chuàng)造性能新記錄,突破了每秒100千萬(wàn)億的次浮點(diǎn)運(yùn)算!

繼續(xù)前進(jìn)

每個(gè)國(guó)家/地區(qū)都在競(jìng)相構(gòu)建百億億次級(jí)計(jì)算系統(tǒng)。2025年的Top500榜單可能會(huì)看到十多款這樣的系統(tǒng),而且多精度加速計(jì)算成為平臺(tái)首選。相比之下,本次Top500榜單上的所有系統(tǒng)加在一起才勉強(qiáng)實(shí)現(xiàn)一百億億次級(jí)的總計(jì)算能力。這足以說(shuō)明未來(lái)蘊(yùn)藏著巨大機(jī)遇。

加速計(jì)算的一大吸引力在于它屬于全棧創(chuàng)新:從架構(gòu)一直到系統(tǒng)、加速堆棧、開(kāi)發(fā)人員和半導(dǎo)體工藝,無(wú)一不體現(xiàn)著創(chuàng)新精神。

NVIDIA已經(jīng)投入了超過(guò)10年的時(shí)間來(lái)加速整個(gè)HPC堆棧的開(kāi)發(fā)。

當(dāng)我們發(fā)布第一款支持CUDA的GPU時(shí),它無(wú)法運(yùn)行任何應(yīng)用程序。我們需要為全新的加速環(huán)境重新設(shè)計(jì)所有的應(yīng)用程序、算法、庫(kù)、工具、編譯器、操作系統(tǒng)和系統(tǒng)設(shè)計(jì)。打造一種能夠處理數(shù)學(xué)處理器的芯片很容易,而要使全球高性能計(jì)算開(kāi)發(fā)人員可以使用和編程這些處理器,則需要在整個(gè)堆棧上實(shí)現(xiàn)非凡的創(chuàng)新。

結(jié)果,550多款高性能計(jì)算和AI應(yīng)用程序都由GPU加速,其中包括排名靠前的15種應(yīng)用程序和所有AI框架。致力于此領(lǐng)域的開(kāi)發(fā)人員數(shù)量在過(guò)去的五年里增加了10倍,現(xiàn)已接近一百萬(wàn)。而且,利用我們NGC容器注冊(cè)上的最新高性能計(jì)算容器,高性能計(jì)算用戶(hù)現(xiàn)在可以在他們的系統(tǒng)或Tensor Core GPU驅(qū)動(dòng)的云上輕松點(diǎn)擊、下載并運(yùn)行最新的GPU加速應(yīng)用程序。

轉(zhuǎn)折與展望

在我們快速發(fā)展加速計(jì)算的同時(shí),一些人也正在尋找量子計(jì)算的下一個(gè)轉(zhuǎn)折點(diǎn),量子計(jì)算使用量子位元(“qubits”)而不是1和0來(lái)處理信息。

這些理論十分具有吸引力。在未來(lái)的某個(gè)時(shí)候,可能會(huì)出現(xiàn)一些在量子計(jì)算機(jī)上運(yùn)行的殺手級(jí)應(yīng)用程序(特別是在密碼學(xué)或量子化學(xué)領(lǐng)域),只需極小的功率即可利用超強(qiáng)的處理能力。

但在可預(yù)見(jiàn)的未來(lái),加速計(jì)算的勢(shì)頭似乎不可阻擋。NVIDIA會(huì)繼續(xù)致力于在高性能計(jì)算領(lǐng)域的創(chuàng)新,將實(shí)現(xiàn)百億億次級(jí)計(jì)算以及其為科學(xué)領(lǐng)域帶來(lái)的突破。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5696

    瀏覽量

    110142
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5283

    瀏覽量

    136103

原文標(biāo)題:加速計(jì)算成為助推器,帶我們進(jìn)入百億億次級(jí)計(jì)算時(shí)代

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    面向邊緣AI視覺(jué)的高性能算力模組解決方案 ——杰和科技LM2-100-V0深度解析

    的高性能邊緣AI加速方案。1.卓越的算力表現(xiàn)該模組搭載了專(zhuān)為邊緣計(jì)算場(chǎng)景優(yōu)化的NPU(神經(jīng)網(wǎng)絡(luò)處理單元),其峰值算力高達(dá)25TOPS(每秒萬(wàn)億運(yùn)算
    的頭像 發(fā)表于 04-21 13:37 ?1200次閱讀
    面向邊緣AI視覺(jué)的高<b class='flag-5'>性能</b>算力模組解決方案  ——杰和科技LM2-<b class='flag-5'>100</b>-V0深度解析

    深入解析TS68882:高性能浮點(diǎn)協(xié)處理器的技術(shù)探秘

    深入解析TS68882:高性能浮點(diǎn)協(xié)處理器的技術(shù)探秘 在當(dāng)今的電子世界中,高性能浮點(diǎn)運(yùn)算能力對(duì)于許多應(yīng)用場(chǎng)景來(lái)說(shuō)至關(guān)重要。TS68882作為
    的頭像 發(fā)表于 04-08 15:20 ?154次閱讀

    技嘉與趨境科技聯(lián)合部署AMaaS平臺(tái) 推動(dòng)本地大模型應(yīng)用加速落地

    CPU+GPU一體封裝設(shè)計(jì)的NVIDIA GB10 Grace Blackwell芯片,其具備1千萬(wàn)億/秒(浮點(diǎn)運(yùn)算)AI 性能、128G
    的頭像 發(fā)表于 03-12 15:11 ?216次閱讀
    技嘉與趨境科技聯(lián)合部署AMaaS平臺(tái) 推動(dòng)本地大模型應(yīng)用加速落地

    AI半導(dǎo)體萬(wàn)億浪潮中,2016系列10~60MHz溫補(bǔ)晶振撐起系統(tǒng)節(jié)奏

    AI?擴(kuò)建推動(dòng)半導(dǎo)體進(jìn)入千萬(wàn)億周期:AMD說(shuō)這是?1?萬(wàn)億美元的機(jī)會(huì);英偉達(dá)說(shuō)未來(lái)五年是?3–4?萬(wàn)億美元;博通預(yù)測(cè)定制硅將沖向?1000?億美元。
    的頭像 發(fā)表于 12-12 16:50 ?1347次閱讀
    AI半導(dǎo)體<b class='flag-5'>萬(wàn)億</b>浪潮中,2016系列10~60MHz溫補(bǔ)晶振撐起<b class='flag-5'>系統(tǒng)</b>節(jié)奏

    CW32F030C8T7是否支持浮點(diǎn)運(yùn)算

    CW32F030C8T7是否支持浮點(diǎn)運(yùn)算?如果需要執(zhí)行復(fù)雜的數(shù)**算,應(yīng)該如何處理?
    發(fā)表于 12-12 06:51

    蜂鳥(niǎo)內(nèi)核模塊浮點(diǎn)指令運(yùn)算數(shù)據(jù)的獲取

    蜂鳥(niǎo)E203是一款極低功耗的RISC-V處理器核。該處理器核采用了現(xiàn)代化的32位指令集架構(gòu),并具有高性能、低功耗、可擴(kuò)展性等優(yōu)點(diǎn)。 本文接續(xù)上一篇文章中探討的整型指令執(zhí)行路徑,進(jìn)一步講解浮點(diǎn)指令在內(nèi)
    發(fā)表于 10-24 13:39

    FPNew開(kāi)源浮點(diǎn)運(yùn)算單元工程建立

    在添加浮點(diǎn)運(yùn)算單元時(shí),可以引用開(kāi)源的浮點(diǎn)運(yùn)算器以簡(jiǎn)化所需工作任務(wù)壓力。在此我們采用了FPnew這個(gè)開(kāi)源工程,再次介紹一些如何將其導(dǎo)成vivado工程。 首先在github上下載fpn
    發(fā)表于 10-24 11:08

    浮點(diǎn)數(shù)是如何實(shí)現(xiàn)開(kāi)平方運(yùn)算

    摘要: 本文主要描述浮點(diǎn)數(shù)是如何實(shí)現(xiàn)開(kāi)平方運(yùn)算的。 簡(jiǎn)介 事實(shí)上,浮點(diǎn)數(shù)的開(kāi)平方運(yùn)算結(jié)構(gòu)與定點(diǎn)數(shù)甚至整數(shù)的開(kāi)平方運(yùn)算結(jié)構(gòu)是十分相似的,我
    發(fā)表于 10-24 08:42

    (九)浮點(diǎn)乘法指令設(shè)計(jì)

    ⊕ sb,得到結(jié)果的符號(hào)位 階碼相加減 按照定點(diǎn)整數(shù)的加減法運(yùn)算方法對(duì)兩個(gè)浮點(diǎn)數(shù)的階碼進(jìn)行加減運(yùn)算,因?yàn)橐?guī)格化數(shù)的價(jià)碼e滿足1≤e≤254,而ec有可能超出1~254范圍,所以當(dāng)1≤ec≤254,相乘結(jié)果
    發(fā)表于 10-24 07:11

    如何獲取蜂鳥(niǎo)內(nèi)核執(zhí)行模塊浮點(diǎn)指令的運(yùn)算數(shù)據(jù)

    蜂鳥(niǎo)E203是一款極低功耗的RISC-V處理器核。該處理器核采用了現(xiàn)代化的32位指令集架構(gòu),并具有高性能、低功耗、可擴(kuò)展性等優(yōu)點(diǎn)。 本文接續(xù)上一篇文章中探討的整型指令執(zhí)行路徑,進(jìn)一步講解浮點(diǎn)指令在內(nèi)
    發(fā)表于 10-24 07:10

    浮點(diǎn)運(yùn)算單元的設(shè)計(jì)和優(yōu)化

    浮點(diǎn)運(yùn)算單元的設(shè)計(jì)和優(yōu)化可以從以下幾個(gè)方面入手: 1.浮點(diǎn)寄存器設(shè)計(jì):為了實(shí)現(xiàn)浮點(diǎn)運(yùn)算指令子集(RV32F或者RV32D),需要添加一組專(zhuān)用
    發(fā)表于 10-22 07:04

    使用Simulink自動(dòng)生成浮點(diǎn)運(yùn)算HDL代碼(Part 1)

    引言 想要實(shí)現(xiàn)浮點(diǎn)運(yùn)算功能,如果自己寫(xiě)Verilog代碼,需要花費(fèi)較多的時(shí)間和精力。好在Simulink HDL Coder工具箱提供了自動(dòng)代碼生成技術(shù)。下圖展示了HDL Coder如何生成浮點(diǎn)
    發(fā)表于 10-22 06:48

    risc-v中浮點(diǎn)運(yùn)算單元的使用及其設(shè)計(jì)考慮

    SUBTRACT)等。 在設(shè)計(jì)浮點(diǎn)運(yùn)算單元時(shí),通常需要考慮以下因素: 精度:可根據(jù)實(shí)際應(yīng)用需求選擇單精度浮點(diǎn)或雙精度浮點(diǎn),對(duì)于需要高精度計(jì)算的應(yīng)用可以選擇更高位的
    發(fā)表于 10-21 14:46

    【中科昊芯Core_DSC280025C開(kāi)發(fā)板試用體驗(yàn)】+1.開(kāi)箱之浮點(diǎn)計(jì)算對(duì)比

    STM32F407單片機(jī)浮點(diǎn)運(yùn)算性能 首先STM32F407單片機(jī)的主頻時(shí)168MHZ,我編寫(xiě)程序分別進(jìn)行1千萬(wàn)浮點(diǎn)
    發(fā)表于 06-29 10:01

    NVIDIA驅(qū)動(dòng)的現(xiàn)代超級(jí)計(jì)算機(jī)如何突破速度極限并推動(dòng)科學(xué)發(fā)展

    現(xiàn)代高性能計(jì)算不僅使得更快的計(jì)算成為可能,它正驅(qū)動(dòng)著 AI 系統(tǒng)解鎖更多領(lǐng)域的科學(xué)突破。 高性能計(jì)算經(jīng)歷了多次迭代,每一都源于對(duì)技術(shù)的
    的頭像 發(fā)表于 06-26 19:39 ?1458次閱讀
    NVIDIA驅(qū)動(dòng)的現(xiàn)代超級(jí)計(jì)算機(jī)如何<b class='flag-5'>突破</b>速度極限并推動(dòng)科學(xué)發(fā)展
    伊川县| 会泽县| 阳城县| 莎车县| 永安市| 柳州市| 尚志市| 贵定县| 陇西县| 青岛市| 商城县| 崇明县| 延川县| 桦川县| 库车县| 宝应县| 洪江市| 南木林县| 双城市| 株洲县| 项城市| 陆丰市| 夏河县| 昭苏县| 海原县| 阳信县| 德兴市| 宿州市| 大庆市| 河间市| 于田县| 瓮安县| 桃源县| 临海市| 阿克| 郁南县| 手游| 万宁市| 鞍山市| 宜章县| 乌鲁木齐市|