日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國內(nèi)為何造不出高能效的超級計(jì)算機(jī)? 對于每個(gè)多家的超算系統(tǒng)來說,能占據(jù)TOP500超算榜單的前十是一項(xiàng)極

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2022-07-20 08:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

對于每個(gè)多家的超算系統(tǒng)來說,能占據(jù)TOP500超算榜單的前十是一項(xiàng)極大的榮譽(yù)。然而隨著美國、日本、歐洲與中國的E級超算計(jì)劃紛紛提上日程,超算系統(tǒng)功耗墻的問題也開始顯現(xiàn),一臺E級超算系統(tǒng)帶來的功耗已經(jīng)再也無法被忽視了。而早在2013年開始發(fā)布的榜單GREEN500,則開始按能效比進(jìn)行排名,為的就是鼓勵各國各廠商開始高能效比的超算設(shè)計(jì)。

國產(chǎn)超算面臨的功耗問題

在面臨功耗墻的挑戰(zhàn)時(shí),國內(nèi)超算又是如何解決的呢?這個(gè)問題尤其困擾著排名前列的幾大研究型超算,比如國家并行計(jì)算機(jī)工程技術(shù)研究中心研制的神威太湖之光超級計(jì)算機(jī)。畢竟如果只拼性能,不看功耗,與超算的設(shè)計(jì)理念其實(shí)是背道而馳的。

我們看前十的超算中,乃至前100的超算中,基本都是采購AMD、英特爾英偉達(dá)的硬件,再交由HPE、聯(lián)想、浪潮等廠商打造整個(gè)超算系統(tǒng)。這對于不涉及生產(chǎn)制造的一些研究中心來說,可以說是一個(gè)投入大成本但省去麻煩的選擇。對于他們來說,在功耗上也能收獲好處,那就是這些硬件廠商往往已經(jīng)在設(shè)計(jì)之初考慮到了低功耗,而且也有完備的電源、功耗管理方案。

但這些方案對于我國的研究型超算來說就不太適用了,且不說國內(nèi)各大超算中心已經(jīng)進(jìn)入實(shí)體清單,根本買不到這些處理器。再者此類方案也無法套用在自研的神威太湖之光上系統(tǒng)上,因?yàn)檫@臺超算所用的不是商業(yè)組件,也不是傳統(tǒng)的x86多核架構(gòu),而是申威26010處理器的眾核架構(gòu)。

神威太湖之光超級計(jì)算機(jī) / 國家超級計(jì)算無錫中心

申威26010處理器在開發(fā)之初就用上了低功耗設(shè)計(jì),比如其結(jié)構(gòu)就是通過集成眾多核心來提升性能,降低單核最高工作頻率的要求,從而避免了躥升的功率。而且在眾核架構(gòu)下,其核心還支持深度睡眠、淺睡眠和低功耗等運(yùn)行模式,避免了無工作負(fù)載的核心帶來額外的功耗。除了邏輯部分以外,其緩存、I/O也都采用了低功耗的設(shè)計(jì),使得整個(gè)260核處理器的峰值功耗只有不到300W。

但單靠芯片上的低功耗設(shè)計(jì)是沒法將整個(gè)超算系統(tǒng)的能效提上去的,從最新一期的GREEN500榜單中,就展現(xiàn)了我國的超算在能效上明顯已經(jīng)開始落后于人了。使用申威26010處理器的神威太湖之光在TOP500的性能排行榜上排名第六,但在GREEN500上卻只有61名的成績。

同樣的還有天河2號,這臺超算作為曾經(jīng)的驕傲,如今仍在TOP500上占據(jù)了第九的席位,但在GREEN500上就已經(jīng)落到百余名之后了。難不成國內(nèi)的頂尖超算真的就無法高性能與低功耗兼得嗎?

下一代E級神威和E級天河


這兩臺超算背后的團(tuán)隊(duì)并不是沒有發(fā)現(xiàn)功耗問題,而他們將解決這些挑戰(zhàn)的手段都放在了下一代E級的超算開發(fā)上。在7月份的《計(jì)算機(jī)學(xué)報(bào)》中,國家并行計(jì)算機(jī)工程技術(shù)研究中心的幾名研究院發(fā)布了神威E級原型機(jī)所用到的功耗管理技術(shù)。而這一次,E級的神威系統(tǒng)用上了軟硬協(xié)同的多層級功耗管理,包括從基礎(chǔ)設(shè)施、編譯和細(xì)粒度上開展功耗優(yōu)化。

神威E級原型機(jī)換上了全新的申威26010+眾核處理器,同樣是4個(gè)運(yùn)算控制核心+256個(gè)運(yùn)算核心的260核配置。在神威的E級原型機(jī)上,兩個(gè)處理器構(gòu)成一個(gè)節(jié)點(diǎn),整個(gè)系統(tǒng)由512個(gè)節(jié)點(diǎn)構(gòu)成,峰值性能達(dá)到了3.13PFlops。

神威E級原型機(jī)用上了低功耗編譯優(yōu)化技術(shù),基于硬件低功耗指令,通過指令調(diào)度/指令插樁,針對低功耗循環(huán)優(yōu)化和調(diào)度優(yōu)化,來節(jié)能降耗,從測試結(jié)果來看,降低了10%的功耗。不僅是芯片,神威E級原型機(jī)還用上了節(jié)點(diǎn)級、作業(yè)級乃至系統(tǒng)級的功耗管理。比如在節(jié)點(diǎn)層面上,如果計(jì)算陣列無任務(wù)時(shí),系統(tǒng)會選擇斷開陣列時(shí)鐘,實(shí)現(xiàn)陣列睡眠,節(jié)約節(jié)點(diǎn)功耗的63%。

至于基礎(chǔ)設(shè)施上的節(jié)能,還是在供電和冷卻上,文章中只提到了供電系統(tǒng)上的節(jié)能優(yōu)化,比如利用系統(tǒng)功耗量化監(jiān)測來完成高效電能變換等。而冷卻系統(tǒng)上的優(yōu)化我們已經(jīng)在神威太湖之光上看到了一部分,那就是增加水泵變頻器等自動化控制系統(tǒng),實(shí)時(shí)調(diào)整輸出保證高速運(yùn)轉(zhuǎn)。

至于E級的下一代天河超算“天河3號”,其實(shí)也早已通過原型機(jī)/驗(yàn)證系統(tǒng)在能效上展現(xiàn)了不錯(cuò)的成績,但并不是通用計(jì)算,而是大數(shù)據(jù)圖計(jì)算。在今年六月公布的大數(shù)據(jù)圖計(jì)算能效比排名Big Data Green Graph500上,天河E級原型機(jī)系統(tǒng)提交的新成績再度打破紀(jì)錄,奪下了第一名的位置,甚至是在同樣的核心數(shù)量下,超過了第一次提交成績近50%。

僅僅只是高能效還不夠?


接著,我們來聊聊另一個(gè)超算的能耗問題,此次我會不以在GREEN500并列第一第二的Frontier單機(jī)柜/超算系統(tǒng)為例,而是帶大家看看排名第三,但硬件架構(gòu)與Frontier基本一致的歐洲超算LUMI,之所以選擇這臺超算,也是因?yàn)樗诠墓芾砩嫌兄恍┆?dú)到之處。

LUMI配備了AMD第三代EPYC 64核CPU和Instinct MI250X GPU,與Frontier相同,但在規(guī)模上還是不比后者。這臺由歐洲高性能計(jì)算聯(lián)盟(EuroHPC)和LUMI聯(lián)盟成員國出資打造的機(jī)器,將能效比做到了51.6GFlops/W的高度,略遜于52.227GFlops/W的Frontier,但這個(gè)第三名已經(jīng)足以自證實(shí)力了。

固然這些超算的能效比和PUE(數(shù)據(jù)中心能源效率指標(biāo))結(jié)果都相當(dāng)驚艷,但如今圍繞這一榜單的爭論也開始出現(xiàn),那就是供給超算系統(tǒng)的能源究竟從哪來?究其緣由,我們之所以想要提高超算的能效比,就是為了不斷減少其龐大系統(tǒng)帶來的碳足跡。但設(shè)想一下,如果一臺超算擁有極高的能效比,但其能源卻是完全來自煤電,這樣的話在減少碳足跡上起到的作用可以說微乎其微了,而這也是LUMI這臺超算區(qū)別于其他超算的地方。

LUMI超級計(jì)算機(jī) / LUMI聯(lián)盟
LUMI超算選擇了芬蘭的卡亞尼市的一家舊造紙廠廢棄后的棕地開建,這是因?yàn)閷τ趪?yán)寒的北歐國家來說,如果重新選擇一塊綠地的話,短暫的夏日會使得建設(shè)時(shí)間縮短,進(jìn)而拖慢項(xiàng)目進(jìn)度,況且建設(shè)本身也是一個(gè)高碳排放的過程。還有一個(gè)原因,那就是該地區(qū)已經(jīng)接入了芬蘭國家電網(wǎng)的線路,可以為他們實(shí)現(xiàn)100%的純水電供應(yīng),最高可達(dá)1000多MW,不僅如此,LUMI還有來自風(fēng)電場的額外饋電線路。

除去可再生能源,LUMI也能將散發(fā)的多余熱量出售給卡亞尼市,單靠LUMI的廢熱,就能解決卡亞尼市周邊20%的區(qū)域供熱,還能多賺一筆,降低了運(yùn)營的凈成本。如果只算超算運(yùn)營的話,LUMI超算甚至可以看成是“負(fù)碳足跡”的,這也是歐洲本土能源發(fā)展多年來的成果,LUMI在享受其能源福利的同時(shí),也對本地的能源供應(yīng)做出了貢獻(xiàn)。

寫在最后

固然通過以上這些信息,讓我們對未來國內(nèi)E級超算的能效比有了信心。不過以上這些還只是基于原型機(jī)實(shí)現(xiàn)的能效比提升,多個(gè)節(jié)點(diǎn)組成的超算系統(tǒng)由于引入了額外的功耗,而且性能也不是單純的線性提升,所以在能耗比上還是會有些許下降的,這點(diǎn)從Frontier和富岳兩臺超算上也能看出。

單機(jī)柜的Frontier TDS在GREEN500上排名第一,能效比達(dá)到了62.684GFlops/W,而整個(gè)Frontier 超算系統(tǒng)位列第二,能效比降為52.227GFlops/W,能效比有了16.7%的下降。而富岳的A64FX原型機(jī)在2020榜單上的能效比為16.285GFlops/W,而整個(gè)富岳超算的能效比為14.665GFlops/W,降低了10%左右。雖然下降的幅度不多,但相較整個(gè)超算系統(tǒng)整年的功耗來看,還是相當(dāng)龐大的。

再者就是能源供給上的改造,無論是濟(jì)南超算中心,還是天津超算中心,都可以先在超算項(xiàng)目上先行開展光伏、風(fēng)能等可再生綠色能源的供電改造,為下一代神威、天河在基礎(chǔ)設(shè)施的節(jié)能減碳上做好鋪墊。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI驅(qū)動量子化學(xué)計(jì)算!4100萬核心國產(chǎn)取得世界級突破!

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)中國的高光時(shí)刻,是2016年到2017年期間,神威·太湖之光連續(xù)四次登頂全球超級計(jì)算機(jī)TOP
    的頭像 發(fā)表于 10-26 06:15 ?1.1w次閱讀

    中央E/E架構(gòu),芯馳重磅發(fā)布“中央智控小腦AMU力基座+IO型區(qū)域控制”全套解決方案

    基座,以及為新代IO型區(qū)域控制器設(shè)計(jì)的E3610芯片方案。 芯馳MCU產(chǎn)品線總經(jīng)理張曦桐在發(fā)布會上介紹E3系列產(chǎn)品 集成AMU:賦中央
    發(fā)表于 04-28 10:46 ?993次閱讀
    賦<b class='flag-5'>能</b>中央<b class='flag-5'>超</b><b class='flag-5'>算</b>E/E架構(gòu),芯馳重磅發(fā)布“中央智控小腦AMU<b class='flag-5'>算</b>力基座+IO型區(qū)域控制”全套解決方案

    Supermicro推出緊湊型高能系統(tǒng):以邊緣力重構(gòu)AI應(yīng)用新范式

    近日,全球IT解決方案領(lǐng)導(dǎo)者Supermicro(微)宣布推出基于**AMD EPYC? 4005系列處理器**的緊湊型高能系統(tǒng),以“小體積、大
    的頭像 發(fā)表于 04-22 14:58 ?1533次閱讀

    中科曙光3套scaleX萬卡集群落地國家互聯(lián)網(wǎng)鄭州核心節(jié)點(diǎn)

    2月5日,由中科曙光提供的3套萬卡集群系統(tǒng)在國家互聯(lián)網(wǎng)鄭州核心節(jié)點(diǎn)同時(shí)上線試運(yùn)行,成為全國首個(gè)實(shí)現(xiàn)3萬卡部署、且實(shí)際投入運(yùn)營的最大國產(chǎn)AI
    的頭像 發(fā)表于 02-09 10:32 ?748次閱讀

    北大團(tuán)隊(duì)最新研究:AI芯片力提升數(shù)倍,提升90倍

    首次實(shí)現(xiàn)后摩爾新器件異質(zhì)集成的多物理域融合傅里葉變換系統(tǒng)。 ? 這全新計(jì)算架構(gòu)將傅里葉變換計(jì)算速度從當(dāng)前每秒約1300億次提升至每秒約5000億次,
    的頭像 發(fā)表于 01-15 09:31 ?2279次閱讀

    今日看點(diǎn):谷歌芯片實(shí)現(xiàn)量子計(jì)算比經(jīng)典快13000倍;NFC 技術(shù)突破:讀取距離從 5 毫米提升至 20 毫米

    谷歌芯片實(shí)現(xiàn)量子計(jì)算比經(jīng)典快13000倍 近日,谷歌在《自然》雜志披露與Willow芯片相關(guān)的量子計(jì)算突破性研究成果。該公司稱這是歷史上首次證明量子
    發(fā)表于 10-23 10:20 ?1776次閱讀

    昆侖芯科技參與發(fā)布節(jié)點(diǎn)智應(yīng)用“北京方案”

    9月26日,2025人工智能計(jì)算大會(AICC 2025)在京舉行,昆侖芯作為國產(chǎn) AI 芯片領(lǐng)域的代表,與30多家企業(yè)與機(jī)構(gòu)攜手,在北京市科委中關(guān)村管委會、北京市發(fā)展改革委的共同見證下,發(fā)布了《基于節(jié)點(diǎn)創(chuàng)新聯(lián)合體,打造行業(yè)智
    的頭像 發(fā)表于 09-29 17:06 ?1425次閱讀

    節(jié)點(diǎn)+集群”:華為撞出來的力之路

    節(jié)點(diǎn)+集群”,成為徹底解決AI力困局的契機(jī)
    的頭像 發(fā)表于 09-24 10:55 ?1377次閱讀
    “<b class='flag-5'>超</b>節(jié)點(diǎn)+集群”:華為撞出來的<b class='flag-5'>算</b>力之路

    CCF HPC China 2025鄂爾多斯完美謝幕,共譜新篇章

    全球三大盛會之,本屆大會延續(xù) “學(xué)術(shù)引領(lǐng)、產(chǎn)業(yè)融合” 特色,以學(xué)術(shù)研討的深度突破為核心,聯(lián)動全球力產(chǎn)業(yè)生態(tài)視野,交出了份兼具學(xué)術(shù)高
    的頭像 發(fā)表于 08-21 13:06 ?654次閱讀
    CCF HPC China 2025鄂爾多斯完美謝幕,共譜<b class='flag-5'>超</b><b class='flag-5'>算</b>新篇章

    發(fā)布節(jié)點(diǎn)服務(wù)器,128顆BM1690芯片組成

    的BM1690芯片組成的128顆芯片節(jié)點(diǎn),每層有16顆芯片,共8層,統(tǒng)裝在個(gè)服務(wù)器里。 ? 節(jié)點(diǎn)是通過高速互聯(lián)技術(shù),將大量服務(wù)器芯
    的頭像 發(fā)表于 08-03 07:33 ?8231次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>能</b>發(fā)布<b class='flag-5'>超</b>節(jié)點(diǎn)服務(wù)器,128顆BM1690芯片組成

    中國首條&quot;力光軌&quot;通車!國內(nèi)首個(gè)分布式光互連光交換節(jié)點(diǎn)發(fā)布

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)節(jié)點(diǎn)技術(shù)(SuperPod)是種通過高帶寬、低時(shí)延互連技術(shù),將大量 GPU芯片整合為統(tǒng)一超級計(jì)算單元的技術(shù)架構(gòu)。它突破了傳統(tǒng)單服務(wù)器架構(gòu)限制,將
    發(fā)表于 08-01 08:59 ?6664次閱讀
    中國首條&quot;<b class='flag-5'>算</b>力光軌&quot;通車!<b class='flag-5'>國內(nèi)</b>首個(gè)分布式光互連光交換<b class='flag-5'>超</b>節(jié)點(diǎn)發(fā)布

    NVIDIA助力AI超級計(jì)算機(jī)Isambard-AI投入使用

    英國布里斯托大學(xué)的超級計(jì)算機(jī) Isambard-AI 采用 NVIDIA Grace Hopper 超級芯片,其 AI 力達(dá)到了 21 ExaFLOPS,不僅是英國最快的
    的頭像 發(fā)表于 07-28 15:07 ?1468次閱讀

    NVIDIA驅(qū)動的現(xiàn)代超級計(jì)算機(jī)如何突破速度極限并推動科學(xué)發(fā)展

    ,研究人員用個(gè)人電腦構(gòu)建了強(qiáng)大的集群,甚至改造游戲顯卡,把它們用于科學(xué)研究。 當(dāng)今的高性能計(jì)算系統(tǒng)專為高速計(jì)算而設(shè)計(jì),其中許多都采用了 NVIDIA 加速計(jì)算技術(shù)。在 ISC 2025
    的頭像 發(fā)表于 06-26 19:39 ?1458次閱讀
    NVIDIA驅(qū)動的現(xiàn)代<b class='flag-5'>超級</b><b class='flag-5'>計(jì)算機(jī)</b>如何突破速度極限并推動科學(xué)發(fā)展

    軟通智完成億級A輪融資,加速AI力產(chǎn)業(yè)布局

    北京 2025年6月18日 /美通社/ -- 近日,軟通動力旗下軟通智科技(廣東)集團(tuán)有限公司(以下簡稱"軟通智")完成億級A輪融資,本輪融資由盛景嘉成創(chuàng)投領(lǐng)投,廣發(fā)信德、毅達(dá)資本等多家
    的頭像 發(fā)表于 06-18 15:37 ?729次閱讀

    Blue Lion超級計(jì)算機(jī)將在NVIDIA Vera Rubin上運(yùn)行

    德國萊布尼茨中心(LRZ)將迎來全新超級計(jì)算機(jī) Blue Lion,其力比該中心現(xiàn)有的 SuperMUC-NG 高性能
    的頭像 發(fā)表于 06-12 15:39 ?1390次閱讀
    贵定县| 洮南市| 托里县| 嘉定区| 剑川县| 睢宁县| 扎兰屯市| 桐柏县| 饶河县| 泊头市| 大姚县| 随州市| 佛学| 崇文区| 固镇县| 来宾市| 乌兰浩特市| 达日县| 望奎县| 潍坊市| 文昌市| 武鸣县| 措勤县| 大兴区| 缙云县| 沁阳市| 松江区| 屯留县| 舒兰市| 潢川县| 抚远县| 武强县| 伽师县| 内乡县| 张家口市| 崇信县| 台东县| 游戏| 龙南县| 牟定县| 红河县|