日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

美光DDR5內(nèi)存配合第四代AMD EPYC處理器,提升高性能計算工作負(fù)載

Micron美光科技 ? 來源:Micron美光科技 ? 作者:美光科技 ? 2022-12-20 09:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

美光與 AMD 聯(lián)手為客戶及數(shù)據(jù)中心平臺提供一流的用戶體驗。雙方在奧斯汀建立聯(lián)合服務(wù)器實驗室,以減少服務(wù)器內(nèi)存驗證時間,在產(chǎn)品驗證和發(fā)布期間共同進(jìn)行工作負(fù)載測試。

目前美光適用于數(shù)據(jù)中心的 DDR5 內(nèi)存和第四代 AMD EPYCTMTM (霄龍)處理器均已出貨,我們對其進(jìn)行了一些常見的高性能計算(HPC)工作負(fù)載基準(zhǔn)測試。

長期以來,超級計算機承擔(dān)著高性能計算工作負(fù)載。此類大規(guī)模的數(shù)據(jù)密集型工作負(fù)載需要運行 TB 級的數(shù)據(jù)量以進(jìn)行數(shù)百萬個并行操作,以解決人類世界的難題,如天氣和氣候預(yù)測;地震建模;化學(xué)、物理和生物分析等。

隨著計算機架構(gòu)的進(jìn)步,此類工作負(fù)載往往托管在超大型“可橫向擴展”的高性能服務(wù)器集群中。這些服務(wù)器集群需要集合最強大的算力、架構(gòu)、內(nèi)存和存儲基礎(chǔ)設(shè)施,以滿足關(guān)鍵工作負(fù)載對可擴展性、低延遲和高性能的需求。然而隨著服務(wù)器 CPU 的性能和吞吐量不斷增長,DDR4 無法提供足夠的內(nèi)存帶寬,來滿足不斷增長的高性能內(nèi)核。

c0d216ba-7f82-11ed-8abf-dac502259ad0.png

為緩解這一瓶頸,美光 DDR5 內(nèi)存與采用了 Zen 4 服務(wù)器架構(gòu)的第四代 AMD EPYC 處理器強強聯(lián)合,使服務(wù)器 CPU 能夠更好地匹配內(nèi)存產(chǎn)品,滿足數(shù)據(jù)密集型工作負(fù)載對性能和效率的需求。美光 DDR5 內(nèi)存可幫助企業(yè)從本地和云端數(shù)據(jù)中更快獲取洞察。我們對最新的 AMD Zen 4 96 核 CPU 和美光 DDR5 進(jìn)行了行業(yè)內(nèi)高性能計算工作負(fù)載基準(zhǔn)測試,所有結(jié)果均顯示性能提升了兩倍。

美光 DDR5 搭配第四代 AMD EPYC 處理器

在 STREAM 測試中實現(xiàn)內(nèi)存帶寬翻倍

STREAM1 是常見的基準(zhǔn)測試工具,用于測量高性能計算機的內(nèi)存帶寬,可捕獲高性能計算系統(tǒng)的峰值內(nèi)存帶寬。

該工作負(fù)載使用的軟件堆棧

● Alma 9 Linux kernel 5.14

● STREAM.f,2021 年 11 月 29 日發(fā)布版本

c10bf81c-7f82-11ed-8abf-dac502259ad0.png

測試設(shè)置

● DDR4 系統(tǒng)搭配第三代 64 核 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2的 RDIMM 內(nèi)存槽插滿,共 64GB

● DDR5 系統(tǒng)搭配第四代 96 核 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3的 RDIMM 內(nèi)存槽插滿,共 64GB

測試結(jié)果

● DDR5 系統(tǒng)每插槽內(nèi)存帶寬翻倍,達(dá)到 378 GB/s

● 該結(jié)果意味著客戶能運行更大規(guī)模的人工智能/機器學(xué)習(xí) (AI/ML) 項目,或利用 DDR5 增加的內(nèi)存帶寬進(jìn)行更多高性能計算。

c135cbf6-7f82-11ed-8abf-dac502259ad0.jpg

美光 DDR5

助力天氣研究和預(yù)報 (WRF)4 速度提升2倍

此次測試使用的高性能計算工作負(fù)載代碼針對天氣和氣候。WRF 模型在一些支持高性能浮點處理、高內(nèi)存帶寬、低延遲網(wǎng)絡(luò)等傳統(tǒng)高性能計算架構(gòu)中表現(xiàn)良好,測試對象為橫向分辨率為 2.5 公里的美國大陸地區(qū) (CONUS)。

該工作負(fù)載使用的軟件堆棧

● Alma 9 Linux kernel 5.14

● WRF 2.3.5 & 4.3.3

● Open MPI v4.1.1

測試設(shè)置

● DDR4 系統(tǒng)搭配第三代 64 核 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2的 RDIMM 內(nèi)存槽插滿,共 64GB

● DDR5 系統(tǒng)搭配第四代 96 核 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3的 RDIMM 內(nèi)存槽插滿,共 64GB

測試結(jié)果

● 美光 DDR5 搭配第四代 AMD EPYC 處理器,可實現(xiàn) 1.3567 時間步/秒 VS DDR4 系統(tǒng)的 2.8533 時間步/秒

● 速度更快意味著可使用更大的數(shù)據(jù)庫或運行更多模型以進(jìn)行天氣預(yù)測,進(jìn)而改善預(yù)測的準(zhǔn)確度。

美光 DDR5

助力 OpenFOAM5 速度提升2倍

OpenFOAM 是一種計算流體動力學(xué) (CFD) 的開源高性能計算工作負(fù)載,廣泛應(yīng)用于多個行業(yè),有助于縮短開發(fā)時間并降低成本。從消費類產(chǎn)品設(shè)計到航空航天設(shè)計,OpenFOAM 能夠模擬不同應(yīng)用中的物理互動,包括摩托車風(fēng)擋湍流。

在該模擬中,OpenFOAM 能夠計算摩托車和騎手周圍的穩(wěn)定氣流。OpenFOAM 能夠根據(jù)用戶指定的進(jìn)程數(shù)進(jìn)行負(fù)載均衡計算,以此將網(wǎng)格分解成多個部分并分配給不同的進(jìn)程求解。求解完成后,再將網(wǎng)格和解重新組合為單個域。

該工作負(fù)載使用的軟件堆棧

● OpenFOAM CFD 軟件?(版本8),其中摩托車網(wǎng)格尺寸為:600 x 240 x 240

● Alma 9 Linux kernel 5.14

● Open MPI v4.1.1

測試設(shè)置

● DDR4 系統(tǒng)搭配第三代 64 核 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2的 RDIMM 內(nèi)存槽插滿,共 64GB

● DDR5 系統(tǒng)搭配第四代 96 核 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3的 RDIMM 內(nèi)存槽插滿,共 64GB

測試結(jié)果

測試結(jié)果表明美光 DDR5 產(chǎn)品組合將 OpenFOAM 性能提高了 2.4 倍。OpenFOAM 為五大高性能計算軟件平臺之一,擁有大型開源社區(qū)。該軟件廣泛應(yīng)用于大學(xué)和研發(fā)中心,可利用高帶寬內(nèi)存和擁有密集內(nèi)核的高性能 CPU,實現(xiàn)高度的并行操作。

美光 DDR5

助力分子動力學(xué)6 速度提升2倍

CP2K 是一款開源量子化學(xué)工具,適用于許多應(yīng)用,包括固態(tài)生物系統(tǒng)模擬。CP2K 能夠為不同的建模方法提供通用的框架。此次測試對象為水 (H2O) 的密度泛函理論 (DFT),模擬盒子中共包含 6,144 個原子(2,048 個水分子)。

該工作負(fù)載使用的軟件堆棧

● H2O-DFT-LS.NREP4 及 H2O-DFT-LS

● Alma 9 Linux kernel 5.14

測試設(shè)置

● DDR4 系統(tǒng)搭配第三代64 核 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2的 RDIMM 內(nèi)存槽插滿,共 64GB

● DDR5 系統(tǒng)搭配第四代 96 核 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3的 RDIMM 內(nèi)存槽插滿,共 64GB

測試結(jié)果

測試結(jié)果表明美光 DDR5 產(chǎn)品組合將分子動力學(xué)性能提高了 2.1 倍。隨著內(nèi)核數(shù)和內(nèi)存帶寬增加,此類工作負(fù)載的性能也顯著提升。

結(jié)

目前我們只針對少量高性能計算工作負(fù)載進(jìn)行了測試,因此以上只是我們的初步成果。將高性能高帶寬內(nèi)存與最新的服務(wù)器處理器(如第四代 AMD EPYC 處理器)相結(jié)合,可為高性能計算客戶創(chuàng)造新的可能。我們期待更多企業(yè)數(shù)據(jù)中心和云服務(wù)商,能夠在新平臺上應(yīng)用美光 DDR5 產(chǎn)品,解鎖更高的性能與能效。

1 我們在 STREAM 基準(zhǔn)測試中配置了 25 億個向量的STREAM Benchmark——運行在一臺單 AMD CPU 系統(tǒng)上

2 AMD DDR4 系統(tǒng)為一臺 64 核 AMD EPYC 7763 處理器, DDR4-3200 MHz 的 RDIMM 內(nèi)存槽插滿,共 64GB

3 AMD DDR5 系統(tǒng)為一臺 96 核 AMD EPYC 9654 處理器, DDR5-4800 MHz 的 RDIMM 內(nèi)存槽插滿,共 64GB

4 橫向分辨率為 12.5 公里 CONUS 的 WRF 在 DDR4 系統(tǒng)上的運行時間為 929 秒,在 DDR5 系統(tǒng)上的運行時間為 287 秒(均包括存儲器的輸入/輸出時間)。該測試中 WRF 配置為 2.5 公里 CONUS,測試結(jié)果為 1.3567 時間步/ 秒, 相比之下 DDR4 的運行時間為 2.8533 時間步/秒。

5 針對 OpenFOAM,我們運行了三種變體:

5a:1004040 runtimes,DDR4 系統(tǒng)運行時間為 1,144 秒,DDR5 系統(tǒng)運行時間為 478 秒

5b:1084646 runtimes,DDR4 系統(tǒng)運行時間為 1,633 秒,DDR5 系統(tǒng)運行時間為 698 秒

5c:1305252 runtimes,DDR4 系統(tǒng)運行時間為 2,522秒,DDR5 系統(tǒng)運行時間為 1,091 秒

6 分子動力學(xué)工作負(fù)載在 DDR4 系統(tǒng)上的運行時間為 2,519 秒,在 DDR5 系統(tǒng)上的運行時間為 1,242 秒

本文作者

Krishna Yalamanchi

Krishna 擔(dān)任美光生態(tài)系統(tǒng)高級開發(fā)經(jīng)理,專注于研發(fā) DDR5 和 CXL 解決方案。他曾在英特爾 IT 部門任職,領(lǐng)導(dǎo) SAP HANA 的遷移工作,通過與SI、OEM 和云服務(wù)提供商共同搭建的合作伙伴生態(tài)系統(tǒng),推出了用于 SAP 工作負(fù)載的第三代與第四代 Intel Xeon 處理器。

本文作者

Sudharshan Vazhkudai

Sudharshan S. Vazhkudai 博士擔(dān)任美光系統(tǒng)架構(gòu)和工作負(fù)載分析總監(jiān)。他領(lǐng)導(dǎo)一支位于奧斯汀和印度海得拉巴的團(tuán)隊,致力于研究內(nèi)存和存儲(DDR、CXL、HBM 和 NVME)產(chǎn)品中層次結(jié)構(gòu)的可組合性,并優(yōu)化與數(shù)據(jù)中心工作負(fù)載相關(guān)的系統(tǒng)架構(gòu)。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20339

    瀏覽量

    255355
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5708

    瀏覽量

    140456
  • 美光
    +關(guān)注

    關(guān)注

    5

    文章

    742

    瀏覽量

    53367
  • DDR5
    +關(guān)注

    關(guān)注

    1

    文章

    485

    瀏覽量

    25822

原文標(biāo)題:美光 DDR5 內(nèi)存配合第四代 AMD EPYC 處理器,提升高性能計算工作負(fù)載

文章出處:【微信號:gh_195c6bf0b140,微信公眾號:Micron美光科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AMD推出 EPYC 嵌入式 2005 系列處理器 滿足長期部署需求

    AMD 推出 AMD EPYC(霄龍)嵌入式 2005 系列處理器正是為了滿足這些不斷演進(jìn)的需求。該系列處理器以小巧的 BGA(球柵陣列)封
    的頭像 發(fā)表于 12-17 09:53 ?7.3w次閱讀
    <b class='flag-5'>AMD</b>推出 <b class='flag-5'>EPYC</b> 嵌入式 2005 系列<b class='flag-5'>處理器</b> 滿足長期部署需求

    維信諾與院士專家共話第四代pTSF技術(shù)產(chǎn)業(yè)化

    12月7日,維信諾宣告其與清華大學(xué)聯(lián)合開發(fā)的第四代pTSF(磷光輔助熱活化敏化熒光)技術(shù)實現(xiàn)量產(chǎn)商用。
    的頭像 發(fā)表于 12-16 11:51 ?746次閱讀

    Amphenol DDR5/LPDDR5 CAMM2連接高性能內(nèi)存連接新選擇

    在電子設(shè)備不斷追求更高性能和更低功耗的今天,內(nèi)存連接性能和特性對整個系統(tǒng)的表現(xiàn)起著至關(guān)重要的作用。Amphenol推出的DDR5/LPD
    的頭像 發(fā)表于 12-09 15:11 ?984次閱讀
    Amphenol <b class='flag-5'>DDR5</b>/LPDDR<b class='flag-5'>5</b> CAMM2連接<b class='flag-5'>器</b>:<b class='flag-5'>高性能</b><b class='flag-5'>內(nèi)存</b>連接新選擇

    小馬智行與三一重卡及東風(fēng)柳汽聯(lián)合打造第四代自動駕駛卡車

    11月19日,小馬智行宣布與三一重卡、東風(fēng)柳汽達(dá)成合作,將聯(lián)合打造第四代自動駕駛卡車家族。第四代自動駕駛卡車系統(tǒng)采用平臺化設(shè)計,具有極強的車型適配能力。
    的頭像 發(fā)表于 11-21 15:51 ?607次閱讀

    Melexis推出第四代汽車LIN電機驅(qū)動MLX81350

    Melexis推出第四代汽車LIN電機驅(qū)動MLX81350,可為電機提供高達(dá)5W(0.5A)的功率。該驅(qū)動專為電動汽車(EV)的空調(diào)風(fēng)門與自動通風(fēng)系統(tǒng)設(shè)計,具備高性價比,不僅能實現(xiàn)
    的頭像 發(fā)表于 11-08 17:04 ?3058次閱讀

    TE Connectivity DDR5 DIMM插槽技術(shù)解析與應(yīng)用指南

    TE Connectivity DDR5 DIMM插槽是專為高性能計算和服務(wù)平臺設(shè)計的下一內(nèi)存
    的頭像 發(fā)表于 11-07 11:04 ?1056次閱讀
    TE Connectivity <b class='flag-5'>DDR5</b> DIMM插槽技術(shù)解析與應(yīng)用指南

    瀾起科技成功量產(chǎn)DDR5第四子代寄存時鐘驅(qū)動芯片

    瀾起科技今日正式宣布,已完成DDR5第四子代寄存時鐘驅(qū)動芯片(RCD04)的量產(chǎn)。該芯片是高性能服務(wù)及數(shù)據(jù)中心
    的頭像 發(fā)表于 10-30 11:37 ?757次閱讀

    派恩杰第四代碳化硅產(chǎn)品在AI基建的應(yīng)用

    在 AI 基建中,碳化硅(SiC)憑借高頻高效、耐高溫、高功率密度等特性,成為解決 “算力飆升與能耗、空間、散熱瓶頸” 矛盾的核心材料。從數(shù)據(jù)中心的電源系統(tǒng)到邊緣 AI 設(shè)備的穩(wěn)定運行,派恩杰第四代碳化硅正深度滲透到 AI 基建的全鏈條。
    的頭像 發(fā)表于 08-18 15:56 ?1725次閱讀

    Wolfspeed推出第四代高性能碳化硅MOSFET

    Wolfspeed 推出第四代 (Gen 4) 1200 V 車規(guī)級碳化硅 (SiC) 裸芯片 MOSFET 系列,專為嚴(yán)苛的汽車環(huán)境設(shè)計。Wolfspeed 第四代高性能碳化硅 MOSFET,可在 185°C 下持續(xù)
    的頭像 發(fā)表于 08-11 16:54 ?3514次閱讀

    派恩杰發(fā)布第四代SiC MOSFET系列產(chǎn)品

    近日,派恩杰半導(dǎo)體正式發(fā)布基于第四代平面柵工藝的SiC MOSFET系列產(chǎn)品。該系列在750V電壓平臺下,5mm × 5mm芯片尺寸產(chǎn)品的導(dǎo)通電阻RDS(on)最低可達(dá)7mΩ,達(dá)到國際領(lǐng)先水平。相比上一
    的頭像 發(fā)表于 08-05 15:19 ?1948次閱讀
    派恩杰發(fā)布<b class='flag-5'>第四代</b>SiC MOSFET系列產(chǎn)品

    新唐科技發(fā)布第四代Gerda系列車用HMI顯示IC

    新唐科技日本有限公司 (NTCJ) 將于 2025 年 5 月開始量產(chǎn)第四代 Gerda 系列車用HMI[1]顯示IC,共三款型號(Gerda-4M、Gerda-4L 和 Gerda-4C)。
    的頭像 發(fā)表于 07-24 17:41 ?1313次閱讀

    AI PC內(nèi)存升級,這顆DDR5 PMIC一馬當(dāng)先

    PC處理器DDR5的支持,DDR5內(nèi)存將更快滲透普及。相較于DDR4,所有電壓由主板供給,DDR5
    的頭像 發(fā)表于 05-29 09:11 ?8749次閱讀
    AI PC<b class='flag-5'>內(nèi)存</b>升級,這顆<b class='flag-5'>DDR5</b> PMIC一馬當(dāng)先

    高通推出第四代驍龍7移動平臺

    高通技術(shù)公司今日推出最新驍龍7系產(chǎn)品——第四代驍龍7移動平臺。這一全新平臺旨在增強用戶喜愛的多媒體體驗并提供全面的穩(wěn)健性能。無論是利用先進(jìn)圖像處理功能拍攝珍貴瞬間,還是借助精選的Snapdragon
    的頭像 發(fā)表于 05-19 15:02 ?2876次閱讀

    DDR4漲價20%,DDR5上調(diào)5%!

    最新消息,三星電子本月初與主要客戶就提高DRAM芯片售價達(dá)成一致。DDR4 DRAM價格平均上漲兩位數(shù)百分比;DDR5價格上漲個位數(shù)百分比。據(jù)稱 DDR4 上調(diào) 20%,DDR5 上調(diào)
    的頭像 發(fā)表于 05-13 01:09 ?7841次閱讀

    ADSP-21467/ADSP-21469第四代高性能DSP技術(shù)手冊

    包括ADSP-21469在內(nèi)的第四代SHARC?處理器可提供改進(jìn)的性能、基于硬件的濾波加速、面向音頻與應(yīng)用的外設(shè),以及能夠支持最新環(huán)繞聲
    的頭像 發(fā)表于 05-12 15:49 ?1372次閱讀
    ADSP-21467/ADSP-21469<b class='flag-5'>第四代</b><b class='flag-5'>高性能</b>DSP技術(shù)手冊
    宜丰县| 河东区| 镇远县| 温宿县| 洛阳市| 水城县| 龙江县| 宣化县| 礼泉县| 大港区| 武安市| 兴城市| 宁德市| 乌什县| 达孜县| 霍城县| 上饶市| 阜南县| 三都| 喀喇| 韶山市| 聂荣县| 汉川市| 仁布县| 偃师市| 合阳县| 福鼎市| 万源市| 通江县| 丰宁| 图们市| 兴和县| 新干县| 嵊泗县| 平遥县| 林西县| 城市| 遵义市| 当阳市| 洛阳市| 高平市|