日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

集成32GB HBM2e內(nèi)存,AMD Alveo V80加速卡助力傳感器處理、存儲壓縮等

晶芯觀察 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:黃晶晶 ? 2024-06-05 16:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/黃晶晶)日前,AMD推出Alveo V80加速卡,Versal FPGA自適應(yīng)SoC搭配HBM,可處理計算以及內(nèi)存密集型的工作負(fù)載,用于高性能計算、數(shù)據(jù)分析、金融科技、存儲壓縮等等。

突破網(wǎng)絡(luò)訪問和內(nèi)存的瓶頸


此次Alveo V80為何采用HBM高速內(nèi)存,AMD 自適應(yīng)和嵌入式計算事業(yè)部( AECG )高級產(chǎn)品線經(jīng)理Shyam Chander分析,在傳統(tǒng)的處理器架構(gòu)中,無論是存儲器還是網(wǎng)絡(luò)訪問都容易形成瓶頸。網(wǎng)絡(luò)接口只支持25G、100G,內(nèi)存采用DDR而FPGA的帶寬遠(yuǎn)高于內(nèi)存提供的帶寬。



那么Alveo V80針對于這兩個問題進行了優(yōu)化,帶來顯著的性能提升。內(nèi)存采用高帶寬存儲器HBM2e,提供820 GB/s 的存儲器帶寬,容量達(dá)32GB。網(wǎng)絡(luò)訪問上采用QSFP56光纖模塊可以支持從10G到800G的帶寬,支持4X200G,以及4X10G/25G/40G/50G等不同工作模式。



這款加速卡采用全高、3/4 長( FH?L )尺寸規(guī)格,由 AMD Versal HBM 自適應(yīng) SoC 提供支持,具備 2,600,000 個 LUT 邏輯單元的 FPGA 架構(gòu)、10,848 個 DSP 計算邏輯片以及 820 GB/s 的存儲器帶寬。



與前代產(chǎn)品 AMD Alveo U55C 計算加速卡相比,Alveo V80 的邏輯密度至高翻倍、存儲器帶寬至高翻倍且網(wǎng)絡(luò)帶寬可高至 4 倍,可以實現(xiàn)強大的計算集群,同時還能優(yōu)化卡、服務(wù)器數(shù)量以及機架空間。



Alveo V80還配有32GB DDR DIMM擴展插槽,MCIO擴展端口可直連NVMe驅(qū)動器,實現(xiàn)存儲卡的連接。系統(tǒng)連接總線支持PCIe 5.0接口,可達(dá)64GB/秒傳輸速率。整卡功率300W,采用被動散熱,總熱設(shè)計功耗TDP則取決于器件和服務(wù)器。

V80集成高帶寬網(wǎng)絡(luò)核心600G以太網(wǎng)和400G加密引擎,硬化基礎(chǔ)設(shè)施連接包括DDR控制器、支持DMA的PCIe 5.0、可編程片上網(wǎng)絡(luò)。Shyam Chander表示,基于這些硬化的功能,用戶沒有必要使用軟性的IP進行部署。



通常來說,傳統(tǒng)的加速卡(如GPU)要與CPU進行連接,這會限制能夠使用的加速卡的數(shù)量。但是V80能夠避開CPU到加速卡的PCle瓶頸、低時延處理傳入的網(wǎng)絡(luò)數(shù)據(jù),消除分立式網(wǎng)絡(luò)接口卡、實現(xiàn)每服務(wù)器的卡數(shù)和計算密度最大化。同時,按照需求以網(wǎng)絡(luò)限速的方式管理傳入的數(shù)據(jù),包括在線加密、數(shù)據(jù)包監(jiān)控、傳感器處理等等。

傳統(tǒng)架構(gòu)是固定的緩存層次用于數(shù)據(jù)的讀取和寫入,不規(guī)則的訪問模式會降低效率。而V80的自適應(yīng)計算,擁有靈活的架構(gòu),在計算附近分配內(nèi)存,從而降低延遲和低功耗,并可以靈活適應(yīng)自定義的數(shù)據(jù)類型和數(shù)據(jù)遷移。

AMD同時提供設(shè)計示例AVED,可在GitHub上獲取,以及用戶可繼續(xù)使用 Vivado設(shè)計套件,從而硬件開發(fā)者能夠更快地上手,助其縮短開發(fā)上市時間。

大規(guī)模加速內(nèi)存密集型工作負(fù)載


Alveo V80加速卡可以應(yīng)對很多大數(shù)據(jù)工作負(fù)載,包括高性能計算,包括基因組學(xué)和傳感器處理、數(shù)據(jù)分析(像欺詐檢測);金融科技,包括風(fēng)險分析和算法交易;還有網(wǎng)絡(luò)安全,像數(shù)據(jù)包監(jiān)控;存儲壓縮,這是一個非常關(guān)鍵的工作負(fù)載。另外在AI計算領(lǐng)域,包括推薦引擎和大語言模型等等。因此可以幫助客戶大規(guī)模加速以上工作負(fù)載,可以加快數(shù)據(jù)處理的速度,同時還能夠進行實時的洞見和分析。



以傳感器處理為例,聯(lián)邦科學(xué)與工業(yè)研究組織( CSIRO )是澳大利亞的國立研究組織,其參與建造了世界上最大的射電天文學(xué)天線陣列,該天線陣列目前包含 420 張 Alveo U55C 加速器卡用于處理無線電波,以研究早期宇宙并探索星系演化。

CSIRO計劃借助 Alveo V80 加速卡縮減占板面積與成本,并將所需加速卡的數(shù)量精簡多達(dá) 66%,同時應(yīng)對來自望遠(yuǎn)鏡 131,000 個天線的新信號處理任務(wù)??紤]到卡、服務(wù)器、機架空間和功耗的潛在減少,每卡算力的躍升預(yù)計可帶來至高 20% 總擁有成本( TCO )下降。



還有具備壓縮與數(shù)據(jù)分析功能的服務(wù)器存儲節(jié)點的例子,通過Alveo V80進行壓縮,利用FPGA架構(gòu)和AMD壓縮IP可擴展存儲節(jié)點,并可解壓縮,查詢加速等。



從總擁有成本的角度來分析,比如10Pb數(shù)據(jù)存儲,沒有壓縮時需要55臺服務(wù)器,1303個SSD驅(qū)動器,每年約427千瓦時的功耗。如果進行壓縮,同樣10Pb數(shù)據(jù),只需要21臺服務(wù)器,504個SSD驅(qū)動器,每年約233千瓦時,使用42張AMD Alveo V80卡進行壓縮,總擁有成本三年以上至高可以達(dá)到56%的降低,而且服務(wù)器的數(shù)量、服務(wù)器成本以及功耗也都有非常顯著的降低。



小結(jié):

市面上加速卡也有GPU、ASIC等,但這些加速卡各有所長。Shyam Chander表示,相較而言GPU擅長浮點、并聯(lián)、定點,F(xiàn)PGA擅長線上訪問的實時處理,而且低時延、靈活應(yīng)變,有非常豐富的存儲器架構(gòu)資源。AMD Alveo系列產(chǎn)品主要針對內(nèi)聯(lián)網(wǎng)絡(luò)、實時處理比如傳感器的實時處理、金融科技的需求,他們的訴求點在于低時延和靈活應(yīng)變,F(xiàn)PGA的自適應(yīng)SoC就是極好的解決方案。

另外,HBM的價格雖然高于DDR,但是如果能夠正確地配置FPGA資源,最終就能實現(xiàn)高性價比的競爭優(yōu)勢。在產(chǎn)品路線上,全面看待工作負(fù)載方面的要求,也在考慮引入HBM3等存儲。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1664

    文章

    22509

    瀏覽量

    639573
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5708

    瀏覽量

    140456
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41326

    瀏覽量

    302721
  • HBM
    HBM
    +關(guān)注

    關(guān)注

    2

    文章

    435

    瀏覽量

    15887
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    HBM迎頭趕上!國產(chǎn)AI芯片飛躍

    HBM2e,單卡顯存80GB,片間帶寬400GB/s,接口規(guī)格是PCIe4.0×16,功耗400W;而H20的顯存和片間帶寬更強,單卡
    的頭像 發(fā)表于 09-22 07:02 ?1.3w次閱讀
    <b class='flag-5'>HBM</b>迎頭趕上!國產(chǎn)AI芯片飛躍

    STTS424E02:內(nèi)存模塊溫度傳感器深度解析

    STTS424E02:內(nèi)存模塊溫度傳感器深度解析 產(chǎn)品概述 STTS424E02 作為一款集成了溫度傳感
    的頭像 發(fā)表于 04-17 15:30 ?235次閱讀

    選擇AMD Alveo V80加速卡的五大理由

    V80 是一款用途高度多樣化的加速卡,業(yè)已應(yīng)用于高性能計算、金融科技、數(shù)據(jù)分析、傳感器處理、網(wǎng)絡(luò)、存儲
    的頭像 發(fā)表于 04-10 14:59 ?371次閱讀

    AMD Alveo MA35D媒體加速卡的AMA SDK 1.4.0版本發(fā)布

    我們非常高興地宣布,面向 AMD Alveo MA35D 媒體加速卡的最新 AMA SDK 1.4.0 版本現(xiàn)已發(fā)布。該版本旨在為要求嚴(yán)苛的媒體工作負(fù)載提供堅如磐石的穩(wěn)定性和性能提升。此次更新體現(xiàn)了我們致力于優(yōu)化平臺以適應(yīng)生產(chǎn)環(huán)
    的頭像 發(fā)表于 03-19 09:36 ?661次閱讀

    FPGA硬件加速卡設(shè)計原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高, XCKU115, 光纖采集, 信號計算板, 硬件加速卡
    的頭像 發(fā)表于 02-12 09:52 ?577次閱讀
    FPGA硬件<b class='flag-5'>加速卡</b>設(shè)計原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件<b class='flag-5'>加速卡</b> PCIe半高 XCKU115-3-FLVF1924-<b class='flag-5'>E</b>芯片

    新品 | LLM-8850 Kit,高性能AI加速卡套件 DinMeter v1.1,1/32DIN標(biāo)準(zhǔn)嵌入式開發(fā)板

    LLM-8850KitLLM-8850Kit是一款面向邊緣AI與嵌入式計算場景的高性能AI加速卡套件,由LLM-8850CardAI加速卡與LLM-8850PiHat轉(zhuǎn)接板組成。核心加速卡
    的頭像 發(fā)表于 01-30 16:11 ?1422次閱讀
    新品 | LLM-8850 Kit,高性能AI<b class='flag-5'>加速卡</b>套件 DinMeter <b class='flag-5'>v</b>1.1,1/32DIN標(biāo)準(zhǔn)嵌入式開發(fā)板

    高速信號處理設(shè)計方案:413-基于雙XCVU9P+C6678的100G光纖加速卡

    C6678, XCVU9P, ZU19EG開發(fā)板,, 高速信號處理, 光纖加速卡, XCVU9P光纖加速卡
    的頭像 發(fā)表于 01-08 16:06 ?482次閱讀
    高速信號<b class='flag-5'>處理</b>設(shè)計方案:413-基于雙XCVU9P+C6678的100G光纖<b class='flag-5'>加速卡</b>

    JEDEC制定全新內(nèi)存標(biāo)準(zhǔn),將取代HBM?

    電子發(fā)燒友網(wǎng)綜合報道 隨著人工智能算力需求的指數(shù)級爆發(fā),數(shù)據(jù)中心對內(nèi)存的性能、容量與成本平衡提出了前所未有的嚴(yán)苛要求。HBM憑借1024-bit甚至2048-bit的超高位寬,成為AI加速卡的核心
    的頭像 發(fā)表于 12-17 09:29 ?1995次閱讀

    AMD Alveo MA35D加速器:開啟大規(guī)模交互式流媒體新時代

    AMD Alveo MA35D加速器:開啟大規(guī)模交互式流媒體新時代 在當(dāng)今全球視頻市場被直播主導(dǎo)的背景下,低延遲應(yīng)用不斷涌現(xiàn),對基礎(chǔ)設(shè)施和視頻處理技術(shù)的成本結(jié)構(gòu)及部署策略產(chǎn)生了深遠(yuǎn)影響
    的頭像 發(fā)表于 12-15 14:35 ?592次閱讀

    昆侖芯R200 AI加速卡技術(shù)規(guī)格解析

    昆侖芯R200加速卡基于7nm XPU-R架構(gòu),在150W功耗下提供256 TOPS INT8算力,側(cè)重高性能推理。配備最高32GB GDDR6內(nèi)存(512GB/s帶寬)及108路視頻
    的頭像 發(fā)表于 12-14 13:12 ?1956次閱讀
    昆侖芯R200 AI<b class='flag-5'>加速卡</b>技術(shù)規(guī)格解析

    邁向云端算力巔峰:昆侖芯K200 AI加速卡全面解讀

    昆侖芯K200作為云端AI加速卡,在K100架構(gòu)基礎(chǔ)上全面升級。其INT8算力達(dá)256 TOPS,配備16GB HBM內(nèi)存與512GB/s帶
    的頭像 發(fā)表于 12-14 11:17 ?2339次閱讀
    邁向云端算力巔峰:昆侖芯K200 AI<b class='flag-5'>加速卡</b>全面解讀

    專為邊緣而生:深度解析昆侖芯K100 AI加速卡,釋放128 TOPS極致能效

    昆侖芯K100邊緣AI加速卡以75W超低功耗實現(xiàn)128 TOPS的INT8算力,重新定義邊緣推理能效標(biāo)準(zhǔn)。其半高半長設(shè)計搭載8GB HBM內(nèi)存與256
    的頭像 發(fā)表于 12-14 11:12 ?3215次閱讀
    專為邊緣而生:深度解析昆侖芯K100 AI<b class='flag-5'>加速卡</b>,釋放128 TOPS極致能效

    AI大算力的存儲技術(shù), HBM 4E轉(zhuǎn)向定制化

    在積極配合這一客戶需求。從HMB4的加速量產(chǎn)、HBM4E演進到邏輯裸芯片的定制化HBM技術(shù)正在創(chuàng)新中發(fā)展。 ? HBM4
    的頭像 發(fā)表于 11-30 00:31 ?8885次閱讀
    AI大算力的<b class='flag-5'>存儲</b>技術(shù), <b class='flag-5'>HBM</b> 4<b class='flag-5'>E</b>轉(zhuǎn)向定制化

    華強北TF回收 內(nèi)存卡回收

    、威剛TF,索尼TF、創(chuàng)見TF.......長期大量回收內(nèi)存SD,回收全新內(nèi)存卡,收購原
    發(fā)表于 05-21 17:48

    410?基于?XCVU9P+?C6678?的?100G?光纖的加速卡

    基于 XCVU9P+ C6678 的 100G 光纖的加速卡
    的頭像 發(fā)表于 05-08 08:32 ?924次閱讀
    410?基于?XCVU9P+?C6678?的?100G?光纖的<b class='flag-5'>加速卡</b>
    杂多县| 商城县| 海宁市| 卢湾区| 晋宁县| 剑阁县| 原阳县| 读书| 三门峡市| 罗平县| 乳山市| 东港市| 德庆县| 呼和浩特市| 三都| 邢台市| 顺昌县| 泰州市| 怀远县| 奉新县| 阳曲县| 吉安县| 区。| 宽城| 临朐县| 南召县| 湖北省| 峨边| 介休市| 淮安市| 赤城县| 平顶山市| 富蕴县| 牟定县| 阿勒泰市| 二手房| 平阴县| 巴马| 临澧县| 滨州市| 马关县|