人工智能技術(shù)的持續(xù)創(chuàng)新,不斷凸顯出一個棘手的現(xiàn)實:算力規(guī)模節(jié)節(jié)攀升,但內(nèi)存帶寬始終是最難攻克的瓶頸之一。隨著 AI 模型愈發(fā)龐大、復(fù)雜度不斷提升,能否為加速芯片高速輸送數(shù)據(jù),已然和算力本身同等重要。高帶寬內(nèi)存(HBM)一直是破解這一難題的核心方案,而其技術(shù)演進的下一階段,便是 HBM4E。
AI 工作負載如今愈發(fā)受限于內(nèi)存帶寬。模型訓(xùn)練與推理流程需要持續(xù)、穩(wěn)定地讀取海量數(shù)據(jù)集,內(nèi)存吞吐一旦出現(xiàn)延遲,硬件利用率便會大幅下降。HBM4E 實現(xiàn)了重大技術(shù)升級:它在帶寬較 HBM4 提升一倍的同時,保留了 HBM 原本出眾的能效與低延遲特性,這也是 HBM 能成為 AI 首選內(nèi)存的核心原因。

在近期舉辦的閃存大會上,CFM閃存市場總經(jīng)理邰煒表示,HBM正快速迭代,HBM3E向HBM4演進,帶寬每代接近翻倍?;旌湘I合技術(shù)正逐步取代傳統(tǒng)微凸塊,成為性能升級的核心。特別值得注意的是Base Die的演變——在HBM3E中僅承擔(dān)信號轉(zhuǎn)接,但HBM4開始部分計算任務(wù)下沉至base die,以解決內(nèi)存墻問題,"Base Die將成為HBM下一代競爭的決勝點"。本文將三星、美光、SK海力士三家在HBM4領(lǐng)域的最新進展匯總。
HBM技術(shù)的演進
HBM 從 2014 年量產(chǎn)至今,迭代核心是接口位寬→數(shù)據(jù)速率→堆疊層數(shù)→工藝節(jié)點的階梯式突破,每一代都精準(zhǔn)匹配當(dāng)時 AI 算力需求。
HBM 初代產(chǎn)品采用 1024 位位寬接口。搭載多顆 HBM 顯存的加速芯片,會通過獨立的 1024 位數(shù)據(jù)接口分別訪問每顆顯存。若內(nèi)存接口速率為 1 吉比特每秒(Gb/s),且外接 4 顆 HBM 顯存,整體內(nèi)存總帶寬可達 512 吉字節(jié)每秒(GB/s)。

從初代 HBM 一直到 HBM3E,全系產(chǎn)品均沿用 1024 位位寬架構(gòu)。到了 HBM4,接口位寬直接翻倍至 2048 位,這得益于芯片封裝技術(shù)同步迭代,為內(nèi)存接口提供了更多引腳資源。此次架構(gòu)升級,將帶寬性能推至全新高度。
工作在 8 吉比特每秒(Gb/s)速率下的 HBM4,單顆 2048 位接口可實現(xiàn) 2.048 太字節(jié)每秒(TB/s)的帶寬。若一款加速芯片搭載 6 顆 HBM4 顯存,整體總帶寬可達 12.3 TB/s。HBM4E 沿用 2048 位接口,并將數(shù)據(jù)速率提升至 16 Gb/s。同樣采用 6 顆顯存的配置下,HBM4E 的總帶寬達到驚人的 24.6 TB/s。
從技術(shù)層面看,HBM3E 帶寬約1.2TB/s,HBM4 翻倍至2TB/s,但下一代 AI GPU(如 Rubin Ultra)單芯片需求達3.2–4TB/s,HBM4E 將帶寬推至4TB/s,剛好填補缺口。
HBM4E 是 HBM4 的性能增強版,目標(biāo)是 2027 年量產(chǎn),直接匹配英偉達 Rubin Ultra、AMD MI500 等下一代 AI 加速器的剛需。
三大存儲巨頭,最新HBM4量產(chǎn)進程
5月26日,外媒消息,美國存儲芯片大廠美光宣布,在第六代高頻寬記憶體(HBM4)擴產(chǎn)進展順利,公司預(yù)估2027年開始量產(chǎn)新一代HBM4標(biāo)準(zhǔn)產(chǎn)品。

美光科技全球運營執(zhí)行副總裁馬尼什?巴蒂亞于 5 月 20 日在摩根大通投資者大會上表示,美光 HBM4 的產(chǎn)能爬坡速度,約為去年12 層堆疊 HBM3E產(chǎn)品量產(chǎn)節(jié)奏的兩倍,良率改善速度也更快。這款產(chǎn)品專為英偉達Vera Rubin AI 計算平臺打造。
在市場競爭面看,三星電子與 SK 海力士同樣正運用各自的 1c 制程積極開發(fā) HBM4E。三星計劃于 2026 年第二季出貨首批 HBM4E 樣品,其基礎(chǔ)芯片將采用三星自家晶圓代工廠的 4nm制程制造。預(yù)計HBM4的銷量從第三季度開始將占據(jù)HBM總銷量的一半以上。
SK 海力士則目標(biāo)在 2026 年下半年向客戶提供HBM4E樣品,并于 2027 年展開量產(chǎn),其基礎(chǔ)芯片據(jù)傳也將采用臺積電的 3nm制程生產(chǎn)。
為何美光可以擴產(chǎn)順利?公司認為有三大原因:首先,從過去量產(chǎn) HBM3 及 HBM3E 產(chǎn)品中所累積的營運經(jīng)驗與學(xué)習(xí)效應(yīng)。其次,HBM4 的核心晶粒(core dies)采用了美光目前主力的 10 nm級第五代 1-beta (1β) 制程,該制程的效能與良率已證實相當(dāng)穩(wěn)定。還有,美光內(nèi)部優(yōu)化的基礎(chǔ)芯片(base die),透過將 1β DRAM 與內(nèi)部自制的基礎(chǔ)芯片結(jié)合,成功將產(chǎn)品的質(zhì)量與效能最大化。
據(jù)悉,針對HBM4E,美光的生產(chǎn)策略也發(fā)生過改變。從核心晶粒切入來看,將改采 10nm級第六代 1-gamma (1γ) 制程生產(chǎn),這也是美光首個采用 ASML 極紫外光(EUV)微影設(shè)備的制程節(jié)點,技術(shù)層級相當(dāng)于對手三星和 SK 海力士的 1c 制程。而在基礎(chǔ)芯片方面,美光將不再由內(nèi)部制造,而是轉(zhuǎn)交由晶圓代工伙伴臺積電負責(zé)生產(chǎn)。
據(jù)悉,HBM4E 的開發(fā)進展順利,預(yù)期 2027 年就能進入量產(chǎn)階段。美光首波量產(chǎn)的將是 JEDEC 標(biāo)準(zhǔn)產(chǎn)品,同時這家公司也在籌備針對客戶需求量身打造的客制化產(chǎn)品。雖然客制化版本的成本較高,但憑借其提升的效能與額外附加功能,美光預(yù)期客戶需求將非常強勁。
-
美光
+關(guān)注
關(guān)注
5文章
745瀏覽量
53400 -
AI加速器
+關(guān)注
關(guān)注
1文章
75瀏覽量
9571 -
HBM4
+關(guān)注
關(guān)注
0文章
59瀏覽量
639
發(fā)布評論請先 登錄
讓算力不再空轉(zhuǎn),三星HBM4E搶跑交樣,破局“內(nèi)存墻”
英偉達三大存儲芯片供應(yīng)商已獲HBM4供貨資格
消息稱英偉達HBM4訂單兩家七三分,獨缺這一家
存儲迭代暗涌:HBM4與UFS4.1浪潮下,燒錄環(huán)節(jié)何以成為新瓶頸?
HBM量價齊飛,UFS加速普及:存儲狂飆下的“最后質(zhì)檢”攻堅戰(zhàn)
邊緣計算中的AI加速器類型與應(yīng)用
亞馬遜云科技第三期創(chuàng)業(yè)加速器圓滿收官 助力初創(chuàng)釋放Agentic AI潛力 加速全球化進程
美光確認HBM4將在2026年Q2量產(chǎn)
全球首款HBM4量產(chǎn):2.5TB/s帶寬超越JEDEC標(biāo)準(zhǔn),AI存儲邁入新紀(jì)元
SK海力士宣布量產(chǎn)HBM4芯片,引領(lǐng)AI存儲新變革
傳三星 HBM4 通過英偉達認證,量產(chǎn)在即
Microchip推出Adaptec? SmartRAID 4300 系列加速器 提供安全的可擴展 NVMe? RAID 存儲解決方案
粒子加速器?——?科技前沿的核心裝置
AI加速器需求倒逼HBM4量產(chǎn)加速,三家國際存儲巨頭亮出進度表
評論