日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

彌合帶寬缺口,高性能AI推理如何受益于GDDR7?

海闊天空的專欄 ? 來源:廠商供稿 ? 作者:Nidish Kamath ? 2026-03-18 09:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Nidish_Kamath_Headshot.jpg

作者:Rambus半導體IP產(chǎn)品管理總監(jiān)Nidish Kamath

當前AI領(lǐng)域的發(fā)展格局正由大型語言模型(LLMs)的迅猛增長所主導。雖然云端對于這些超大規(guī)模模型的訓練依然至關(guān)重要,但一個顯著的轉(zhuǎn)變正在發(fā)生:AI推理正從集中式數(shù)據(jù)中心向網(wǎng)絡(luò)邊緣和終端設(shè)備遷移。這一趨勢涵蓋了從5G基礎(chǔ)設(shè)施到汽車、安防攝像頭和手機等終端設(shè)備在內(nèi)的廣泛領(lǐng)域。

在數(shù)字化轉(zhuǎn)型持續(xù)加速的高增長地區(qū),這種遷移趨勢尤為顯著。根據(jù)IDC數(shù)據(jù)顯示,2024年下半年,中國邊緣云市場規(guī)模達到73.9億元人民幣。在邊緣側(cè)完成輕量化模型訓練和AI推理已成為行業(yè)關(guān)注的焦點,正驅(qū)動這一細分市場實現(xiàn)快速增長。

邊緣計算的優(yōu)勢顯而易見。本地化數(shù)據(jù)處理能提供用戶期待的實時響應(yīng)。而最大限度的減少數(shù)據(jù)傳輸不僅能減輕網(wǎng)絡(luò)負荷,還能通過敏感數(shù)據(jù)的本地化存儲來提升安全性。隨著先進處理單元廣泛集成到日常設(shè)備中,我們正見證邊緣應(yīng)用的爆發(fā)式增長,其功能已遠超基礎(chǔ)任務(wù)范疇。如今這些應(yīng)用涵蓋語音識別、網(wǎng)絡(luò)監(jiān)控、天氣預報,甚至機器人技術(shù)與AI醫(yī)療設(shè)備,也對邊緣硬件的處理能力提出了更高且更嚴苛的要求。

不斷演進的市場格局催生出具有不同內(nèi)存需求的細分市場。云托管應(yīng)用需要絕對最高級別的內(nèi)存帶寬,通常超過每秒1TB,傳統(tǒng)上采用HBM和DDR技術(shù)提供支持。網(wǎng)絡(luò)邊緣(如5G基礎(chǔ)設(shè)施)則需要在300-500 GB/s的高性能與成本效益之間尋求精妙平衡。終端設(shè)備則更注重成本控制,雖僅需50-100 GB/s的帶寬,但對帶寬增長的需求同樣迫切。而這一貫穿所有細分領(lǐng)域的共同特征是:內(nèi)存帶寬的需求正在全面持續(xù)攀升。

然而,這一需求也暴露了現(xiàn)代系統(tǒng)設(shè)計中的一個關(guān)鍵弱點:處理能力與內(nèi)存帶寬之間正出現(xiàn)日益嚴重的脫節(jié)。在過去兩年中,AI模型規(guī)模驚人地增長了410倍,而同期內(nèi)存帶寬僅提升約一倍。這種巨大反差導致顯著的“內(nèi)存鴻溝"——內(nèi)存子系統(tǒng)正日益成為制約AI性能的瓶頸,限制了先進處理器的潛力發(fā)揮。

為此,業(yè)界正日益轉(zhuǎn)向?qū)S锰幚砥饕蕴嵘?。盡管GPU依然表現(xiàn)強勁,但針對特定應(yīng)用構(gòu)建專用硬件,可以通過精確匹配處理器與內(nèi)存的預期工作負載,來實現(xiàn)更高效的內(nèi)存利用。另一種解決方案則超越了處理器本身,通過采用2.5D架構(gòu)、3D堆疊或芯粒(Chiplets)等新興技術(shù),使整個系統(tǒng)獲得卓越的處理能力。然而,盡管架構(gòu)變革層出不窮,核心挑戰(zhàn)依然存在:即如何選擇一個既能平衡性能,又具備商業(yè)可行性的內(nèi)存標準。

面對爆發(fā)式的邊緣 AI 應(yīng)用,選擇合適的內(nèi)存解決方案面臨著艱難的"三難困境"。高帶寬內(nèi)存(HBM)雖能提供海量帶寬,卻伴隨著高昂的系統(tǒng)成本和2.5D/3D堆疊設(shè)計的復雜性。低功耗雙列直插內(nèi)存(LPDDR)在標準封裝中兼具能效與高容量優(yōu)勢,但單設(shè)備帶寬較低。邊緣AI系統(tǒng)正處于兩難境地:它們需要在帶寬、容量、成本和外形尺寸之間尋求平衡。

JEDEC GDDR7標準正是為解決這一特定挑戰(zhàn)而量身打造。該標準實現(xiàn)了性能的巨大飛躍,將每比特帶寬從GDDR6的24 Gbps提升至36 Gbps。這使得32位設(shè)備的總帶寬達到144 GB/s。憑借規(guī)格中48 Gbps的上限,總帶寬還能進一步提升。采用2-4個GDDR7設(shè)備的內(nèi)存子系統(tǒng),即可實現(xiàn)邊緣AI目標帶寬——300-500 GB/s。

這一性能飛躍得益于信號傳輸技術(shù)的根本性變革。GDDR7從傳統(tǒng)的NRZ(2位)信號傳輸方式,升級為創(chuàng)新的PAM3(3位或三進制)信號傳輸技術(shù)。通過這一創(chuàng)新技術(shù),結(jié)合兩位專用糾錯位,GDDR7控制器和物理層芯片能在與GDDR6相同的鏈路預算下實現(xiàn)更高數(shù)據(jù)速率。對于系統(tǒng)設(shè)計者而言,這不僅讓性能升級變得更可控,也更具成本效益。

為直觀展現(xiàn)這些技術(shù)指標的實際影響,我們可以考察一個真實的商業(yè)設(shè)計場景。假設(shè)一個典型的邊緣AI應(yīng)用目標是實現(xiàn)500 GB/s的內(nèi)存帶寬:若采用GDDR7,僅需四顆 32Gbps的封裝即可達標。與LPDDR5X(速率為 9.6Gbps)相比,GDDR7占用的電路板面積更小;而與HBM4(速率為 8.0Gbps)相比,其總系統(tǒng)成本更低。在這個案例中,基于GDDR7的系統(tǒng)在LPDDR與HBM這兩種設(shè)計方案之間找到了一個理想的平衡點。

與 GDDR6 的雙通道設(shè)計相比,GDDR7 具備四個獨立通道。這種設(shè)計提供了更細的執(zhí)行顆粒度,對于 AI 推理應(yīng)用至關(guān)重要,它能實現(xiàn)更靈活的數(shù)據(jù)組織方式,并顯著提升整體系統(tǒng)效率。此外,該標準還整合了關(guān)鍵的RAS(可靠性、可用性、可維護性)特性,例如片上糾錯碼(On-die ECC),這對于構(gòu)建穩(wěn)健可靠的邊緣部署至關(guān)重要。隨著行業(yè)采用這一新標準,可靠的IP合作伙伴對于確保芯片的成功實現(xiàn)將變得至關(guān)重要。

作為在高性能內(nèi)存和互連解決方案領(lǐng)域的領(lǐng)先企業(yè),Rambus具備獨特優(yōu)勢來應(yīng)對這些挑戰(zhàn)。Rambus GDDR7控制器IP支持JEDEC規(guī)定的全部標準特性,已在客戶量產(chǎn)中通過高達40 Gbps的芯片驗證。該方案同時具備全行(all-bank)和單行(per-bank)刷新模式以降低功耗。同時,該IP對x16及x8合蓋模式(Clamshell mode)的支持,為邊緣側(cè)設(shè)備提供了更多樣化的實現(xiàn)選擇。

Rambus GDDR7控制器以軟IP核形式交付,能夠與第三方GDDR7物理層(PHY)實現(xiàn)無縫協(xié)作。該功能為客戶提供了“開箱即用”的完整子系統(tǒng),極大簡化了SoC的集成工作。在向客戶SoC團隊交付過程中,Rambus會對每個客戶的內(nèi)存控制器配置及第三方物理層文件進行全面回歸測試。此外,Rambus還提供專家級技術(shù)支持和定制化服務(wù)等增值方案,助力客戶加速產(chǎn)品上市進程。

人工智能和生成式AI時代,內(nèi)存帶寬缺口仍將是一個挑戰(zhàn)。作為內(nèi)存技術(shù)的行業(yè)先行者,Rambus將繼續(xù)與行業(yè)合作伙伴緊密協(xié)作,提供關(guān)鍵的內(nèi)存與互連技術(shù),為從云端到邊緣的AI產(chǎn)業(yè)進步注入強勁動力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41324

    瀏覽量

    302703
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI Ceph 分布式存儲教程資料大模型學習資料2026

    。如何構(gòu)建高性能、高吞吐、高可擴展的 AI 分布式存儲系統(tǒng),已成為解鎖大模型基建能力的核心科技命題。這不僅關(guān)乎數(shù)據(jù)存得下、讀得快,更直接決定了 GPU 集群的利用率與模型訓練的最終效率。 一、 突破 I/O
    發(fā)表于 05-01 17:35

    黑馬-Java+AI新版V16零基礎(chǔ)就業(yè)班百度云網(wǎng)盤下載+Java+AI全棧開發(fā)工程師

    做法是嵌入式智能——將輕量化模型直接運行 Java 進程內(nèi)。這一方向的技術(shù)基礎(chǔ)包括:ONNX Runtime 對跨格式模型的高性能推理、Deep Java Library 提供的 Java 原生模型
    發(fā)表于 05-01 11:29

    邊緣AI算力臨界點:深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價值

    、內(nèi)存革命:48GB/96GB LPDDR4X 背后的帶寬博弈 很多開發(fā)者容易陷入唯算力論的誤區(qū),但在實際部署大模型時,內(nèi)存容量和帶寬往往是真正的性能瓶頸。OrangePi AI St
    發(fā)表于 03-10 14:19

    如何在邊緣AI應(yīng)用場景中實現(xiàn)高性能、低功耗推理(上)

    送回EndPoint設(shè)備。這種方法需要巨大的帶寬才能將海量數(shù)據(jù)傳輸?shù)皆贫?。邊緣設(shè)備越來越多地使用AI推理技術(shù),以實現(xiàn)快速實時響應(yīng)并提高數(shù)據(jù)隱私和安全性,同時避免與云連接產(chǎn)生的延遲
    的頭像 發(fā)表于 03-03 14:18 ?6626次閱讀
    如何在邊緣<b class='flag-5'>AI</b>應(yīng)用場景中實現(xiàn)<b class='flag-5'>高性能</b>、低功耗<b class='flag-5'>推理</b>(上)

    是德科技推出全新GDDR7發(fā)射端一致性測試解決方案

    是德科技(NYSE: KEYS )宣布推出全新GDDR7發(fā)射端一致性解決方案,該方案可加速圖形與人工智能(AI)應(yīng)用領(lǐng)域遵循JEDEC標準的驗證進程。
    的頭像 發(fā)表于 03-02 11:05 ?569次閱讀
    是德科技推出全新<b class='flag-5'>GDDR7</b>發(fā)射端一致性測試解決方案

    如何在邊緣AI應(yīng)用場景中實現(xiàn)高性能、低功耗推理(上)

    。這種方法需要巨大的帶寬才能將海量數(shù)據(jù)傳輸?shù)皆贫恕?邊緣設(shè)備越來越多地使用AI推理技術(shù),以實現(xiàn)快速實時響應(yīng)并提高數(shù)據(jù)隱私和安全性,同時避免與云連接產(chǎn)生的延遲和成本。這也降低了功耗,使其適用于電池供電的IoT應(yīng)用。因此,邊緣
    的頭像 發(fā)表于 02-27 07:48 ?1w次閱讀
    如何在邊緣<b class='flag-5'>AI</b>應(yīng)用場景中實現(xiàn)<b class='flag-5'>高性能</b>、低功耗<b class='flag-5'>推理</b>(上)

    新品 | AI Pyramid AI Pyramid-Pro,面向本地推理與智能交互的高性能AI PC

    AIPyramid是一款金字塔形狀的高性能AIPC,專為本地AI推理與邊緣智能應(yīng)用而生。內(nèi)置AxeraAX8850SoC,集成八核Cortex-A55處理器與24TOPS@INT8NPU,輕松應(yīng)對
    的頭像 發(fā)表于 02-06 17:24 ?3932次閱讀
    新品 | <b class='flag-5'>AI</b> Pyramid <b class='flag-5'>AI</b> Pyramid-Pro,面向本地<b class='flag-5'>推理</b>與智能交互的<b class='flag-5'>高性能</b><b class='flag-5'>AI</b> PC

    使用NORDIC AI的好處

    不依賴持續(xù)聯(lián)網(wǎng),整體系統(tǒng)可靠性更高。[Edge AI 概述; Nordic Edge AI 技術(shù)頁] 覆蓋從“小 MCU”到“高性能 SoC”的完整產(chǎn)品線 Neuton 模型 :超小模型(平均
    發(fā)表于 01-31 23:16

    昆侖芯R200 AI加速卡技術(shù)規(guī)格解析

    昆侖芯R200加速卡基于7nm XPU-R架構(gòu),在150W功耗下提供256 TOPS INT8算力,側(cè)重高性能推理。配備最高32GB GDDR6內(nèi)存(512GB/s
    的頭像 發(fā)表于 12-14 13:12 ?1956次閱讀
    昆侖芯R200 <b class='flag-5'>AI</b>加速卡技術(shù)規(guī)格解析

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    和探索;人類級別的理解能力;常識推理;現(xiàn)實世界的知識整合。 3、測試時計算 測試時計算(TTC)是指在模型推理階段利用額外的計算資源來提升泛化性能。 4、具身智能與滲透式AI 1)具身
    發(fā)表于 09-18 15:31

    華為亮相2025金融AI推理應(yīng)用落地與發(fā)展論壇

    近日,2025金融AI推理應(yīng)用落地與發(fā)展論壇在上海舉行。中國銀聯(lián)執(zhí)行副總裁涂曉軍、華為數(shù)字金融軍團CEO曹沖出席本次論壇并發(fā)表致辭。論壇上,華為公司副總裁、數(shù)據(jù)存儲產(chǎn)品線總裁周躍峰博士發(fā)布AI
    的頭像 發(fā)表于 08-15 09:45 ?1409次閱讀

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級

    合作案例,成為AI數(shù)據(jù)中心升級的關(guān)鍵推動者。 一、技術(shù)實力:AI光模塊的研發(fā)與量產(chǎn)先鋒 睿海光電作為全球AI光模塊的領(lǐng)先品牌,專注為數(shù)據(jù)中心、超算中心及智算中心提供
    發(fā)表于 08-13 19:01

    AI推理芯片賽道猛將,200億市值AI芯片企業(yè)赴港IPO

    7月30日,AI芯片龍頭企業(yè)云天勵飛正式向港交所遞交招股說明書。 ? 云天勵飛成立于2014年8月,2023年4月在上交所科創(chuàng)板掛牌,截至8月1日的市值為216億元。專注
    的頭像 發(fā)表于 08-04 09:22 ?4955次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片賽道猛將,200億市值<b class='flag-5'>AI</b>芯片企業(yè)赴港IPO

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    網(wǎng)絡(luò)智能診斷平臺。通過對私有化網(wǎng)絡(luò)數(shù)據(jù)的定向訓練,信而泰打造了高性能、高可靠性的網(wǎng)絡(luò)診斷模型,顯著提升了AI輔助診斷的精準度與實用性。該方案實現(xiàn)了網(wǎng)絡(luò)全流量深度解析能力與AI智能推理
    發(fā)表于 07-16 15:29

    英偉達預計向中國客戶交付 “第三代” 閹割芯片

    基于 GB202 GPU,采用 GDDR7 內(nèi)存,最大帶寬可達 800Gbps,適合小規(guī)模集群推理和小模型后訓練;B40/B30 芯片則保留了與 H20 相同的 NVLink 互聯(lián)功能,最大
    的頭像 發(fā)表于 06-21 00:03 ?4149次閱讀
    教育| 云龙县| 克什克腾旗| 公主岭市| 德昌县| 四川省| 广德县| 龙口市| 泽库县| 县级市| 阿拉善左旗| 南漳县| 元谋县| 渭源县| 牙克石市| 勐海县| 静宁县| 宁海县| 偃师市| 遵义县| 丹棱县| 安西县| 桑植县| 莒南县| 利辛县| 长武县| 辰溪县| 交城县| 盐津县| 长乐市| 新源县| 滨海县| 柳江县| 陕西省| 沭阳县| 海盐县| 东台市| 伊通| 荔浦县| 明水县| 彭水|