當今移動設備上的大多數(shù)人工智能 (AI) 工作負載均可在 Arm CPU 上運行。在智能手機領域,基于 Armv9 CPU 技術構建的 AI 旗艦智能手機立于技術前沿,其中包括搭載 MediaTek 天璣 9300 芯片的 vivo X100 和 X100 Pro 智能手機、三星 Galaxy S24 以及 Google Pixel 8,為 AI 創(chuàng)新提供了前所未有的機遇。
隨著 AI 工作負載的計算強度及復雜度持續(xù)增長,Arm 最新的 Armv9.2 CPU 集群帶來更強性能、更高效率,以及更多功能,為新一代 AI 奠定扎實基礎。這些優(yōu)勢可擴展到包括旗艦智能手機、AI PC,以及主流移動設備、XR 和可穿戴設備等在內的各類消費電子設備,彰顯了我們致力于實現(xiàn)無處不在的 AI 所作的努力。
新增至 Armv9 CPU 組合的新品包括具備超強性能的 Arm Cortex-X925 CPU 和可持續(xù)提供出色性能的 Arm Cortex-A725 CPU,而更新后的 Arm Cortex-A520 可為低強度工作負載提供更卓越的能效表現(xiàn)。與此同時,我們也更新了 DynamIQ Shared Unit (DSU-120),從而在 Armv9.2 CPU 集群配置中,降低功耗和縮小面積。這些產品被集成至 Arm 迄今為止針對安卓系統(tǒng)速度最快的計算平臺 —— 新的 Arm 終端計算子系統(tǒng) (CSS)。

圖:Armv9 CPU 系列的新產品及更新
Cortex-X925 實現(xiàn)了最顯著的 Cortex-X 性能提升
Cortex-X925(內部代號為 Blackhawk)與此前的 Cortex-X 產品相比,實現(xiàn)了最高的同比性能提升,重新定義了計算性能的發(fā)展軌跡。Cortex-X925 的單線程(峰值)性能提高了 36%(與 2023 年高端安卓手機上運行 Geekbench 6.2 相比),并且其 AI 性能提升了 46%(與前代 Cortex-X4 CPU 上的 Phi-3 詞元首次響應時間相比)。

圖:Arm Cortex-X925 性能提升
Cortex-X925 的功耗性能配置意味著它能在關鍵時刻提供峰值性能。這有助于提高跨應用、生成式 AI 工作負載、網頁瀏覽、攝像頭后處理、視頻錄制和 AAA 游戲的響應能力,進而帶來更優(yōu)異的用戶體驗。
這些性能提升得益于 Cortex-X925 出眾的性能基礎及其開創(chuàng)性的新微架構。Cortex-X925 通過經優(yōu)化的三納米工藝,輔以卓越的子系統(tǒng)和封裝,使得新一代消費電子設備的性能分數(shù)可提高 30% 以上。包括高達 3MB 的私有 L2 緩存在內的微架構改進,提供了更強的 CPU 集群可配置性,讓各類消費電子設備的創(chuàng)新成為可能。
作為 Arm 終端 CSS的一部分,我們協(xié)同設計并交付了 CPU 物理實現(xiàn)。我們攜手領先的代工廠合作伙伴,實現(xiàn)了流片就緒的 Cortex-X925 三納米工藝的物理實現(xiàn),助力我們的合作伙伴能夠在三納米工藝上充分發(fā)揮功耗、性能和面積 (PPA) 優(yōu)勢,同時通過大批量生產就緒的芯片解決方案來縮短芯片的開發(fā)與部署進程。
Cortex-A725 持續(xù)提供出色性能
Arm Cortex-A700 系列 CPU 的出色性能效率一脈相承,Cortex-A725 也不例外。作為 CPU 工作負載的主力,我們的工程和設計團隊就 Cortex-A725 進行了針對性更新,著力于需要持續(xù)出色性能的關鍵 AI 和游戲用例。與 Cortex-A720 相比,Cortex-A725 的性能效率提升了 35%,能效提升了 25%。

圖:Arm Cortex-A725 性能和能效提升
Cortex-A725 的性能效率提升同樣得益于其微架構的改進。和 Cortex-X925 一樣,通過 Arm 先進的物理實現(xiàn),我們在三納米工藝上優(yōu)化了 Cortex-A725 的實現(xiàn)。我們還可為主流消費技術市場提供面積優(yōu)化的實現(xiàn)。
Cortex-A520 和 DSU-120 的更新
Cortex-A520 已針對 Arm 終端 CSS進行更新,從而提供更為出色的能效,與 2023 Arm 全面計算解決方案 (TCS23) 中的 Cortex-A520 相比,其效率提升了 15%。Cortex-A520 的更新得益于更新的實現(xiàn)與先進的三納米物理實現(xiàn)。

圖:更新后的 Arm Cortex-A520
作為新的 Arm 終端 CSS 的一部分,DSU-120 已針對新一代用例和消費電子設備體驗進行了強化。其中包括新的性能和效率功能、新的低功耗模式和面向主流消費電子設備的強化,并保留了為高性能用例擴展到 14 個核心的選項。得益于此,典型工作負載的功耗顯著降低 50%,并且整個 CPU 集群的緩存未命中功耗降低 60%,從而減少漏電并延長設備的電池壽命。新的低功耗模式(例如 half slice power down 和 quick nap)和增強功能支持大量低強度和高強度的 AI 工作負載,包括生物特征識別、語音轉文本、AI 智能攝像頭、內容創(chuàng)建和基于機器學習 (ML) 的 AAA 游戲。

圖:DSU-120 更新和提升
Arm 性能最強、效率最高、用途最廣泛的 CPU 集群
這些新推出和更新后的 CPU 構成了 Arm CPU 集群配置,為廣泛的消費電子設備提供前所未有的性能、效率和廣泛用途。概括地說,與采用上一代 Cortex-X4 的 CPU 集群相比,新的 CPU 集群的 AI 性能提高了 46%,能實現(xiàn)了更高的響應性能和持續(xù)的吞吐量。與 TCS23 CPU 集群相比,它使關鍵用戶體驗指標(結合性能與功耗)提高 30%,進而加快應用訪問和網頁瀏覽速度,提升 AAA 游戲體驗,并延長電池使用壽命。
最新的 Arm CPU 集群還可為各類的消費電子設備提供出色的擴展能力。例如,它為 PC 和筆記本電腦提供一流的性能,與當前發(fā)售的 PC 和筆記本電腦設備相比,性能提高了 25%。同時,與 TCS23 中的 DSU-120 相比,功耗和面積均獲得降低,加上通過 Cortex-A725 和 Cortex-A520 帶來的面積和功耗優(yōu)化,為主流設備提供了靈活的 CPU 集群配置組合。這有助于在各類低成本的消費電子設備上提供優(yōu)異性能和 AI 功能,確保日常設備用戶能夠獲得高級的 AI 體驗。

Armv9 CPU 面向新一代 AI 體驗
新的 Armv9.2 CPU 集群為安卓智能手機、PC 和筆記本電腦等設備提供出色的性能與用戶體驗。該集群提供一整套實際用例的改進,集群中各個 CPU 組件均涵蓋廣泛的實際用例和工作負載。例如,Cortex-X925 可處理應用啟動和網頁瀏覽的“突發(fā)”工作負載,Cortex-A725 可提供常見 AI 工作負載和 AAA 游戲所需的持續(xù)性能,Cortex-A520 的高效率則非常適合輕量型媒體和閑置及后臺任務。所有這些增強的實際用例體驗都可以擴展到各類消費技術領域,新推出的 Armv9 CPU 為主流設備和日常用戶帶來了更高的性能和更強大的 AI 功能,從而使關鍵用戶體驗指標提高 30%。
隨著用戶在其設備上花費的時間不斷增多,并期望獲得更高級的體驗,消費者對技術的需求永無止境。無論是更快的網頁瀏覽和應用訪問速度,還是增強的 AAA 游戲與生成式 AI 工作負載,新的 Armv9 CPU 通過先進的計算功能提升各類體驗,進而定義消費技術的未來。
-
攝像頭
+關注
關注
61文章
5116瀏覽量
103536 -
移動設備
+關注
關注
0文章
531瀏覽量
56056 -
人工智能
+關注
關注
1821文章
50366瀏覽量
267056 -
生成式AI
+關注
關注
0文章
538瀏覽量
1133
原文標題:新的 Armv9 CPU 加速 AI 在移動設備等領域的發(fā)展
文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
華為鴻蒙AI眼鏡:重構智能穿戴生態(tài),加速電子產品AI化進程
Arm率先適配騰訊混元HY-1.8B-2Bit模型
使用NORDIC AI的好處
重磅合作!Quintauris 聯(lián)手 SiFive,加速 RISC-V 在嵌入式與 AI 領域落地
探索RISC-V在機器人領域的潛力
Arm Flexible Access方案引入Armv9邊緣AI計算平臺
【今晚7點半】正點原子 x STM32:智能加速邊緣AI應用開發(fā)!今晚正點原子B站直播間等你
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內容總覽
AI 芯片浪潮下,職場晉升新契機?
Arm神經技術是業(yè)界首創(chuàng)在 Arm GPU 上增添專用神經加速器的技術,移動設備上實現(xiàn)PC級別的AI圖形性能
PCIe協(xié)議分析儀能測試哪些設備?
進迭時空同構融合技術加速大模型AI應用創(chuàng)新
新的Armv9 CPU技術加速AI在移動設備等領域的發(fā)展
評論