隨著人工智能 (AI) 在數(shù)據(jù)中心、終端設(shè)備及各類中間場(chǎng)景中迅速普及,當(dāng)前的核心挑戰(zhàn)已不再是打造智能計(jì)算本身,而是構(gòu)建支撐其規(guī)?;瘧?yīng)用所需的基礎(chǔ)設(shè)施。
AI 并非單一維度的問題,而是一個(gè)由全球領(lǐng)先的科技企業(yè)共同塑造的龐大生態(tài)系統(tǒng)。在這場(chǎng)價(jià)值數(shù)萬億美元級(jí)別的產(chǎn)業(yè)變革中,Arm 架構(gòu)持續(xù)脫穎而出。
AI 數(shù)據(jù)中心:
由行業(yè)領(lǐng)袖企業(yè)定義,以 Arm 技術(shù)為基石
AI 領(lǐng)域的領(lǐng)軍企業(yè),如 NVIDIA、亞馬遜云科技 (AWS)、微軟、Google、Oracle 和 OpenAI 正與 Arm 攜手,共同推動(dòng)下一代數(shù)據(jù)中心的建設(shè)。據(jù)估計(jì),為了滿足模型訓(xùn)練、推理和具有成本效益的規(guī)?;瘮U(kuò)展需求,AI 基礎(chǔ)設(shè)施領(lǐng)域的投資將突破萬億美元級(jí)別。
預(yù)計(jì)到 2025 年,出貨到頭部超大規(guī)模云服務(wù)提供商的算力中,將有近 50% 是基于 Arm 架構(gòu)。目前,AWS (Graviton)、Google Cloud (Axion) 和 Microsoft Azure (Cobalt) 均已在其云基礎(chǔ)設(shè)施中部署了基于 Arm 架構(gòu)的芯片,從而顯著節(jié)省能源和成本,并提升可擴(kuò)展性。NVIDIA 的 Grace CPU 基于 Arm Neoverse 平臺(tái)構(gòu)建,是 NVIDIA Grace Blackwell AI 超級(jí)芯片的核心組件;該超級(jí)芯片廣受市場(chǎng)青睞,僅全球前四大超大規(guī)模云服務(wù)提供商就已訂購 360 萬顆。事實(shí)上,目前已有超過 10 億顆基于 Arm Neoverse 平臺(tái)的 CPU 部署至數(shù)據(jù)中心,這一數(shù)據(jù)充分凸顯了 Arm 架構(gòu)在全球數(shù)據(jù)中心建設(shè)中的核心地位。
在當(dāng)今先進(jìn)的 AI 數(shù)據(jù)中心技術(shù)棧中,Arm 架構(gòu)作為普遍采用的基礎(chǔ)平臺(tái),提供了傳統(tǒng)架構(gòu)難以企及的可擴(kuò)展性、效率和靈活性,其性價(jià)比和能效優(yōu)勢(shì)包括:
與 x86 系統(tǒng)相比,NVIDIA 的 Grace-Hopper 超級(jí)芯片的模型訓(xùn)練速度提升高達(dá) 8 倍,LLM 推理性能提升高達(dá) 4.5 倍[1]。
與 x86 相比,Google 的 Axion 推薦性能提升高達(dá) 3 倍[2],推理能力提升 2.5 倍,同時(shí)成本降低達(dá) 64%[3]。
截至 2024 年 12 月,AWS EC2 云服務(wù)的算力中,超過 50% 基于 AWS Graviton 所構(gòu)建[4]。
此外,根據(jù)咨詢公司 Signal65 近期的分析報(bào)告顯示,基于 Arm Neoverse 平臺(tái)的 AWS Graviton4 芯片,不僅在性價(jià)比方面領(lǐng)先業(yè)界,更在企業(yè)級(jí)工作負(fù)載的整體性能上遠(yuǎn)超 AMD 和英特爾推出的同類 x86 芯片。例如,Signal65 的基準(zhǔn)測(cè)試結(jié)果表明,Graviton4 的大語言模型 (LLM) 推理性能比 AMD 同類產(chǎn)品高 168%,性價(jià)比高 220%;同時(shí)網(wǎng)絡(luò)吞吐量比英特爾同類產(chǎn)品高出 53%,機(jī)器學(xué)習(xí) (ML) 訓(xùn)練速度快于 34%。這些數(shù)據(jù)充分印證了 Arm 在 AI 和通用計(jì)算任務(wù)方面的顯著架構(gòu)優(yōu)勢(shì)。
從云端到邊緣側(cè),AI 亟需新型計(jì)算平臺(tái)
AI 正在突破數(shù)據(jù)中心的邊界,向更廣闊的應(yīng)用場(chǎng)景延伸。如今,無論是智能手機(jī)、個(gè)人電腦 (PC) 還是物聯(lián)網(wǎng)設(shè)備——小至低功耗傳感器,大到高性能工業(yè)應(yīng)用——都需要端側(cè)生成式 AI 來重塑用戶體驗(yàn)。
在此趨勢(shì)下,Arm 同樣獨(dú)具優(yōu)勢(shì)。面向消費(fèi)電子設(shè)備的全新Arm Lumex 計(jì)算子系統(tǒng) (CSS) 平臺(tái),可支持智能助手、語音翻譯和個(gè)性化服務(wù)等實(shí)時(shí)端側(cè) AI 應(yīng)用場(chǎng)景,而搭載 SME2 技術(shù)的全新 Arm CPU則可實(shí)現(xiàn)高達(dá) 5 倍的 AI 性能提升。同時(shí),全球首個(gè)基于 Armv9 架構(gòu)的邊緣 AI 計(jì)算平臺(tái),專為物聯(lián)網(wǎng)應(yīng)用中的邊緣 AI 工作負(fù)載優(yōu)化,可支持參數(shù)規(guī)模超 10 億的端側(cè) AI 模型運(yùn)行。
Arm 正在驅(qū)動(dòng)一場(chǎng)從云端到邊緣端的變革,憑借其本身的架構(gòu)優(yōu)勢(shì)賦能全場(chǎng)景的規(guī)?;渴?。
軟件鑄就差異化優(yōu)勢(shì),Arm 工具為 AI 時(shí)代賦能
在 AI 領(lǐng)域,硬件構(gòu)筑底層基礎(chǔ),而軟件決定用戶體驗(yàn)。隨著 AI 工作負(fù)載日益復(fù)雜、應(yīng)用場(chǎng)景不斷拓展,開發(fā)者亟需一個(gè)能夠緊跟創(chuàng)新步伐的生態(tài)系統(tǒng)。而這正是 Arm 的優(yōu)勢(shì)所在:一套統(tǒng)一的架構(gòu),搭配從云端到邊緣端、強(qiáng)大且經(jīng)過優(yōu)化的軟件生態(tài)系統(tǒng)。
多達(dá) 2,200 萬規(guī)模的 Arm 開發(fā)者群體將受益于這一協(xié)同生態(tài)系統(tǒng),無論是數(shù)據(jù)中心的大規(guī)模模型訓(xùn)練,還是邊緣側(cè)的實(shí)時(shí)推理,相同的代碼、工具與框架均可在不同設(shè)備上無縫運(yùn)行。這種架構(gòu)一致性顯著加速開發(fā)進(jìn)程,簡(jiǎn)化優(yōu)化路徑,實(shí)現(xiàn)更廣泛的部署落地,避免冗余工程投入。
PyTorch ExecuTorch、TensorFlow Lite 和MediaPipe等主要框架,現(xiàn)已通過 Arm KleidiAI 與基于 Arm 架構(gòu)的系統(tǒng)實(shí)現(xiàn)深度集成和優(yōu)化。Arm KleidiAI 是輕量級(jí)的開源優(yōu)化層,可激活基于 Arm 架構(gòu)進(jìn)行優(yōu)化的底層微內(nèi)核。如此一來,開發(fā)者無需修改代碼即可自動(dòng)獲取性能增益——從超大規(guī)模云平臺(tái)到智能手機(jī)、嵌入式設(shè)備,全場(chǎng)景適用。
例如,在 Graviton4 上,KleidiAI 的集成使 Llama 3 的詞元 (token) 首次響應(yīng)時(shí)間較基準(zhǔn)提升了 2.5 倍;而在移動(dòng)端,基于 MediaPipe 的方案在 Gemma 2B 等模型上,也實(shí)現(xiàn)了高達(dá) 30% 的性能提升。無論是管理 AI 工廠,還是在邊緣側(cè)部署聊天機(jī)器人,開發(fā)者均可獲得可預(yù)測(cè)、高性能和高能效的軟件體驗(yàn)。
這種無縫、具備系統(tǒng)感知能力的軟件賦能方式,正是 Arm 平臺(tái)的核心差異化所在。開發(fā)者無需應(yīng)對(duì)碎片化技術(shù)棧的困擾,也無需重復(fù)開展后端重構(gòu)工作;相反,他們能夠直接借助這套軟硬件協(xié)同設(shè)計(jì)的生態(tài)系統(tǒng),實(shí)現(xiàn) AI 的性能和效率優(yōu)勢(shì)。
在“每瓦性能”至關(guān)重要的 AI 時(shí)代,Arm 的軟件生態(tài)系統(tǒng)不僅緊跟行業(yè)需求,更能貼合開發(fā)者的實(shí)際場(chǎng)景,加速其創(chuàng)新進(jìn)程。
AI 規(guī)?;l(fā)展的核心支柱
從萬億美元級(jí)的數(shù)據(jù)中心,到下一代智能手機(jī)與智能車載系統(tǒng),AI 正在以前所未有的規(guī)??焖侔l(fā)展。作為貫通這些場(chǎng)景的橋梁,Arm 架構(gòu)正發(fā)揮著關(guān)鍵作用。
憑借超大規(guī)模云服務(wù)提供商的廣泛部署、靈活的邊緣計(jì)算能力,以及充滿活力、AI 就緒的軟件生態(tài)系統(tǒng),Arm 已成為當(dāng)下和未來 AI 基礎(chǔ)設(shè)施的核心支柱。
-
ARM
+關(guān)注
關(guān)注
135文章
9589瀏覽量
393796 -
cpu
+關(guān)注
關(guān)注
68文章
11332瀏覽量
225990 -
AI
+關(guān)注
關(guān)注
91文章
41315瀏覽量
302695
原文標(biāo)題:從云端到邊緣,Arm 為何是擴(kuò)展 AI 技術(shù)棧的理想之選
文章出處:【微信號(hào):Arm社區(qū),微信公眾號(hào):Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
Vibe Coding AI全棧開發(fā)實(shí)戰(zhàn)
EFM32PG1微控制器:低功耗高性能的理想之選
Kinetis? K8x MCU 家族:助力物聯(lián)網(wǎng)智能設(shè)備開發(fā)的理想之選
深入解析LPC3180:高性能ARM微控制器的卓越之選
曙光云AI全棧平臺(tái)解鎖政企AI新效能
瑞薩RA2T1微控制器:低功耗設(shè)計(jì)的理想之選
雙芯光纜:數(shù)據(jù)中心建設(shè)的理想之選
TUSB321AI:USB Type - C配置通道邏輯與端口控制的理想之選
AMC1202:精準(zhǔn)電流傳感的理想之選
RA0E2微控制器:低功耗設(shè)計(jì)的理想之選
TDK IBQ系列磁性片:RFID應(yīng)用的理想之選
OPTIGA? Authenticate NBT開發(fā)板:物聯(lián)網(wǎng)安全認(rèn)證的理想之選
KEMET MPGV金屬復(fù)合功率電感:汽車應(yīng)用的理想之選
AI應(yīng)用創(chuàng)新與全棧技術(shù)融合分論壇即將召開
芯茂微 LP2179B:小家電電源的理想之選
Arm為何是擴(kuò)展AI技術(shù)棧的理想之選
評(píng)論