作者:Arm 云 AI 事業(yè)部行業(yè)市場高級總監(jiān) Dilip Ramachandran
在代理式系統(tǒng)蓬勃發(fā)展的趨勢下,人工智能 (AI) 重心正從模型訓(xùn)練轉(zhuǎn)向推理,數(shù)據(jù)中心行業(yè)邁入全新的增長階段。其挑戰(zhàn)不再局限于理論性能,而是如何在混合部署環(huán)境中,高效擴(kuò)展并編排始終在線的分布式 AI 工作負(fù)載。
代理式 AI 系統(tǒng)需要持續(xù)運(yùn)行,以協(xié)調(diào)各項任務(wù)、與數(shù)據(jù)流水線交互并實時做出決策。這一演進(jìn)對基礎(chǔ)設(shè)施提出更嚴(yán)苛的需求,要求其能實現(xiàn)更優(yōu)的能效、更大的計算密度,以及跨技術(shù)棧的無縫編排能力。
面向大規(guī)模 AI 的全棧式方案
Arm 攜手紅帽打造深度集成、生產(chǎn)級的 AI 技術(shù)棧,共同破解行業(yè)現(xiàn)存難題。雙方依托Arm AGI CPU與紅帽企業(yè)級開源平臺,構(gòu)建統(tǒng)一底層架構(gòu),支撐云端及本地數(shù)據(jù)中心順暢運(yùn)行 AI 智能體、云原生工作負(fù)載與各類企業(yè)級應(yīng)用。
軟件層面,紅帽可提供專為 Arm 架構(gòu)深度優(yōu)化的全棧企業(yè)級平臺。基于 Arm 架構(gòu)的紅帽企業(yè) Linux (RHEL) 是一款兼具穩(wěn)定與安全特性的操作系統(tǒng),全面兼容現(xiàn)有企業(yè)工具、框架及工作流。對于采用混合云架構(gòu)的企業(yè),該系統(tǒng)可確保一致的運(yùn)行時環(huán)境,助力工作負(fù)載在 Arm 架構(gòu)云實例與本地基礎(chǔ)設(shè)施之間無縫遷移。
紅帽 OpenShift 進(jìn)一步拓展了這一能力,使企業(yè)能夠在 Arm 架構(gòu)上規(guī)模化部署和管理 Kubernetes 集群。AI 智能體、微服務(wù)和數(shù)據(jù)流水線可在統(tǒng)一的云原生平臺中進(jìn)行編排,從而簡化跨環(huán)境的運(yùn)維管理。借助紅帽 OpenShift 虛擬化對 Arm AGI CPU 的支持,企業(yè)可以同時運(yùn)行虛擬機(jī)和容器,實現(xiàn)循序漸進(jìn)的現(xiàn)代化升級,并在不影響現(xiàn)有工作負(fù)載的前提下遷移至 Arm 平臺。
紅帽 AI 工程副總裁 Steven Huels 表示:“紅帽打造企業(yè)級開源平臺,助力混合云環(huán)境創(chuàng)新,并為客戶實現(xiàn)從應(yīng)用層到底層架構(gòu)的多元選擇。Arm 生態(tài)持續(xù)擴(kuò)展,讓我們得以提供更豐富的行業(yè)解決方案;Arm AGI CPU 更將延續(xù)這一發(fā)展態(tài)勢,依托紅帽安全可靠、開放的技術(shù)底座,構(gòu)筑新一代面向 AI 的基礎(chǔ)設(shè)施。”
面向 AI 基礎(chǔ)設(shè)施的定制化芯片
要在不同環(huán)境中實現(xiàn)這種一致性與可擴(kuò)展性,就必須從芯片底層搭建全新技術(shù)根基。
該解決方案的核心是 Arm AGI CPU。這是 Arm 于今年三月發(fā)布的首款面向數(shù)據(jù)中心基礎(chǔ)設(shè)施的系統(tǒng)級芯片 (SoC)。AGI CPU 專為 AI 工作負(fù)載量身打造,能夠支持從大規(guī)模推理與任務(wù)編排,到數(shù)據(jù)庫、視頻處理以及企業(yè)級服務(wù)在內(nèi)的多樣化應(yīng)用場景。
Arm AGI CPU 集成了 136 個 Arm Neoverse V3 核心、96 條 PCIe Gen6 通道,并配備 12 通道 DDR5 內(nèi)存,最高運(yùn)行速率可達(dá) 8800 MT/s,可為新一代工作負(fù)載提供卓越的性能與帶寬。
Amazon Graviton、Microsoft Azure Cobalt 以及 Google Axion 等 Arm 架構(gòu)云平臺,已充分展現(xiàn)出能效比和總體擁有成本 (TCO) 的優(yōu)勢。Arm AGI CPU 將這些優(yōu)勢進(jìn)一步延伸至本地環(huán)境,使企業(yè)能夠?qū)⑨槍υ骗h(huán)境優(yōu)化的 Arm 工作負(fù)載引入本地數(shù)據(jù)中心,同時在不同部署環(huán)境之間保持一致性。
為代理式 AI 需求而生
這一點對代理式 AI 發(fā)展尤為關(guān)鍵。如今企業(yè)不再局限于周期性模型訓(xùn)練,轉(zhuǎn)而搭建始終在線運(yùn)行系統(tǒng),這類系統(tǒng)需具備持續(xù)推理、實時編排能力,并實現(xiàn)大規(guī)模場景下的高效數(shù)據(jù)傳輸。
Arm AGI CPU 專為適配此類場景需求設(shè)計,300 瓦 TDP 設(shè)計,能效表現(xiàn)遠(yuǎn)超傳統(tǒng) 500 瓦級別 x86 處理器。在標(biāo)準(zhǔn)風(fēng)冷 36 千瓦開放計算項目 (Open Compute Project, OCP) 機(jī)架中,單機(jī)架可部署約 8,160 個核心,而傳統(tǒng) x86 架構(gòu)僅能部署 4,352 個核心,同等功耗上限內(nèi),計算密度近乎翻倍。
在 OCP 第三代開放機(jī)架等液冷環(huán)境中,算力規(guī)模可進(jìn)一步擴(kuò)容,單機(jī)架最高可搭載 336 顆 AGI CPU,核心總數(shù)可達(dá) 45,696,實現(xiàn)計算密度高達(dá)五倍的飛躍。
GPU 平臺雖在 AI 模型訓(xùn)練領(lǐng)域具備領(lǐng)先優(yōu)勢,而 Arm AGI CPU 則精準(zhǔn)攻克數(shù)據(jù)預(yù)處理、任務(wù)編排與大規(guī)模推理環(huán)節(jié)的關(guān)鍵瓶頸,全面匹配代理式 AI 系統(tǒng)的核心運(yùn)行訴求。
成熟的生態(tài)體系,已可投入部署
該平臺已獲得了包括 Supermicro、聯(lián)想以及永擎電子等在內(nèi)的廣泛的 OEM 與 ODM 合作伙伴生態(tài)支持,為企業(yè)在基礎(chǔ)設(shè)施部署與擴(kuò)展方式上提供了高度靈活性。
Arm 與紅帽在數(shù)據(jù)中心領(lǐng)域擁有長期而穩(wěn)固的合作基礎(chǔ)。伴隨 Arm AGI CPU 的推出,雙方聯(lián)手打造出一套高度整合、適配企業(yè)級應(yīng)用的 AI 技術(shù)棧,融合經(jīng)優(yōu)化的硬件、成熟可靠的軟件,以及高效性能,全面滿足量產(chǎn)部署需求。
依托這套集成技術(shù)棧打造的解決方案,預(yù)計將于 2026 年第四季度正式面世,助力企業(yè)穩(wěn)步落地新一代 AI 基礎(chǔ)設(shè)施。
-
ARM
+關(guān)注
關(guān)注
135文章
9634瀏覽量
395264 -
cpu
+關(guān)注
關(guān)注
69文章
11396瀏覽量
226834 -
AI
+關(guān)注
關(guān)注
91文章
42696瀏覽量
303582 -
開源
+關(guān)注
關(guān)注
3文章
4460瀏覽量
46710
原文標(biāo)題:Arm 與紅帽攜手基于 Arm AGI CPU 打造生產(chǎn)級 AI 技術(shù)棧,賦能代理式 AI 數(shù)據(jù)中心發(fā)展
文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Arm攜手騰訊游戲MagicDawn打造新一代手游體驗
西門子硬件輔助驗證解決方案助力Arm打造可擴(kuò)展AI基礎(chǔ)設(shè)施
黑馬-Java+AI新版V16零基礎(chǔ)就業(yè)班百度云網(wǎng)盤下載+Java+AI全棧開發(fā)工程師
[完結(jié)15章]Java轉(zhuǎn) AI高薪領(lǐng)域必備-從0到1打通生產(chǎn)級AI Agent開發(fā)
Vibe Coding AI全棧開發(fā)實戰(zhàn)
曙光云AI全棧平臺解鎖政企AI新效能
【智能檢測】基于AI深度學(xué)習(xí)與飛拍技術(shù)的影像測量系統(tǒng):實現(xiàn)高效精準(zhǔn)的全自動光學(xué)檢測與智能制造數(shù)據(jù)閉環(huán)
2026年低代碼平臺市場綜合評測:國內(nèi)10大低代碼平臺深度解析
嵌入式AI開發(fā)必看:杜絕幻覺,才是工業(yè)級IDE的核心底氣
OrangePi RV2 深度技術(shù)評測:RISC-V AI融合架構(gòu)的先行者
沐曦股份攜手紅帽共同發(fā)布MXAIE解決方案
Arm攜手紅帽打造深度集成生產(chǎn)級AI技術(shù)棧
評論