隨著人工智能 (AI) 工作負(fù)載在規(guī)模和復(fù)雜性上的持續(xù)提升,AI 對算力的功耗需求正迅速攀升。當(dāng)下真正的瓶頸已不在于原始算力,而是能否在功耗、散熱、物理空間的固有約束內(nèi),提供高能效的計(jì)算能力。
與此同時(shí),AI 工作負(fù)載的運(yùn)行特征也在迭代演變。系統(tǒng)正從用戶發(fā)起的短時(shí)交互模式,逐步轉(zhuǎn)向自主生成、自主調(diào)度任務(wù)的持續(xù)性多階段流程。適配這一變革,需要依托全新技術(shù):以最大化每瓦性能、并在持續(xù)負(fù)載下維持性能穩(wěn)定為核心,而非僅針對瞬時(shí)流量峰值做優(yōu)化。
而工作負(fù)載運(yùn)行模式的這一變革,正愈發(fā)由代理式 AI (Agentic AI)驅(qū)動。與傳統(tǒng)推理不同,代理式 AI 不只是生成詞元 (token),而是會協(xié)調(diào)一連串決策過程,包括工具調(diào)用、檢索步驟、記憶訪問以及模型之間的交互。這使得系統(tǒng)編排成為一項(xiàng)一級需求,而 CPU 作為負(fù)責(zé)管理并持續(xù)支撐這些復(fù)雜流程的關(guān)鍵系統(tǒng)組件,其重要性愈發(fā)凸顯。
什么是代理式 AI
代理式 AI 所賦能的全新系統(tǒng)能夠在極少人工干預(yù)的情況下,自主完成任務(wù)規(guī)劃、執(zhí)行并動態(tài)適配。這類系統(tǒng)不再局限于單次指令應(yīng)答,而是將復(fù)雜任務(wù)拆解為分步流程,調(diào)用各類工具與服務(wù),并在運(yùn)行過程中持續(xù)迭代調(diào)整。
例如,一個(gè)代理式 AI 系統(tǒng)可以接收諸如“準(zhǔn)備一份市場分析報(bào)告”這樣的高級需求,隨后自動從多個(gè)數(shù)據(jù)源收集信息、開展分析、生成報(bào)告并完成分享,全程無需人們逐步下達(dá)指令。

這清楚地表明了 AI 運(yùn)行方式正在發(fā)生轉(zhuǎn)變。傳統(tǒng) AI 系統(tǒng)大多是被動響應(yīng)的:用戶提交提示,模型生成回復(fù),交互隨即結(jié)束。相比之下,代理式 AI 系統(tǒng)具有持續(xù)性。它們能夠運(yùn)行完整工作流、協(xié)調(diào)多項(xiàng)流程,其運(yùn)作不再局限于單次交互。
此類系統(tǒng)需自主調(diào)度任務(wù)、聯(lián)動多模型協(xié)作并實(shí)時(shí)決策,使得系統(tǒng)運(yùn)行負(fù)荷的增速,遠(yuǎn)超傳統(tǒng)人工交互的節(jié)奏。最終帶來系統(tǒng)負(fù)載的躍升,工作負(fù)載呈現(xiàn)持續(xù)運(yùn)行、多任務(wù)并發(fā)的特點(diǎn),對硬件算力與系統(tǒng)承載能力提出了更高要求。
代理式 AI 系統(tǒng)如何運(yùn)作
代理式 AI 系統(tǒng)依靠規(guī)劃、任務(wù)編排、自主學(xué)習(xí)、行動執(zhí)行等一系列環(huán)節(jié)運(yùn)轉(zhuǎn)。每個(gè)環(huán)節(jié)都會產(chǎn)生前后依賴關(guān)系,必須按既定順序依次處理,且往往需要跨多個(gè)服務(wù)協(xié)同調(diào)度。
協(xié)同編排層的重要性正日益凸顯。在代理式 AI 系統(tǒng)中,CPU 不再只是為加速器輸送數(shù)據(jù),而是承擔(dān)全局編排中樞的角色,統(tǒng)籌工具調(diào)用、內(nèi)存訪問、服務(wù)協(xié)作、任務(wù)調(diào)度,以及貫穿整個(gè)工作流的控制流決策。
隨著并發(fā)任務(wù)數(shù)量持續(xù)增長,各類依賴關(guān)系逐漸暴露出傳統(tǒng)系統(tǒng)架構(gòu)設(shè)計(jì)的短板。工作負(fù)載容易出現(xiàn)分配失衡:部分資源閑置利用率偏低,另一部分資源卻負(fù)載過載、趨于飽和。即便尚有富余算力,內(nèi)存與 I/O 也極易成為爭搶瓶頸,拖累整體執(zhí)行速度。
這就導(dǎo)致:單純增加線程數(shù)、擴(kuò)大工作負(fù)載體量,并不總能提升系統(tǒng)性能。反而會讓系統(tǒng)各處的低效損耗不斷累積,拉低整體吞吐能力,同時(shí)抬高各項(xiàng)任務(wù)的運(yùn)行成本。
對 AI 基礎(chǔ)設(shè)施設(shè)計(jì)的啟示
代理式 AI 的興起,不僅改變了系統(tǒng)的構(gòu)建模式,更重塑了配套基礎(chǔ)設(shè)施的設(shè)計(jì)理念。當(dāng)下 AI 工作負(fù)載多為需長期穩(wěn)定運(yùn)行的連續(xù)業(yè)務(wù)流程,因此基礎(chǔ)設(shè)施設(shè)計(jì)愈發(fā)重視協(xié)同調(diào)度、持續(xù)吞吐、資源高效管理與利用率優(yōu)化。
這意味著設(shè)計(jì)重心不再局限于單一組件的峰值性能,而是更看重整個(gè)系統(tǒng)中各組件的協(xié)同能力。性能評價(jià)標(biāo)準(zhǔn)也已升級:不再只考量單項(xiàng)任務(wù)的處理速度,而是要看在既定功耗與容量約束下,系統(tǒng)能否在海量并發(fā)工作流中保持穩(wěn)定一致的任務(wù)執(zhí)行能力。唯有實(shí)現(xiàn)計(jì)算、內(nèi)存、I/O 三者均衡配比,才能在性能擴(kuò)容的同時(shí)規(guī)避瓶頸。
代理式 AI 也重構(gòu)了能效的衡量維度,評價(jià)重心轉(zhuǎn)向:系統(tǒng)在每瓦功耗、單機(jī)架條件下可長期承載的有效業(yè)務(wù)量,同時(shí)在多并發(fā)工作流中維持穩(wěn)定時(shí)延。能效優(yōu)化不再局限于模型推理層面,已然上升為全局性的系統(tǒng)級挑戰(zhàn)。
Arm 首款量產(chǎn)芯片產(chǎn)品 Arm AGI CPU,是 Arm 專為 AI 數(shù)據(jù)中心設(shè)計(jì)的 CPU,旨在為下一代 AI 基礎(chǔ)設(shè)施破解上述挑戰(zhàn)。通過在系統(tǒng)層面實(shí)現(xiàn)計(jì)算、內(nèi)存與 I/O 的協(xié)同擴(kuò)展,保障每項(xiàng)任務(wù)都能匹配充足資源、高效運(yùn)行,從而在嚴(yán)格的功耗限制下,為高編排、高并發(fā)的復(fù)雜工作負(fù)載提供可預(yù)期的穩(wěn)定性能。
該設(shè)計(jì)可讓復(fù)雜工作流的執(zhí)行更平穩(wěn)連貫,使系統(tǒng)無需依靠冗余算力,也不用彌補(bǔ)技術(shù)棧各層級的資源失衡,即可穩(wěn)定維持性能輸出。隨著代理式 AI 系統(tǒng)逐步大規(guī)模落地商用,能否在資源約束下持續(xù)穩(wěn)定輸出性能,將決定其規(guī)?;渴鸬膶?shí)際成效。
代理式 AI:從云端延伸至邊緣側(cè)
代理式 AI 工作負(fù)載也正開始從云端和數(shù)據(jù)中心向更廣闊的應(yīng)用領(lǐng)域拓展,部分執(zhí)行過程逐步向更靠近用戶的終端設(shè)備遷移,從而實(shí)現(xiàn)更快速、更私密、且結(jié)合本地上下文的決策。
例如,在預(yù)訂度假行程時(shí),如果用戶提出“規(guī)劃一次 6 月為期一周的意大利之旅”,智能體可以自動查詢航班、比較價(jià)格、選擇住宿、規(guī)劃行程并完成預(yù)訂。其中一些步驟(如大規(guī)模數(shù)據(jù)檢索)可能仍在云端執(zhí)行,而另一些步驟(如管理用戶偏好或跟蹤整體流程)則可以在設(shè)備本地完成,以避免反復(fù)產(chǎn)生延遲。
這形成了一種分布式處理模式:任務(wù)在云端與邊緣側(cè)之間拆分執(zhí)行,其核心目標(biāo)是確保代理式 AI 流程中的每一個(gè)步驟都能在任何位置可靠運(yùn)行。在這一過程中,CPU 的角色再次變得至關(guān)重要 —— 它不僅需要跨不同環(huán)境協(xié)調(diào)工作流,還要在端側(cè)對 GPU、NPU 等計(jì)算單元進(jìn)行編排,確保任務(wù)被分配到最合適的執(zhí)行組件上,從而在設(shè)備資源受限的條件下,實(shí)現(xiàn) AI 工作負(fù)載的更高效運(yùn)行。
賦能 AI 發(fā)展新階段
支持代理式 AI 工作負(fù)載,絕非單純擴(kuò)充系統(tǒng)容量,而是要打造能夠在持續(xù)真實(shí)業(yè)務(wù)場景下高效穩(wěn)定運(yùn)行的架構(gòu)體系。
從云端到邊緣側(cè),Arm 面向全新計(jì)算時(shí)代的技術(shù)理念,恰好契合這一行業(yè)變革趨勢。通過專注于如何在多場景、多負(fù)載形態(tài)下實(shí)現(xiàn)規(guī)?;懔桓?,Arm 為新一代代理式 AI 系統(tǒng)的落地運(yùn)行筑牢了底層根基。
-
cpu
+關(guān)注
關(guān)注
68文章
11362瀏覽量
226291 -
AI
+關(guān)注
關(guān)注
91文章
41834瀏覽量
302983 -
工作負(fù)載
+關(guān)注
關(guān)注
0文章
17瀏覽量
2131
原文標(biāo)題:讀懂代理式 AI:重構(gòu)從云端到邊緣側(cè)的 AI 新范式
文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Arm推進(jìn)代理式AI時(shí)代基礎(chǔ)設(shè)施演進(jìn)
Arm計(jì)算平臺持續(xù)演進(jìn)賦能AI邁入全新發(fā)展階段
Arm攜手Google Cloud推進(jìn)代理式AI基礎(chǔ)設(shè)施規(guī)模化落地
NVIDIA與Google Cloud攜手推進(jìn)代理式與物理AI發(fā)展
華為擁抱AI WAN邁向All Intelligence新階段
代理式 AI 重構(gòu) EDA:從對話助手到虛擬工程師
Cadence運(yùn)用代理式AI應(yīng)對智能系統(tǒng)設(shè)計(jì)挑戰(zhàn)
從生成式AI到代理式AI:半導(dǎo)體技術(shù)賦能下一波創(chuàng)新浪潮
AI智能體在金融服務(wù)領(lǐng)域的最大價(jià)值
全能底座 | SNM980賦能端側(cè)AI技術(shù)應(yīng)用的全新階段
代理式AI系統(tǒng)賦能行業(yè)發(fā)展新階段
評論