日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm攜手Google Cloud推進(jìn)代理式AI基礎(chǔ)設(shè)施規(guī)?;涞?/h1>

作者:ArmAI 事業(yè)部軟件生態(tài)系統(tǒng)總監(jiān) Yan Fisher

Google Cloud 正通過(guò)多項(xiàng)升級(jí)舉措,穩(wěn)步推進(jìn)代理式人工智能 (Agentic AI) 的規(guī)?;涞?。此次更新包含全新 TPU 8t 和 TPU 8i 系統(tǒng),同時(shí)在 Google Kubernetes Engine (GKE) 上線 Agent Sandbox。作為定制化部署框架,它能夠高效、安全地運(yùn)行復(fù)雜的多步驟 AI 系統(tǒng)。這套全新的代理式基礎(chǔ)設(shè)施,搭載Google 基于 Arm Neoverse 平臺(tái)打造的 Axion 處理器,充分體現(xiàn)出行業(yè)核心趨勢(shì):新一代 AI 工作負(fù)載正加速轉(zhuǎn)向定制化 CPU 架構(gòu)。

隨著代理式 AI 從技術(shù)試驗(yàn)邁向商用部署,基礎(chǔ)設(shè)施的需求正在迭代變革。傳統(tǒng)推理僅依賴單次模型調(diào)用,而智能體系統(tǒng)需要持續(xù)編排調(diào)度邏輯推理鏈、工具調(diào)用和實(shí)時(shí)數(shù)據(jù)讀取。這大幅拉高了并發(fā)壓力、時(shí)延敏感度與整體算力消耗,讓 CPU 成為承載業(yè)務(wù)穩(wěn)定運(yùn)行的核心關(guān)鍵。

這正是 Arm 架構(gòu)基礎(chǔ)設(shè)施的核心優(yōu)勢(shì)所在。Arm Neoverse 平臺(tái)專為高吞吐、高能效計(jì)算場(chǎng)景打造,Google Axion 便是典型代表,已然成為規(guī)模化部署代理式 AI 的堅(jiān)實(shí)底座。

規(guī)?;硎?AI:Axion 走在前沿

Google Cloud 正式發(fā)布第八代 TPU 系統(tǒng),延續(xù)了其長(zhǎng)期深耕定制芯片設(shè)計(jì)的技術(shù)積淀。本次新品針對(duì)訓(xùn)練與推理應(yīng)用做出差異化劃分,推出 TPU 8t 與 TPU 8i 兩款型號(hào);同時(shí)首次搭載 Google Axion CPU 作為計(jì)算頭節(jié)點(diǎn) (header)。該設(shè)計(jì)有效降低數(shù)據(jù)預(yù)處理時(shí)延,保障 TPU 算力引擎滿載運(yùn)行、杜絕算力閑置卡頓。

當(dāng)然,TPU 并非全部布局。Google Cloud 正全力推進(jìn)“AI Hypercomputer”協(xié)同設(shè)計(jì)愿景,另一項(xiàng)關(guān)鍵發(fā)布是 GKE Agent Sandbox。它提供可擴(kuò)展、低時(shí)延的基礎(chǔ)設(shè)施,使智能體能夠在不犧牲性能的前提下,安全地執(zhí)行不受信任的代碼和工具調(diào)用。借助 Google Axion,用戶可以在領(lǐng)先的基礎(chǔ)設(shè)施之上構(gòu)建智能體,同時(shí)兼顧成本效益與技術(shù)選擇的靈活性。

運(yùn)行在 Google Axion 處理器之上、基于 gVisor 打造,且支持 Kata Containers 的 GKE Agent Sandbox,可實(shí)現(xiàn)以下性能指標(biāo):

每個(gè)集群每秒支持 300 個(gè)沙箱

首指令執(zhí)行時(shí)延低于 1 秒

要維持如此高的沙箱吞吐能力和低時(shí)延執(zhí)行表現(xiàn),底層基礎(chǔ)設(shè)施始終承受著持續(xù)壓力。隨著代理式 AI 逐步成為主流部署范式,其所依賴的基礎(chǔ)設(shè)施必須在吞吐能力、響應(yīng)速度與能效方面同步提升,才能在大規(guī)模場(chǎng)景下可靠運(yùn)行智能體工作負(fù)載。Axion 正是為滿足這一需求而設(shè)計(jì)。

隨著智能體系統(tǒng)不斷擴(kuò)張,推理效率的重要性愈發(fā)凸顯。低效的推理能力會(huì)直接導(dǎo)致智能體無(wú)法正常運(yùn)轉(zhuǎn);而缺少智能體編排,推理算力也將長(zhǎng)期處于閑置狀態(tài)。將兩大核心任務(wù)部署到基于 CPU 的基礎(chǔ)設(shè)施之上,企業(yè)即可在嚴(yán)控成本的前提下,實(shí)現(xiàn)高性能智能體系的規(guī)模化擴(kuò)展。

Axion 賦能 AI 推理:以極致性能重構(gòu)成本效益

C4A 虛擬機(jī)搭載基于 Arm Neoverse V2 平臺(tái)的 Axion CPU,經(jīng)過(guò)深度優(yōu)化,可與專用加速器形成能力互補(bǔ)。依托通用計(jì)算底座高效承載高并行、時(shí)延敏感型工作負(fù)載,實(shí)現(xiàn)高吞吐 AI 推理。

該優(yōu)勢(shì)已在實(shí)際部署環(huán)境中得到充分驗(yàn)證。歐洲在線旅游平臺(tái) loveholidays 需在 PB 級(jí)數(shù)據(jù)之上,穩(wěn)定運(yùn)行大規(guī)模向量嵌入與推理工作負(fù)載;規(guī)?;渴饒?chǎng)景下,純加速器方案成本高昂,落地門檻極高。

loveholidays 工程負(fù)責(zé)人 Dimitri Lerko 表示:“業(yè)務(wù)高速發(fā)展下,我們的詞元 (token) 處理需求增速已遠(yuǎn)超預(yù)算擴(kuò)容節(jié)奏。面對(duì)現(xiàn)有海量數(shù)據(jù)規(guī)模,依靠 GPU 承載大規(guī)模向量嵌入與推理負(fù)載成本難以為繼,因此提升 CPU 能效成為核心訴求。依托 Axion 系列的 C4A 和 N4A 虛擬機(jī),我們獲得了充足的性價(jià)比優(yōu)勢(shì),得以基于 CPU 構(gòu)建實(shí)時(shí) AI 決策管線,運(yùn)行定制化模型與開(kāi)源模型推理。這一落地模式在以往完全不具備可行性。”

實(shí)測(cè)數(shù)據(jù)顯示,在多種 AI 推理工作負(fù)載中,C4A 始終優(yōu)于當(dāng)前一代的 x86 實(shí)例:

0e3202a4-4054-11f1-90a1-92fbcf53809c.jpg

Axion 產(chǎn)品組合擴(kuò)展

針對(duì)需要更高控制能力的工作負(fù)載,Axion 系列新增 C4A Metal 原生裸金屬實(shí)例(預(yù)覽版),將一致的 Arm 架構(gòu)從云端延伸至邊緣側(cè)。該實(shí)例支持跨環(huán)境統(tǒng)一開(kāi)發(fā)、驗(yàn)證與部署,可直接訪問(wèn)硬件資源,消除虛擬化層 (hypervisor) 性能損耗,提供穩(wěn)定可預(yù)期的運(yùn)行表現(xiàn)。十分適用于需求嚴(yán)苛的用例,包括汽車 vHIL、原生安卓 CI/CD,以及對(duì)控制能力、性能表現(xiàn)與架構(gòu)一致性有嚴(yán)苛要求的專用企業(yè)基礎(chǔ)設(shè)施。

松下汽車系統(tǒng)北美公司首席技術(shù)官 Andrew Poliak 表示:“松下正跨云端與車端,打造新一代車載體驗(yàn)。在 C4A Metal 實(shí)例預(yù)覽階段,我們采用與邊緣側(cè)架構(gòu)完全一致的 Arm 裸金屬環(huán)境,研發(fā)團(tuán)隊(duì)可依托統(tǒng)一平臺(tái),完成車載應(yīng)用的全流程開(kāi)發(fā)、測(cè)試與驗(yàn)證。依托比特級(jí)一致性能力,我們可實(shí)現(xiàn)云端至車端的無(wú)縫遷移,在兩端運(yùn)行完全相同的二進(jìn)制程序,無(wú)需因架構(gòu)不同而為遷移部署耗費(fèi)資源?!?/p>

與此同時(shí),作為 Axion 系列最新成員的 N4A,為 Web 服務(wù)、API 調(diào)用以及數(shù)據(jù)處理管線等橫向擴(kuò)展型工作負(fù)載提供了高性價(jià)比的計(jì)算基礎(chǔ)。

C4A、C4A Metal 與 N4A 共同構(gòu)成了一個(gè)統(tǒng)一、面向不同工作負(fù)載優(yōu)化的產(chǎn)品組合,既覆蓋 AI 推理,也支持橫向擴(kuò)展型應(yīng)用,并貫穿云端到邊緣環(huán)境,幫助團(tuán)隊(duì)在 Arm 計(jì)算平臺(tái)上同時(shí)實(shí)現(xiàn)性能與成本的優(yōu)化。

Arm 優(yōu)先部署,構(gòu)筑領(lǐng)先生態(tài)

Arm 已支撐起業(yè)內(nèi)規(guī)模龐大、增速領(lǐng)先的軟件生態(tài)系統(tǒng),持續(xù)推動(dòng)云端與邊緣側(cè)向以 Arm 架構(gòu)優(yōu)先的計(jì)算轉(zhuǎn)型。Google 已在 Axion 處理器上運(yùn)行包括 BigQuery、Spanner、Bigtable、Google Earth Engine、Google Compute Engine、GKE Dataflow、Cloud Batch 等多項(xiàng)生產(chǎn)級(jí)服務(wù),并在其部署環(huán)境中完成超 30,000 款內(nèi)部應(yīng)用的架構(gòu)遷移。

對(duì)于剛剛啟動(dòng)遷移的企業(yè),Arm 的云遷移資源中心 (Arm Cloud Migration Resource Hub)[1]提供了 100 多條 Learning Path[2],覆蓋 Google Axion 上的常見(jiàn)工作負(fù)載模式。在整個(gè) Neoverse 生態(tài)中,Arm Software Ecosystem Dashboard[3]可用于追蹤已驗(yàn)證的軟件及其推薦版本;同時(shí),遵循 SystemReady VE 標(biāo)準(zhǔn),可確保軟件從部署第一天起即可實(shí)現(xiàn)無(wú)縫互操作。Elastic、MongoDB、Palo Alto Networks、Redis Labs 以及 Couchbase 等領(lǐng)先的獨(dú)立軟件開(kāi)發(fā)商 (ISV) 均已在基于 Axion 的基礎(chǔ)設(shè)施上完成全面驗(yàn)證。

開(kāi)始使用 Google Axion

無(wú)論是通過(guò) GKE Agent Sandbox 部署智能體工作負(fù)載,在 C4A 上優(yōu)化推理性能,還是借助 N4A 擴(kuò)展通用計(jì)算能力,Axion 都為現(xiàn)代 AI 基礎(chǔ)設(shè)施提供了一個(gè)一致、基于 Arm 計(jì)算平臺(tái)的堅(jiān)實(shí)基礎(chǔ)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20343

    瀏覽量

    255357
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9596

    瀏覽量

    393834
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1817

    瀏覽量

    60655

原文標(biāo)題:Arm 攜手 Google Cloud,依托 Axion 處理器重新定義代理式 AI 基礎(chǔ)設(shè)施

文章出處:【微信號(hào):Arm社區(qū),微信公眾號(hào):Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Arm計(jì)算平臺(tái)持續(xù)演進(jìn)賦能AI邁入全新發(fā)展階段

    人工智能 (AI) 正邁入全新發(fā)展階段,從技術(shù)探索試驗(yàn)轉(zhuǎn)向規(guī)?;?/b>地持續(xù)部署具備推理、規(guī)劃和執(zhí)行能力的系統(tǒng)。代理式 AI 系統(tǒng)的興起正在加速計(jì)算領(lǐng)域的這一變革,進(jìn)一步提升
    的頭像 發(fā)表于 05-06 10:03 ?100次閱讀
    <b class='flag-5'>Arm</b>計(jì)算平臺(tái)持續(xù)演進(jìn)賦能<b class='flag-5'>AI</b>邁入全新發(fā)展階段

    Infosys攜手OpenAI開(kāi)啟企業(yè)AI轉(zhuǎn)型新紀(jì)元:技術(shù)融合驅(qū)動(dòng)商業(yè)價(jià)值規(guī)?;?/b>釋放

    ;的雙輪驅(qū)動(dòng)時(shí)代。雙方將通過(guò)OpenAI前沿AI模型與Infosys Topaz Fabric代理式AI套件的深度整合,幫助全球企業(yè)跨越AI實(shí)驗(yàn)階段,實(shí)現(xiàn)從技術(shù)驗(yàn)證到
    的頭像 發(fā)表于 05-06 09:55 ?127次閱讀

    NVIDIA與Google Cloud攜手推進(jìn)代理式與物理AI發(fā)展

    NVIDIA Blackwell GPU 以及由 NVIDIA Nemotron 和 NeMo 提供支持、基于 Gemini Enterprise Agent Platform 的代理式 AI 來(lái)構(gòu)建 AI 工廠。
    的頭像 發(fā)表于 04-27 15:35 ?414次閱讀

    NetApp與Google Cloud深化合作:重構(gòu)分布式云數(shù)據(jù)基礎(chǔ)設(shè)施的“安全主權(quán)”新范式

    NetApp與Google Cloud簽署四年期企業(yè)級(jí)協(xié)議,通過(guò)NetApp存儲(chǔ)解決方案與Google Distributed Cloud(GDC)的深度集成,為全球企業(yè)構(gòu)建“全棧物理
    的頭像 發(fā)表于 04-27 11:04 ?840次閱讀

    Cadence 與 Google 合作,利用 ChipStack AI Super Agent 在 Google Cloud 上擴(kuò)展 AI 驅(qū)動(dòng)的芯片設(shè)計(jì)

    合作,利用 Google Cloud 上的 Gemini 模型優(yōu)化 Cadence? ChipStack? AI Super Agent。此次合作使 Cadence 站在向代理式設(shè)計(jì)自
    的頭像 發(fā)表于 04-24 13:22 ?153次閱讀

    Cadence與Google合作,利用ChipStack AI Super Agent在Google Cloud上擴(kuò)展AI驅(qū)動(dòng)的芯片設(shè)計(jì)

    Cadence ChipStack AI Super Agent 集成 Google Gemini 模型,加速新一代代理驅(qū)動(dòng)型設(shè)計(jì)自動(dòng) 中國(guó)上海,2026 年 4 月 24 日 ——
    的頭像 發(fā)表于 04-24 10:36 ?1272次閱讀

    Arm AGI CPU加速新一代基礎(chǔ)設(shè)施建設(shè)

    近期,Arm 推出 Arm AGI CPU,一款由 Arm 自主設(shè)計(jì)、面向人工智能 (AI) 數(shù)據(jù)中心的 CPU,旨在滿足日益增長(zhǎng)的代理式
    的頭像 發(fā)表于 04-09 15:55 ?363次閱讀

    精彩演講·不容錯(cuò)過(guò) | 智能規(guī)?;?/b>:平臺(tái)驅(qū)動(dòng),賦能半導(dǎo)體全生態(tài)AI分析規(guī)模化落地

    精彩演講不容錯(cuò)過(guò)演講信息論壇:設(shè)計(jì)創(chuàng)新論壇:AI智能應(yīng)用和汽車芯片時(shí)間:2026年3月26日1645地點(diǎn):上海浦東嘉里大酒店,三樓,上海廳3演講主題:智能規(guī)?;?/b>:平臺(tái)驅(qū)動(dòng),賦能半導(dǎo)體全生態(tài)AI分析
    的頭像 發(fā)表于 03-26 13:03 ?409次閱讀
    精彩演講·不容錯(cuò)過(guò) | 智能<b class='flag-5'>規(guī)模化</b>:平臺(tái)驅(qū)動(dòng),賦能半導(dǎo)體全生態(tài)<b class='flag-5'>AI</b>分析<b class='flag-5'>規(guī)?;?/b><b class='flag-5'>落地</b>

    泰芯半導(dǎo)體攜手生態(tài)伙伴助力AI硬件產(chǎn)業(yè)規(guī)?;?/b>落地

    當(dāng)前,AI大模型加速滲透硬件產(chǎn)業(yè),AI硬件正從 “單點(diǎn)智能” 邁向 “系統(tǒng)級(jí)智能”,大模型已成為硬件產(chǎn)品的基礎(chǔ)能力之一。順應(yīng)這一行業(yè)發(fā)展趨勢(shì),珠海泰芯半導(dǎo)體有限公司(以下簡(jiǎn)稱 “泰芯半導(dǎo)體”)積極攜手生態(tài)伙伴,以核心芯片技術(shù)賦能
    的頭像 發(fā)表于 01-05 17:18 ?1441次閱讀

    軟通動(dòng)力攜手華為昇騰推進(jìn)AI智能體規(guī)?;?/b>部署

    企業(yè)AI智能體規(guī)?;?/b>落地”主題演講,分享了軟通動(dòng)力在AI智能體領(lǐng)域的前沿實(shí)踐與成熟解決方案,獲得行業(yè)高度關(guān)注。
    的頭像 發(fā)表于 09-28 17:50 ?1768次閱讀

    軟通動(dòng)力如何推動(dòng)工業(yè)AI規(guī)?;?/b>落地

    近日,在2025世界人工智能大會(huì)(WAIC 2025)“AI數(shù)算 重構(gòu)智造產(chǎn)鏈生態(tài)”2025智能趨勢(shì)論壇上,軟通動(dòng)力集團(tuán)咨詢與數(shù)字創(chuàng)新服務(wù)線聯(lián)席總裁李國(guó)亮受邀出席圓桌對(duì)話:《智造“最后一公里”》——工業(yè)AI
    的頭像 發(fā)表于 07-30 17:27 ?1267次閱讀

    代理式AIAI智能體在不同行業(yè)中的實(shí)際應(yīng)用

    代理式 AI 的時(shí)代已經(jīng)到來(lái)。如今,代理式 AI 已經(jīng)驅(qū)動(dòng)應(yīng)用邁向深度場(chǎng)景融合與規(guī)?;?/b>落地。這波
    的頭像 發(fā)表于 07-28 14:28 ?1431次閱讀

    NVIDIA全棧加速代理式AI應(yīng)用落地

    在近期舉辦的 AWS 中國(guó)峰會(huì)上,NVIDIA 聚焦于“NVIDIA 全棧加速代理式 AI 應(yīng)用落地”,深入探討了代理式 AI (Agent
    的頭像 發(fā)表于 07-14 11:41 ?1486次閱讀

    NVIDIA攜手微軟加速代理式AI發(fā)展

    代理式 AI 正在重新定義科學(xué)探索,推動(dòng)各行各業(yè)的研究突破和創(chuàng)新發(fā)展。NVIDIA 和微軟正通過(guò)深化合作提供先進(jìn)的技術(shù),從云到 PC 加速代理式 AI 應(yīng)用的發(fā)展。
    的頭像 發(fā)表于 05-27 14:03 ?1254次閱讀

    基于代理式AI建立網(wǎng)絡(luò)安全防御體系

    NVIDIA AI 安全棧為先進(jìn)的代理式系統(tǒng)提供信任、控制和管理支持。
    的頭像 發(fā)表于 05-07 14:29 ?1351次閱讀

    桓仁| 琼中| 鄂尔多斯市| 盐山县| 二连浩特市| 师宗县| 长阳| 英德市| 阳东县| 永春县| 丹巴县| 镇原县| 平和县| 云龙县| 宣恩县| 京山县| 莱芜市| 金秀| 南汇区| 鄂尔多斯市| 望谟县| 法库县| 镇安县| 宕昌县| 琼中| 子洲县| 河东区| 清涧县| 墨玉县| 汉沽区| 琼中| 古蔺县| 望谟县| 永春县| 北川| 大埔县| 建昌县| 电白县| 阿勒泰市| 巴彦淖尔市| 惠安县|