日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

解讀基于Arm Neoverse V2平臺的Google Axion處理器

Arm社區(qū) ? 來源:Arm社區(qū) ? 2025-04-21 13:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 基礎(chǔ)設(shè)施事業(yè)部服務(wù)器生態(tài)系統(tǒng)開發(fā)總監(jiān) Bhumik Patel

云計算需求在人工智能 (AI) 時代的爆發(fā)式增長,推動了開發(fā)者尋求性能優(yōu)化且高能效的解決方案,以降低總體擁有成本 (TCO)。Arm 致力于通過 Arm Neoverse 平臺滿足不斷變化的需求,Neoverse 也正因此迅速成為開發(fā)者作為構(gòu)建未來的云基礎(chǔ)設(shè)施的首選計算平臺。

Google Cloud 攜手 Arm,設(shè)計了針對實際性能進(jìn)行調(diào)優(yōu)的定制芯片。作為其首款基于 Neoverse 平臺的定制 CPU,Google Axion 的性能優(yōu)于傳統(tǒng)處理器,并具有更出色的性能、效率與擴(kuò)展性。雙方的合作為開發(fā)者帶來了更優(yōu)選擇,并共同推動了云計算創(chuàng)新。

在 Google Cloud 內(nèi)外均備受青睞

Google Axion 處理器基于 Arm Neoverse V2 平臺構(gòu)建,可為各種工作負(fù)載提供卓越性能和能效,包括云原生應(yīng)用、高要求的 AI 模型以及大量 Google Cloud 服務(wù),例如 Compute Engine、Google Kubernetes Engine (GKE)、Batch、Dataproc 、Dataflow,以及目前處于預(yù)覽階段的 AlloyDB 和 Cloud SQL。

從內(nèi)容流媒體到企業(yè)級數(shù)據(jù)服務(wù),各行業(yè)的企業(yè)都在使用基于 Arm 架構(gòu)的 Axion 處理器,并在計算效率、可擴(kuò)展性和 TCO 方面實現(xiàn)了顯著改進(jìn)。ClickHouse、Dailymotion、Databricks、Elastic、loveholidays、MongoDB、Palo Alto Networks、Paramount Global、Redis Labs 和 Starburst 等 Google Cloud 的客戶都已取得了變革性的成果。例如,Spotify 通過使用基于 Axion 的 C4A 虛擬機(jī),使其性能提高了約 250%。

突破性能局限

Google Axion 處理器在 AI 推理工作負(fù)載和通用計算方面均有出色表現(xiàn)。針對 AI 推理,Axion 的專用優(yōu)化可顯著提高性能,使 AI 工作負(fù)載能夠更快、更高效地運行。自然語言處理、計算機(jī)視覺和推薦系統(tǒng)等應(yīng)用均可得益于此。AI 開發(fā)者可以利用到 Arm Kleidi 的優(yōu)勢,這是一組輕量級、高性能的開源庫。Kleidi 通過與熱門框架集成,使得開發(fā)者無需額外的開發(fā)工作,即可顯著提升在 Arm 平臺上運行的 AI 應(yīng)用的性能。

Axion 處理器利用 Arm 平臺的先進(jìn)架構(gòu)功能,使開發(fā)者能夠在不犧牲速度或性能的情況下規(guī)?;渴饛?fù)雜的 AI 模型。

例如,與基于 x86 架構(gòu)的方案相比,針對 Axion 的 MLPerf DLRMv2 基準(zhǔn)測試的全精度性能提高了三倍,展示了其在推薦系統(tǒng)中的卓越能力。許多用戶更青睞 FP32 精度,以避免因采用 INT8 等低精度格式而導(dǎo)致的準(zhǔn)確性問題,從而減少因這類問題引起的銷售損失、客戶滿意度降低以及品牌聲譽(yù)受損。

另一個示例則是,AI 聊天機(jī)器人有時會提供過時或不準(zhǔn)確的答案,檢索增強(qiáng)生成 (RAG) 方法提供了功能強(qiáng)大的解決方案來提高其準(zhǔn)確性和相關(guān)性。測試顯示,與 x86 架構(gòu)方案相比,當(dāng) RAG 應(yīng)用在 Axion 處理器上運行時,其性能可最高提升 2.5 倍。(有關(guān)該示例的詳細(xì)內(nèi)容,敬請期待后續(xù)文章!)

從下圖可以看到,Axion 處理器使通用工作負(fù)載實現(xiàn)了顯著的性能提升。通過優(yōu)化高吞吐量和低延遲,Axion 處理器實現(xiàn)了更快的應(yīng)用響應(yīng)時間、增強(qiáng)用戶體驗,并提高資源利用率,是 Web 服務(wù)器、數(shù)據(jù)庫、分析和容器化微服務(wù)的理想選擇。

與此同時,得益于基于 Axion 的 C4A 虛擬機(jī)將原生 Neoverse 核心的性能與每個 vCPU 的充足內(nèi)存帶寬相結(jié)合,其特別適用于高性能計算 (HPC) 工作負(fù)載。HPC 開發(fā)者可以充分利用 Neoverse 平臺上所提供的開源及商用科學(xué)計算應(yīng)用和框架的豐富生態(tài)系統(tǒng),包括 Arm Compiler for Linux 和 Arm Performance Libraries。Arm 在行業(yè)標(biāo)準(zhǔn)的碰撞和沖擊仿真應(yīng)用 Altair OpenRadioss 上的測試顯示,在基于 Axion 的 C4A 虛擬機(jī)上運行具有顯著的性能優(yōu)勢。

加速云遷移進(jìn)程

為了支持和加速開發(fā)者在云端采用 Arm 架構(gòu),Arm 近期發(fā)布了全面的云遷移資源。其核心是新的 Cloud Migration Resource Hub(云遷移資源中心),其中涵蓋了超過 100 個詳細(xì)的 Learning Path 教程,旨在指導(dǎo)開發(fā)者如何跨多個平臺無縫遷移常見工作負(fù)載。與此同時,支持 Axion 的獨立軟件供應(yīng)商 (ISV) 也在不斷增加,包括 Applause、Couchbase、Honeycomb、IBM Instana Observability、Verve 和 Viant 等知名企業(yè)。Arm Software Ecosystem Dashboard 可以讓開發(fā)者更易了解適用于 Neoverse 平臺的主要開源和商用軟件的可用版本和推薦版本。并在其軟件開發(fā)的伊始,便能確保軟件的兼容性和平穩(wěn)運行。

這些資源使有興趣采用或遷移到基于 Axion 的 C4A 虛擬機(jī)的開發(fā)者能夠獲得 Arm 的社區(qū)支持,例如專為遷移而設(shè)的 GitHub 代碼倉庫等。Arm 的云遷移專家還可提供直接的工程協(xié)助和個性化支持,尤其是對于企業(yè)級遷移,以便助力遷移項目順利且成功的過渡到基于 Axion 的解決方案。

寫在最后

Google Cloud 推出 Axion 處理器意在為客戶提供更多樣化、更高性能的計算選擇。得益于 Arm 架構(gòu)和 Google 的定制芯片設(shè)計,Axion 可為從高要求的 AI 推理和 HPC 應(yīng)用到通用和云原生服務(wù)等各種工作負(fù)載提供卓越性能和效率,通過與 Arm 的云遷移資源和強(qiáng)大的軟件生態(tài)系統(tǒng)相結(jié)合,全方位賦能開發(fā)者在 Arm 平臺上構(gòu)建計算的未來!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20339

    瀏覽量

    255346
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1816

    瀏覽量

    60650
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41315

    瀏覽量

    302691
  • Cloud
    +關(guān)注

    關(guān)注

    0

    文章

    76

    瀏覽量

    6052

原文標(biāo)題:解密 Google Axion:為 AI 時代而生的 Arm 架構(gòu)定制處理器

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    uM-FPU V2 浮點協(xié)處理器:功能特性與應(yīng)用指南

    uM-FPU V2 浮點協(xié)處理器:功能特性與應(yīng)用指南 引言 在電子設(shè)計領(lǐng)域,浮點運算能力對于許多應(yīng)用至關(guān)重要。Micromega Corporation 的 uM-FPU V2 浮點協(xié)處理器
    的頭像 發(fā)表于 04-11 15:15 ?494次閱讀

    AA Boost Module V2:便捷的電源解決方案

    AA Boost Module V2:便捷的電源解決方案 在電子設(shè)計中,電源供應(yīng)是一個關(guān)鍵問題。今天要給大家介紹的是DFRobot的獨家產(chǎn)品——AA Boost Module V2(SKU
    的頭像 發(fā)表于 03-27 12:50 ?230次閱讀

    RDMA設(shè)計44:RoCE v2原語功能驗證與分析

    它是RoCE v2協(xié)議進(jìn)行信息及數(shù)據(jù)交換的核心機(jī)制,也是DUT需要實現(xiàn)的核心機(jī)制之一,對該功能的仿真驗證需要考慮指令的提交數(shù)據(jù)包的組裝及發(fā)送、數(shù)據(jù)的DMA處理等。
    的頭像 發(fā)表于 02-25 09:26 ?337次閱讀
    RDMA設(shè)計44:RoCE <b class='flag-5'>v2</b>原語功能驗證與分析

    如何在Arm Neoverse N2平臺上提升llama.cpp擴(kuò)展性能

    跨 NUMA 內(nèi)存訪問可能會限制 llama.cpp 在 Arm Neoverse 平臺上的擴(kuò)展能力。本文將為你詳細(xì)分析這一問題,并通過引入原型驗證補(bǔ)丁來加以解決。測試結(jié)果表明,在基于 Neo
    的頭像 發(fā)表于 02-11 10:06 ?332次閱讀

    RDMA設(shè)計37:RoCE v2 子系統(tǒng)模型設(shè)計

    子系統(tǒng)模型并將其整合到驗證平臺中,使得 RoCE v2 高速數(shù)據(jù)傳輸系統(tǒng)能夠進(jìn)行復(fù)雜網(wǎng)絡(luò)環(huán)境下的仿真驗證。RoCE v2 子系統(tǒng)模型包含兩個 AXIS 總線接口、一個虛擬內(nèi)存管理、
    發(fā)表于 02-06 16:19

    RDMA設(shè)計29:RoCE v2 發(fā)送及接收模塊設(shè)計2

    的數(shù)據(jù)。 由于請求生成單元和應(yīng)答生成單元并不是所有時刻都需要與 DMA 控制進(jìn)行數(shù)據(jù)交互,所以這里使用兩個狀態(tài)機(jī)分別控制請求生成和應(yīng)答生成流程,以此來提高系統(tǒng)工作效率、降低響應(yīng)延遲。RoCE v2 發(fā)送
    發(fā)表于 01-26 16:47

    RDMA設(shè)計28:RoCE v2 發(fā)送及接收模塊設(shè)計

    較慢、延遲相對較高。因此在RoCE v2 發(fā)送及接收模塊中,SEND 單元只用于進(jìn)行主機(jī)間的信息參數(shù)交換,不直接涉及大批量的數(shù)據(jù)傳輸操作,可以在一定程度上降低傳輸延遲、增加數(shù)據(jù)吞吐量。而DMA 控制在其
    發(fā)表于 01-25 10:45

    RDMA設(shè)計19:RoCE v2 發(fā)送及接收模塊設(shè)計

    較慢、延遲相對較高。因此在RoCE v2 發(fā)送及接收模塊中,SEND 單元只用于進(jìn)行主機(jī)間的信息參數(shù)交換,不直接涉及大批量的數(shù)據(jù)傳輸操作,可以在一定程度上降低傳輸延遲、增加數(shù)據(jù)吞吐量。而DMA 控制在其
    發(fā)表于 01-06 08:08

    Arm Neoverse平臺賦能新一代Google Axion實例

    從推薦引擎到語言模型,人工智能 (AI) 正在重塑各類應(yīng)用,但其背后潛藏著一項迫切的挑戰(zhàn):能效問題。隨著 AI 應(yīng)用規(guī)模擴(kuò)大,其運行所需的能耗也隨之增長,進(jìn)而為云基礎(chǔ)設(shè)施帶來了日益嚴(yán)峻的壓力,尤其是在融合 AI 數(shù)據(jù)中心,傳統(tǒng)工作負(fù)載與 AI 工作負(fù)載已是并行運行。
    的頭像 發(fā)表于 12-31 15:51 ?1832次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b><b class='flag-5'>平臺</b>賦能新一代<b class='flag-5'>Google</b> <b class='flag-5'>Axion</b>實例

    Arm Neoverse平臺集成NVIDIA NVLink Fusion

    生態(tài)系統(tǒng),實現(xiàn)全緩存一致性與高帶寬互連。 隨著 AI 數(shù)據(jù)中心對 Arm Neoverse 的需求持續(xù)增長,客戶在將工作負(fù)載加速連接至 Arm
    的頭像 發(fā)表于 11-26 11:08 ?588次閱讀

    思爾芯原型驗證系統(tǒng)助力昆明湖V2成功啟動GUI OpenEuler

    近日,開芯院團(tuán)隊同思爾芯(S2C)在新一代原型驗證系統(tǒng)S8-100上成功完成對雙核RISC-V處理器“昆明湖V2”的關(guān)鍵系統(tǒng)驗證工作。在驗證過程中,“昆明湖
    的頭像 發(fā)表于 11-19 11:10 ?962次閱讀
    思爾芯原型驗證系統(tǒng)助力昆明湖<b class='flag-5'>V2</b>成功啟動GUI OpenEuler

    ?Microchip SAM-IoT Wx v2開發(fā)板技術(shù)解析與應(yīng)用指南

    Microchip Technology EV62V87A SAM-IoT WX v2開發(fā)板是一款易于擴(kuò)展的小型硬件平臺,用于評估和開發(fā)物聯(lián)網(wǎng)解決方案。該開發(fā)板設(shè)有基于ATSAMD21G18
    的頭像 發(fā)表于 10-10 10:25 ?938次閱讀
    ?Microchip SAM-IoT Wx <b class='flag-5'>v2</b>開發(fā)板技術(shù)解析與應(yīng)用指南

    Arm Neoverse N2平臺實現(xiàn)DeepSeek-R1滿血版部署

    頗具優(yōu)勢。Arm 攜手合作伙伴,在 Arm Neoverse N2 平臺上使用開源推理框架 llama.cpp 實現(xiàn) DeepSeek-R1
    的頭像 發(fā)表于 07-03 14:37 ?1454次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> N<b class='flag-5'>2</b><b class='flag-5'>平臺</b>實現(xiàn)DeepSeek-R1滿血版部署

    龍芯處理器支持WINDOWS嗎?

    龍芯處理器目前不支持原生運行Windows操作系統(tǒng),主要原因如下: 架構(gòu)差異 龍芯架構(gòu):龍芯早期基于MIPS架構(gòu),后續(xù)轉(zhuǎn)向自主研發(fā)的LoongArch指令集(與x86/ARM不兼容
    發(fā)表于 06-05 14:24

    ARM Mali GPU 深度解讀

    ARM Mali GPU 深度解讀 ARM Mali 是 Arm 公司面向移動設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場設(shè)計的圖形處理器(GPU)IP
    的頭像 發(fā)表于 05-29 10:12 ?4992次閱讀
    金川县| 林口县| 汉阴县| 上栗县| 湾仔区| 余江县| 湖南省| 上栗县| 贡山| 澄迈县| 鹿邑县| 张家港市| 滨州市| 昌图县| 清镇市| 武隆县| 汕尾市| 界首市| 孟津县| 达州市| 龙岩市| 吉木萨尔县| 永登县| 贡觉县| 永春县| 修文县| 道真| 府谷县| 油尖旺区| 哈尔滨市| 汝南县| 康马县| 丹寨县| 沾益县| 浑源县| 临澧县| 邹平县| 稻城县| 大邑县| 浪卡子县| 永川市|