日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm推動(dòng)生成式AI落地邊緣!全新Ethos-U85 AI加速器支持Transformer 架構(gòu),性能提升四倍

晶芯觀察 ? 來(lái)源:電子發(fā)燒友 ? 作者:黃晶晶 ? 2024-04-16 09:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)在嵌入式領(lǐng)域,邊緣與端側(cè)AI推理需求不斷增長(zhǎng),Arm既有Helium 技術(shù)使 CPU 能夠執(zhí)行更多計(jì)算密集型的 AI 推理算法,也有Ethos 系列 AI 加速器,以滿(mǎn)足更高性能和更復(fù)雜的 AI 工作負(fù)載。Ethos-U NPU系列是業(yè)界首款 AI 微加速器,英飛凌、恩智浦半導(dǎo)體、奇景光電 (Himax)、Alif Semiconductor 和 Synaptics 等領(lǐng)先企業(yè)均已推出搭載 Ethos-U 的量產(chǎn)芯片。最近,Arm發(fā)布Arm Ethos-U85 AI加速器,這款加速器在性能、算力、應(yīng)用場(chǎng)景方面進(jìn)一步拓展,著眼于未來(lái)幾年的邊緣AI的應(yīng)用所需。

全新Arm Ethos-U85 AI加速器

與上一代產(chǎn)品相比,Ethos-U85 性能提升四倍,能效提高 20%,它支持MAC 單元從 128 個(gè)擴(kuò)展到 2048 個(gè)(在 1GHz 時(shí),算力實(shí)現(xiàn) 4 TOPs)。Ethos-U85 提供了相同的一致工具鏈,實(shí)現(xiàn)無(wú)縫的開(kāi)發(fā)者體驗(yàn)。全新 Ethos-U85 NPU 支持TensorFlow Lite 和 PyTorch 等 AI 框架。Ethos-U85可滿(mǎn)足于智能家居、零售、工業(yè)等新興的邊緣 AI 場(chǎng)景對(duì)更高性能計(jì)算的需求。

wKgZomYclwuAXCUGAAKIwINsqQs457.png
圖:Arm Ethos-U85 提供卓越的神經(jīng)網(wǎng)絡(luò)加速功能


Ethos-U85支持Transformer 架構(gòu)和卷積神經(jīng)網(wǎng)絡(luò) (CNN) 以實(shí)現(xiàn) AI 推理。Arm 物聯(lián)網(wǎng)事業(yè)部業(yè)務(wù)拓展副總裁馬健Chloe Ma分析,Ethos-U85 不僅僅提供卷積神經(jīng)網(wǎng)絡(luò) (CNN) 所需的權(quán)重矩陣乘的運(yùn)算,還支持矩陣相乘,這是 Transformer 架構(gòu)網(wǎng)絡(luò)的一個(gè)基本組成部分。Ethos-U85 增加對(duì)Transformer 架構(gòu)網(wǎng)絡(luò)的支持,這是優(yōu)化大模型邊緣落地微調(diào)時(shí)間、提升模型泛化的一個(gè)關(guān)鍵特性。

馬健表示:“基于 Transformer 的模型具有優(yōu)異的泛化功能,它將更快地驅(qū)動(dòng)新 AI 應(yīng)用的發(fā)展。Transformer 在視覺(jué)和生成式 AI 用例中,比如視頻理解、圖文結(jié)合,圖像增強(qiáng)與生成、圖像分類(lèi)和目標(biāo)檢測(cè)等方面都極有價(jià)值。Transformer 架構(gòu)網(wǎng)絡(luò)的注意力機(jī)制容易利用并行計(jì)算來(lái)實(shí)現(xiàn),提高硬件使用效率,使得這些模型能夠部署在計(jì)算資源有限的邊緣設(shè)備上。開(kāi)發(fā)者可以通過(guò)選用針對(duì) Transformer 架構(gòu)網(wǎng)絡(luò)優(yōu)化的設(shè)計(jì),發(fā)掘邊緣 AI 的新機(jī)遇,使這些應(yīng)用享有更快的推理、更優(yōu)化的模型性能和可擴(kuò)展性。”

Ethos-U85 不僅支持低功耗MCU的AI加速。在高性能邊緣計(jì)算系統(tǒng)中,Ethos-U85與Armv9 Cortex-A CPU相結(jié)合,為基于應(yīng)用處理器的智能物聯(lián)網(wǎng)平臺(tái)上運(yùn)行的AI任務(wù)實(shí)現(xiàn)加速。這將使 Ethos-U85 能夠在工業(yè)機(jī)器視覺(jué)、邊緣網(wǎng)關(guān)、可穿戴設(shè)備和消費(fèi)類(lèi)機(jī)器人等應(yīng)用中,帶來(lái)高效能的邊緣推理。

全新Arm Corstone-320智能物聯(lián)網(wǎng)參考設(shè)計(jì)平臺(tái)

Corstone-320 包含了 Cortex-M 系列最高性能的嵌入式處理器 Cortex-M85,Ethos-U85 NPU AI 加速器以及Arm Mali-C55 ISP等,以實(shí)現(xiàn)為視覺(jué)應(yīng)用優(yōu)化的低功耗系統(tǒng)。與此前推出的Arm物聯(lián)網(wǎng)參考設(shè)計(jì)一致,Corstone-320 不僅僅提供芯片計(jì)算子系統(tǒng) IP 組合,還附帶了軟件、AI 模型庫(kù)和開(kāi)發(fā)工具,以實(shí)現(xiàn)軟件的復(fù)用,同時(shí)也利用了 Arm 強(qiáng)大的生態(tài)系統(tǒng)。它還附帶了仿真 Corstone-320 完整系統(tǒng)的 Arm 虛擬硬件,以及單獨(dú)的 CPU 和 NPU 的固定虛擬平臺(tái) (FVP) 模型,以簡(jiǎn)化開(kāi)發(fā)并加速產(chǎn)品設(shè)計(jì),支持軟硬件并行協(xié)同開(kāi)發(fā)。這種提供邊緣 AI 和智能物聯(lián)網(wǎng)計(jì)算子系統(tǒng)全套軟硬件和工具鏈的方法,使得合作伙伴能夠在一系列性能點(diǎn)上快速開(kāi)發(fā),并聚焦于打造差異化價(jià)值。

wKgZomYclyuAcbh3AAE7eIyZSLw925.png
圖:Arm 助力加速邊緣 AI 設(shè)備部署進(jìn)程


馬健介紹,全新的參考設(shè)計(jì)是針對(duì)實(shí)際工作負(fù)載開(kāi)發(fā)的,參考用例包括部署在智能家居中的電池供電攝像系統(tǒng),以及在工業(yè)和零售系統(tǒng)中的低幀率網(wǎng)絡(luò)攝像頭。同時(shí),Corstone-320 參考設(shè)計(jì)提供了有安全保證的軟硬件組合,使得在此參考設(shè)計(jì)基礎(chǔ)上開(kāi)發(fā)的合作伙伴們能夠順利地通過(guò) PSA Certified Level 2 認(rèn)證,實(shí)現(xiàn)對(duì)區(qū)域和全球安全標(biāo)準(zhǔn)的合規(guī)。總之,通過(guò) Corstone-320 預(yù)先集成、預(yù)先驗(yàn)證的參考設(shè)計(jì)模版,Arm 能幫助合作伙伴減少邊緣智能芯片開(kāi)發(fā)的成本和時(shí)間。

基于 Arm 平臺(tái)的 AI 軟件生態(tài)系統(tǒng)

“只有 Arm 計(jì)算平臺(tái)才能提供 AI 從云到端、現(xiàn)代敏捷開(kāi)發(fā)和部署流程中所需的特性和功能,實(shí)現(xiàn)基于量產(chǎn)驗(yàn)證的一致架構(gòu),并采用統(tǒng)一工具鏈完成AI 轉(zhuǎn)型。”馬健說(shuō)道。實(shí)際上,一致性的工具鏈和平臺(tái)對(duì)于開(kāi)發(fā)者而言非常重要,尤其是面對(duì)物聯(lián)網(wǎng)碎片化,加上AI功能引入的復(fù)雜性,如果缺少一個(gè)良好的生態(tài)、工具支持,將耗費(fèi)開(kāi)發(fā)者大量的開(kāi)發(fā)時(shí)間。

隨著邊緣 AI 的持續(xù)擴(kuò)展,簡(jiǎn)單易用才更適于普及推廣,因此物聯(lián)網(wǎng)生態(tài)鏈上下游的芯片與系統(tǒng)供應(yīng)商、算法軟件開(kāi)發(fā)者與集成商們匯聚在Arm計(jì)算平臺(tái)。目前,包括開(kāi)發(fā)者、數(shù)據(jù)科學(xué)家、學(xué)術(shù)界在內(nèi)的 AI 研究開(kāi)發(fā)社區(qū),不僅持續(xù)受益于 Arm 生態(tài)系統(tǒng)與合作伙伴提供的豐富信息與知識(shí),也圍繞 Arm 計(jì)算平臺(tái)構(gòu)建日益增長(zhǎng)的軟件和工具生態(tài)系統(tǒng),以及開(kāi)源軟件庫(kù)和 AI 框架,以更簡(jiǎn)化的開(kāi)發(fā)流程,擴(kuò)展邊緣 AI 的部署。

wKgZomYclzqAGsH9AAFhwlxkXtU102.png
圖:基于 Arm 平臺(tái)的 AI 軟件生態(tài)系統(tǒng)

馬健舉例說(shuō):“大家熟知的 PyTorch 開(kāi)源 ML 框架,廣泛用于構(gòu)建和訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,而我們也很高興看到 PyTorch 基金會(huì)投資邊緣 AI,發(fā)布針對(duì)移動(dòng)和邊緣設(shè)備推理工具包 ExecuTorch,提供了輕量級(jí)運(yùn)行時(shí) (Runtime) 和算子注冊(cè)表,覆蓋了PyTorch生態(tài)系統(tǒng)中的各類(lèi)模型。此外,由于 Arm 特有的 IP 授權(quán)許可模式和開(kāi)放生態(tài),OEM 和 ODM 可以有多種基于 Arm 架構(gòu)和計(jì)算平臺(tái)的芯片與模組選擇,更靈活地開(kāi)發(fā)適于最終應(yīng)用的系統(tǒng)方案?!?br />
小結(jié):

隨著邊緣 AI 的持續(xù)發(fā)展,Arm 始終處于推動(dòng)市場(chǎng)和技術(shù)進(jìn)步的核心地位,從 Cortex-M 嵌入式處理器的 Helium 矢量增強(qiáng)指令集,到 Cortex-A 應(yīng)用處理器的 SVE、SVE2、SME 對(duì)矢量和矩陣運(yùn)算的優(yōu)化,再到 Ethos-U AI 加速器,Arm 不斷豐富產(chǎn)品線并拉高性能。

馬健表示,Arm 不會(huì)止步于此。隨著大模型持續(xù)通過(guò)量化、剪枝和聚類(lèi)技術(shù)來(lái)縮減優(yōu)化模型,使大模型適于在邊緣和超級(jí)終端設(shè)備部署,Arm認(rèn)為大小模型云邊端結(jié)合成為未來(lái) AI 產(chǎn)品的重要發(fā)展趨勢(shì),也是 AI 應(yīng)用賦能行業(yè)發(fā)展的重要方向。而 Arm 已經(jīng)為此做好準(zhǔn)備,來(lái)挑戰(zhàn)物聯(lián)網(wǎng)與大模型、多模態(tài) AI 結(jié)合的性能與效率極限。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9589

    瀏覽量

    393804
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41323

    瀏覽量

    302703
  • AI加速器
    +關(guān)注

    關(guān)注

    1

    文章

    73

    瀏覽量

    9543
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    HM博學(xué)谷狂野AI大模型第

    ,為開(kāi)發(fā)者提供了一把打開(kāi) AI 黑盒的鑰匙。從 Transformer 的矩陣運(yùn)算到分布訓(xùn)練的工程調(diào)度,再到推理加速的極致優(yōu)化,這是一次從應(yīng)用層向底層原理的深度回歸。在
    發(fā)表于 05-01 17:30

    嵌入AI開(kāi)發(fā)必看:杜絕幻覺(jué),才是工業(yè)級(jí)IDE的核心底氣

    AI浪潮正在重塑嵌入開(kāi)發(fā)范式,代碼生成效率大幅提升的同時(shí),“AI幻覺(jué)”問(wèn)題卻成為工業(yè)場(chǎng)景落地
    發(fā)表于 03-18 13:49

    邊緣AI算力臨界點(diǎn):深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價(jià)值

    310P芯片的底層架構(gòu),深度剖析這款產(chǎn)品的技術(shù)細(xì)節(jié)、算力門(mén)檻及其在實(shí)際產(chǎn)業(yè)落地中的真實(shí)價(jià)值。 一、176TOPS的產(chǎn)業(yè)門(mén)檻:為何這是邊緣算力的新起點(diǎn)? AI硬件的核心指標(biāo)始終是算力,但
    發(fā)表于 03-10 14:19

    使用NORDIC AI的好處

    ; 自定義 Neuton 模型博客] Axon NPU :集成在 nRF54LM20B 等高端 SoC 中的專(zhuān)用 AI 加速器,對(duì) TensorFlow Lite 模型可實(shí)現(xiàn)最高約 15× 推理加速、顯著
    發(fā)表于 01-31 23:16

    重磅合作!Quintauris 聯(lián)手 SiFive,加速 RISC-V 在嵌入AI 領(lǐng)域落地

    (ADAS); 嵌入平臺(tái)的 AI 與機(jī)器學(xué)習(xí)加速器; 工業(yè)物聯(lián)網(wǎng)與自動(dòng)化系統(tǒng)(開(kāi)放標(biāo)準(zhǔn)架構(gòu)的優(yōu)勢(shì)能充分發(fā)揮)。 對(duì)咱們開(kāi)發(fā)者來(lái)說(shuō),這波合作最大的好處就是能拿到集成
    發(fā)表于 12-18 12:01

    邊緣計(jì)算中的AI加速器類(lèi)型與應(yīng)用

    提升AI應(yīng)用的性能。在邊緣計(jì)算中,有多種類(lèi)型的AI加速器,各自具有不同的優(yōu)勢(shì)、局限性和適用場(chǎng)景。
    的頭像 發(fā)表于 11-06 13:42 ?1034次閱讀
    <b class='flag-5'>邊緣</b>計(jì)算中的<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>類(lèi)型與應(yīng)用

    Alif Semiconductor的Ensemble MCU新增對(duì)ExecuTorch Runtime的支持,助力其推動(dòng)邊緣生成AI發(fā)展

    ·?Ensemble E4/E6/E8是業(yè)界首個(gè)為Transformer網(wǎng)絡(luò)提供硬件加速的MCU系列,可在邊緣設(shè)備及終端設(shè)備上實(shí)現(xiàn)本地生成
    的頭像 發(fā)表于 11-04 11:44 ?1903次閱讀
    Alif Semiconductor的Ensemble MCU新增對(duì)ExecuTorch Runtime的<b class='flag-5'>支持</b>,助力其<b class='flag-5'>推動(dòng)</b><b class='flag-5'>邊緣</b><b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>發(fā)展

    通過(guò)NVIDIA Jetson AGX Thor實(shí)現(xiàn)7倍生成AI性能

    Jetson Thor 平臺(tái)還支持多種主流量化格式,包括 NVIDIA Blackwell GPU 架構(gòu)的新 NVFP4 格式,有助于進(jìn)一步優(yōu)化推理性能。該平臺(tái)同時(shí)支持推測(cè)解碼等新技術(shù)
    的頭像 發(fā)表于 10-29 16:53 ?1691次閱讀

    BPI-AIM7 RK3588 AI與 Nvidia Jetson Nano 生態(tài)系統(tǒng)兼容的低功耗 AI 模塊

    RK3588 提供支持,其性能優(yōu)于 Jetson Nano: 更快的 CPU,性能提升四倍 充足的 LPDDR4X 內(nèi)存,比 Jetson
    發(fā)表于 10-11 09:08

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+第二章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    乘法的新型架構(gòu) 基于Transformer模型的高性能FPGA加速器。 4.2基于常微分方程的加速 5、基于ASIC的大模型計(jì)算 5.1 S
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    Transformer引擎③NVLink Switch系統(tǒng)④機(jī)密計(jì)算⑤HBM FPGA: 架構(gòu)的主要特點(diǎn):可重構(gòu)邏輯和路由,可以快速實(shí)現(xiàn)各種不同形式的神經(jīng)網(wǎng)絡(luò)加速。 ASIC: 介紹了幾種ASIC
    發(fā)表于 09-12 16:07

    Arm神經(jīng)技術(shù)是業(yè)界首創(chuàng)在 Arm GPU 上增添專(zhuān)用神經(jīng)加速器的技術(shù),移動(dòng)設(shè)備上實(shí)現(xiàn)PC級(jí)別的AI圖形性能

    Arm 神經(jīng)技術(shù)是業(yè)界首創(chuàng)在 Arm GPU 上增添專(zhuān)用神經(jīng)加速器的技術(shù),首次在移動(dòng)設(shè)備上實(shí)現(xiàn) PC 級(jí)別的 AI 圖形性能,為未來(lái)的端側(cè)
    的頭像 發(fā)表于 08-14 17:59 ?2949次閱讀

    Alif Semiconductor發(fā)布支持生成AI的MCU基準(zhǔn)測(cè)試結(jié)果,鞏固其在邊緣AI領(lǐng)域的領(lǐng)先地位

    ·?Ensemble E4/E6/E8 MCU和融合處理搭載領(lǐng)先的邊緣AI加速器——Arm Ethos
    的頭像 發(fā)表于 08-13 15:39 ?2.2w次閱讀
    Alif Semiconductor發(fā)布<b class='flag-5'>支持</b><b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>的MCU基準(zhǔn)測(cè)試結(jié)果,鞏固其在<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>領(lǐng)域的領(lǐng)先地位

    Arm 洞察與思考:為什么 AI邊緣遷移的速度超乎想象

    人工智能 (AI) 正在以驚人的速度發(fā)展。企業(yè)不再僅僅是探索 AI,而是積極推動(dòng) AI 的規(guī)?;?b class='flag-5'>落地,從實(shí)驗(yàn)性應(yīng)用轉(zhuǎn)向?qū)嶋H部署。隨著
    的頭像 發(fā)表于 08-11 14:43 ?15.3w次閱讀

    【書(shū)籍評(píng)測(cè)活動(dòng)NO.64】AI芯片,從過(guò)去走向未來(lái):《AI芯片:科技探索與AGI愿景》

    RISC-V架構(gòu)AI加速器、量子AI芯片、光電組合AI芯片等。 隨著大模型面臨收益遞減、資源浪費(fèi)等困境,書(shū)中接著將目光投向 “后
    發(fā)表于 07-28 13:54
    龙江县| 清丰县| 毕节市| 大余县| 阆中市| 阿荣旗| 阜新市| 淮安市| 靖边县| 南澳县| 黄浦区| 新巴尔虎左旗| 长岭县| 章丘市| 绥中县| 南皮县| 珠海市| 定西市| 根河市| 清丰县| 蒲城县| 平遥县| 建宁县| 桐柏县| 封开县| 罗江县| 特克斯县| 桃源县| 东兴市| 贡山| 靖州| 工布江达县| 泗水县| 吉安县| 邵阳县| 武义县| 宜良县| 洪雅县| 安平县| 茶陵县| 龙海市|