日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm與ExecuTorch合作加速端側(cè)生成式AI實(shí)現(xiàn)

Arm社區(qū) ? 來(lái)源:Arm社區(qū) ? 2024-11-15 11:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 戰(zhàn)略與生態(tài)部人工智能開(kāi)發(fā)者平臺(tái)與服務(wù)高級(jí)副總裁 Alex Spinelli

通過(guò) Arm 計(jì)算平臺(tái)與 ExecuTorch 框架的結(jié)合,使得更小、更優(yōu)化的模型能夠在邊緣側(cè)運(yùn)行,加速邊緣側(cè)生成式 AI 的實(shí)現(xiàn)。

新的 Llama 量化模型適用于基于 Arm 平臺(tái)的端側(cè)和邊緣側(cè) AI 應(yīng)用,可減少內(nèi)存占用,提高精度、性能和可移植性。

全球 2,000 萬(wàn)名 Arm 開(kāi)發(fā)者能夠更迅速地在數(shù)十億臺(tái)邊緣側(cè)設(shè)備上大規(guī)模開(kāi)發(fā)和部署更多的智能 AI 應(yīng)用。

Arm 正在與 Meta 公司的 PyTorch 團(tuán)隊(duì)攜手合作,共同推進(jìn)新的 ExecuTorch 測(cè)試版 (Beta) 上線(xiàn),旨在為全球數(shù)十億邊緣側(cè)設(shè)備和數(shù)百萬(wàn)開(kāi)發(fā)者提供人工智能 (AI) 和機(jī)器學(xué)習(xí) (ML) 功能,進(jìn)而確保 AI 真正的潛力能被最廣泛的設(shè)備和開(kāi)發(fā)者所使用。

借助 ExecuTorch 和新的 Llama 量化模型,Arm 計(jì)算平臺(tái)優(yōu)化生成式 AI 性能

Arm 計(jì)算平臺(tái)無(wú)處不在,為全球眾多邊緣側(cè)設(shè)備提供支持,而 ExecuTorch 則是專(zhuān)為移動(dòng)和邊緣側(cè)設(shè)備部署 AI 模型而設(shè)計(jì)的 PyTorch 原生部署框架。兩者的緊密合作,使開(kāi)發(fā)者能夠賦能更小、更優(yōu)化的模型,包括新的 Llama 3.2 1B 和 3B 量化模型。這些新模型可以減少內(nèi)存占用、提高準(zhǔn)確性、增強(qiáng)性能和提供可移植性,成為小型設(shè)備上的生成式 AI 應(yīng)用的理想選擇,如虛擬聊天機(jī)器人、文本摘要和 AI 助手。

開(kāi)發(fā)者無(wú)需額外的修改或優(yōu)化,便可將新的量化模型無(wú)縫集成到應(yīng)用中,從而節(jié)省時(shí)間和資源。如此一來(lái),他們能夠迅速在廣泛的 Arm 設(shè)備上大規(guī)模開(kāi)發(fā)和部署更多的智能 AI 應(yīng)用。

隨著 Llama 3.2 大語(yǔ)言模型 (LLM) 新版本的發(fā)布,Arm 正在通過(guò) ExecuTorch 框架優(yōu)化 AI 性能,使得在 Arm 計(jì)算平臺(tái)邊緣設(shè)備運(yùn)行的真實(shí)生成式 AI 工作負(fù)載能更為快速。在 ExecuTorch 測(cè)試版發(fā)布的首日起,開(kāi)發(fā)者便能享有這些性能的提升。

集成 KleidiAI,加速端側(cè)生成式 AI 的實(shí)現(xiàn)

在移動(dòng)領(lǐng)域,Arm 與 ExecuTorch 的合作意味著眾多生成式 AI 應(yīng)用,如虛擬聊天機(jī)器人、文本生成和摘要、實(shí)時(shí)語(yǔ)音和虛擬助手等,完全能夠在搭載 Arm CPU 的設(shè)備上以更高的性能運(yùn)行。這一成果得益于 KleidiAI,它引入了針對(duì) 4 位量化優(yōu)化的微內(nèi)核,并通過(guò) XNNPACK 集成到了 ExecuTorch 中,因此,在 Arm 計(jì)算平臺(tái)上運(yùn)行 4 位量化的 LLM 時(shí),無(wú)縫加速 AI 工作負(fù)載的執(zhí)行。例如,通過(guò) KleidiAI 的集成,Llama 3.2 1B 量化模型預(yù)填充階段的執(zhí)行速度可以提高 20%,使得一些基于 Arm 架構(gòu)的移動(dòng)設(shè)備上的文本生成速度超過(guò)了每秒 400 個(gè)詞元 (token)。這意味著,終端用戶(hù)將從他們移動(dòng)設(shè)備上獲得更快速、響應(yīng)更靈敏的 AI 體驗(yàn)。

物聯(lián)網(wǎng)的邊緣側(cè) AI 應(yīng)用加速實(shí)時(shí)處理能力

在物聯(lián)網(wǎng)領(lǐng)域,ExecuTorch 將提高邊緣側(cè) AI 應(yīng)用的實(shí)時(shí)處理能力,包括智能家電、可穿戴設(shè)備以及自動(dòng)零售系統(tǒng)等。這意味著物聯(lián)網(wǎng)設(shè)備和應(yīng)用能夠以毫秒級(jí)的速度響應(yīng)環(huán)境變化,這對(duì)保障安全性和功能可用性至關(guān)重要。

ExecuTorch 可在 Arm Cortex-A CPU 和 Ethos-U NPU 上運(yùn)行,以加速邊緣側(cè) AI 應(yīng)用的開(kāi)發(fā)和部署。事實(shí)上,通過(guò)將 ExecuTorch 與 Arm Corstone-320 參考平臺(tái)(也可作為仿真固定虛擬平臺(tái) (FVP) 使用)、Arm Ethos-U85 NPU 驅(qū)動(dòng)程序和編譯器支持集成到一個(gè)軟件包中,開(kāi)發(fā)者可在平臺(tái)上市前幾個(gè)月就著手開(kāi)發(fā)邊緣側(cè) AI 應(yīng)用。

更易獲取、更快捷的邊緣側(cè) AI 開(kāi)發(fā)體驗(yàn)

ExecuTorch 有潛力成為全球最受歡迎的高效 AI 和 ML 開(kāi)發(fā)框架之一。通過(guò)將應(yīng)用最廣泛的 Arm 計(jì)算平臺(tái)與 ExecuTorch 相結(jié)合,Arm 正在通過(guò)新的量化模型加速 AI 的普及,讓開(kāi)發(fā)者能夠更快地在更多設(shè)備上部署應(yīng)用,并將更多生成式 AI 體驗(yàn)引入邊緣側(cè)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9589

    瀏覽量

    393796
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41315

    瀏覽量

    302694
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50366

    瀏覽量

    267056

原文標(biāo)題:ExecuTorch 測(cè)試版上線(xiàn),加速 Arm 平臺(tái)邊緣側(cè)生成式 AI 發(fā)展

文章出處:【微信號(hào):Arm社區(qū),微信公眾號(hào):Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    面壁智能與安波福達(dá)成戰(zhàn)略合作,側(cè)AI座艙方案走向全球市場(chǎng)

    的適配部署、車(chē)載AI Agent聯(lián)合方案開(kāi)發(fā)、AI Box產(chǎn)品設(shè)計(jì)與推廣等方向展開(kāi)深度合作,并逐步將合作范圍從安波福中國(guó)拓展至安波福全球業(yè)務(wù)體系。 ? 無(wú)論是中國(guó)車(chē)企
    的頭像 發(fā)表于 04-30 11:55 ?69次閱讀
    面壁智能與安波福達(dá)成戰(zhàn)略<b class='flag-5'>合作</b>,<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>座艙方案走向全球市場(chǎng)

    Arm與Google攜手共筑側(cè)AI未來(lái)

    如今,全球數(shù)十億智能手機(jī)用戶(hù)已將實(shí)時(shí)輔助、流暢溝通與高度個(gè)性化視為基礎(chǔ)體驗(yàn)。在智能手機(jī)的功耗限制下實(shí)現(xiàn)高性能側(cè)人工智能 (AI),對(duì)規(guī)?;峁┘磿r(shí)智能體驗(yàn)、釋放
    的頭像 發(fā)表于 04-21 14:39 ?341次閱讀

    AI應(yīng)用時(shí)代,江波龍集成存儲(chǔ)如何為側(cè)AI創(chuàng)造價(jià)值?

    AI快速發(fā)展的現(xiàn)狀和趨勢(shì)對(duì)存儲(chǔ)生態(tài)和產(chǎn)業(yè)鏈帶來(lái)顛覆重構(gòu),存儲(chǔ)原廠將資源專(zhuān)注到AI云端市場(chǎng),消費(fèi)類(lèi)電子市場(chǎng)出現(xiàn)買(mǎi)不到、用不起的經(jīng)營(yíng)壓力。隨著云端AI建設(shè),
    的頭像 發(fā)表于 03-23 15:19 ?481次閱讀
    <b class='flag-5'>AI</b>應(yīng)用時(shí)代,江波龍集成存儲(chǔ)如何為<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>創(chuàng)造價(jià)值?

    富瀚微推動(dòng)OpenClaw實(shí)現(xiàn)側(cè)本地運(yùn)行驗(yàn)證

    隨著生成人工智能持續(xù)突破,AI正從“內(nèi)容生成工具”向具備自主執(zhí)行能力的智能體形態(tài)加速演進(jìn)。在這一背景下,
    的頭像 發(fā)表于 03-17 17:27 ?1080次閱讀
    富瀚微推動(dòng)OpenClaw<b class='flag-5'>實(shí)現(xiàn)</b><b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>本地運(yùn)行驗(yàn)證

    TECNO與Arm攜手推動(dòng)移動(dòng)實(shí)時(shí)生成AI

    Arm 始終堅(jiān)信,人工智能 (AI) 及其所帶來(lái)的價(jià)值,理應(yīng)惠及更廣泛的人群。這一理念正引領(lǐng) AI 邁入全新發(fā)展階段 —— 更具個(gè)性化、即時(shí)可用,并越來(lái)越多地在
    的頭像 發(fā)表于 03-11 10:31 ?481次閱讀

    利用ExecuTorchArm SME2加速側(cè)機(jī)器學(xué)習(xí)推理

    貼紙、分離主體以替換背景,或是對(duì)圖像局部進(jìn)行選擇性增強(qiáng)。這些效果背后,是輕量級(jí)分割模型在運(yùn)行,這些模型通過(guò) ExecuTorch(PyTorch 的開(kāi)源側(cè)推理運(yùn)行時(shí))以及第二代 Arm
    的頭像 發(fā)表于 03-03 10:27 ?738次閱讀
    利用<b class='flag-5'>ExecuTorch</b>和<b class='flag-5'>Arm</b> SME2<b class='flag-5'>加速</b><b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>機(jī)器學(xué)習(xí)推理

    MediaTek Genio平臺(tái)推動(dòng)側(cè)AI在零售場(chǎng)景中規(guī)?;涞?/a>

    從智能貨架和預(yù)測(cè)補(bǔ)貨,到自適應(yīng)數(shù)字標(biāo)牌和基于自然語(yǔ)言的客戶(hù)互動(dòng),側(cè) AI 正在推動(dòng)零售從被動(dòng)響應(yīng)走向主動(dòng)預(yù)測(cè)。在實(shí)體門(mén)店中,如果沒(méi)有智能自動(dòng)化,庫(kù)存準(zhǔn)確率明顯降低,導(dǎo)致銷(xiāo)售機(jī)會(huì)流失
    的頭像 發(fā)表于 02-10 15:23 ?593次閱讀

    應(yīng)對(duì)側(cè)AI算力、內(nèi)存、功耗“三堵墻”困境,安謀科技Arm China “周易”X3給出技術(shù)錦囊

    AI大模型正加速從云端向邊緣與側(cè)滲透,然而,算力、內(nèi)存、功耗等卻成了制約其規(guī)?;涞氐摹案邏Α?。專(zhuān)為AI計(jì)算而生的神經(jīng)網(wǎng)絡(luò)處理器(NPU)
    的頭像 發(fā)表于 12-18 13:45 ?549次閱讀
    應(yīng)對(duì)<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>算力、內(nèi)存、功耗“三堵墻”困境,安謀科技<b class='flag-5'>Arm</b> China “周易”X3給出技術(shù)錦囊

    重磅合作!Quintauris 聯(lián)手 SiFive,加速 RISC-V 在嵌入AI 領(lǐng)域落地

    據(jù)科技區(qū)角報(bào)道半導(dǎo)體解決方案提供商 Quintauris 最近宣布和 RISC-V 處理器 IP 領(lǐng)域的頭部廠商 SiFive 達(dá)成戰(zhàn)略合作,目標(biāo)直接瞄準(zhǔn)加速 RISC-V 在嵌入、AI
    發(fā)表于 12-18 12:01

    Alif Semiconductor的Ensemble MCU新增對(duì)ExecuTorch Runtime的支持,助力其推動(dòng)邊緣生成AI發(fā)展

    ·?Ensemble E4/E6/E8是業(yè)界首個(gè)為T(mén)ransformer網(wǎng)絡(luò)提供硬件加速的MCU系列,可在邊緣設(shè)備及終端設(shè)備上實(shí)現(xiàn)本地生成AI
    的頭像 發(fā)表于 11-04 11:44 ?1902次閱讀
    Alif Semiconductor的Ensemble MCU新增對(duì)<b class='flag-5'>ExecuTorch</b> Runtime的支持,助力其推動(dòng)邊緣<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>發(fā)展

    AI體驗(yàn)躍遷,天璣9500用雙NPU開(kāi)創(chuàng)側(cè)AI新時(shí)代

    架構(gòu),從底層解決性能與功耗的矛盾:超性能 NPU 990 性能大幅提升,生成 AI 引擎 2.0 深度加速 Transformer 與大模型;行業(yè)首個(gè)超能效 NPU以存算一體
    的頭像 發(fā)表于 09-24 14:47 ?909次閱讀
    <b class='flag-5'>AI</b>體驗(yàn)躍遷,天璣9500用雙NPU開(kāi)創(chuàng)<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>新時(shí)代

    此芯科技發(fā)布“合一”AI加速計(jì)劃,賦能邊緣與側(cè)AI創(chuàng)新

    此芯科技正式發(fā)布“合一”AI加速計(jì)劃,旨在為邊緣計(jì)算和側(cè)AI場(chǎng)景提供高能效的全棧算力解決方案。該計(jì)劃由此芯科技聯(lián)合多家行業(yè)
    的頭像 發(fā)表于 09-15 11:53 ?2011次閱讀
    此芯科技發(fā)布“合一”<b class='flag-5'>AI</b><b class='flag-5'>加速</b>計(jì)劃,賦能邊緣與<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>創(chuàng)新

    Arm神經(jīng)技術(shù)是業(yè)界首創(chuàng)在 Arm GPU 上增添專(zhuān)用神經(jīng)加速器的技術(shù),移動(dòng)設(shè)備上實(shí)現(xiàn)PC級(jí)別的AI圖形性能

    Arm 神經(jīng)技術(shù)是業(yè)界首創(chuàng)在 Arm GPU 上增添專(zhuān)用神經(jīng)加速器的技術(shù),首次在移動(dòng)設(shè)備上實(shí)現(xiàn) PC 級(jí)別的 AI 圖形性能,為未來(lái)的
    的頭像 發(fā)表于 08-14 17:59 ?2948次閱讀

    Arm率先適配騰訊混元開(kāi)源模型,助力側(cè)AI創(chuàng)新開(kāi)發(fā)

    伙伴共同賦能側(cè)人工智能 (AI) 部署,助力本土開(kāi)發(fā)者實(shí)現(xiàn) AI 應(yīng)用創(chuàng)新! 這次的首日開(kāi)源適配是雙方再次攜手提升
    的頭像 發(fā)表于 08-08 09:16 ?1579次閱讀
    <b class='flag-5'>Arm</b>率先適配騰訊混元開(kāi)源模型,助力<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>創(chuàng)新開(kāi)發(fā)

    MWCS 2025直擊:紫光展銳推出UNISOC側(cè)AI平臺(tái)解決方案,加速AI終端落地

    ,并在 AI 與開(kāi)放 API 的發(fā)展方面走在前沿,這一切得益于運(yùn)營(yíng)商與開(kāi)發(fā)者之間的深度協(xié)作。隨著人工智能的采用呈現(xiàn)指數(shù)級(jí)的增長(zhǎng),5G內(nèi)置的功能是絕對(duì)必要的。中國(guó)在基于人工智能的先進(jìn)應(yīng)用方面僅次于美國(guó)和德國(guó),在生成
    的頭像 發(fā)表于 06-21 10:33 ?6225次閱讀
    MWCS 2025直擊:紫光展銳推出UNISOC<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>平臺(tái)解決方案,<b class='flag-5'>加速</b><b class='flag-5'>AI</b>終端落地
    新化县| 阿拉善盟| 湘西| 夏河县| 广平县| 祥云县| 汉川市| 蓬安县| 淳化县| 固始县| 紫云| 十堰市| 来安县| 周宁县| 论坛| 巴彦县| 工布江达县| 凤冈县| 宁晋县| 灌云县| 张家口市| 许昌县| 丽江市| 朝阳区| 双城市| 黄梅县| 遵义县| 巴彦淖尔市| 洞头县| 黑河市| 图木舒克市| 山西省| 合作市| 六枝特区| 家居| 苍梧县| 杭锦旗| 张家界市| 花莲县| 衡阳县| 罗城|