日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm SME2技術(shù)加速騰訊翻譯大模型推理

Arm社區(qū) ? 來源:Arm社區(qū) ? 2026-05-06 10:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

出國旅行,多多少少都會被語言問題絆住腳步。想必很多人都遇過這種尷尬時刻:手機(jī)信號、網(wǎng)速卡頓,翻譯軟件直接罷工,溝通全靠手舞足蹈,干著急又無奈!擁有一款翻譯精準(zhǔn),還能在端側(cè)本地運行的翻譯模型,和煩惱說拜拜!

騰訊混元將翻譯大模型 Hy-MT1.5 壓縮至最小 440MB(1.25-bit 模型),輕輕松松裝進(jìn)手機(jī)。不僅如此,依托第二代 Arm 可伸縮矩陣擴(kuò)展 (Arm SME2) 技術(shù)加持,推理表現(xiàn)進(jìn)一步提升,隨時隨地讓你解鎖絲滑流暢的端側(cè)翻譯體驗!

Hy-MT1.5 是騰訊混元團(tuán)隊打造的專業(yè)翻譯大模型,原生支持 33 種語言,5 種方言/民漢,1056 個翻譯方向。為了進(jìn)一步在有限的手機(jī)內(nèi)存下,實現(xiàn)更好的使用體驗,騰訊推出了兩種量化壓縮方案,以適配不同的手機(jī)用戶需求。其中,1.25-bit 模型主打極致壓縮;而 2-bit 模型則是在性能和質(zhì)量間取得了出色平衡。2-bit 模型通過采用拉伸彈性量化 (SEQ),并結(jié)合量化感知蒸餾,在幾乎不犧牲翻譯質(zhì)量的同時,將模型體積壓縮至 574MB。此外,得益于 Arm SME2 技術(shù),在支持該技術(shù)的移動設(shè)備上,2-bit 模型的推理速度更快、運行能效更高,移動端翻譯體驗夯爆了!

1bd42c7a-43b0-11f1-90a1-92fbcf53809c.gif

2-bit 模型運行在支持與未支持 SME2 技術(shù)的移動設(shè)備上的速度對比演示

SME2 作為 Armv9 架構(gòu)中的一組高級 CPU 指令,專為在端側(cè)直接加速面向矩陣的計算工作負(fù)載而設(shè)計,使 CPU 能夠處理支撐著當(dāng)今大語言模型等用例的密集數(shù)學(xué)運算,同時顯著降低功耗與延遲。由此打造出可在數(shù)十億臺移動設(shè)備上運行的更具吸引力、更智能、更直觀的應(yīng)用,并帶來切實可量化的提升表現(xiàn)。對用戶而言,應(yīng)用體驗將因此變得更加迅捷、本地化且安全可信。SME2 現(xiàn)已應(yīng)用在多款智能手機(jī)上(具體機(jī)型詳見設(shè)備列表),你的手機(jī)是否也已搭載了這項技術(shù)了呢?

設(shè)備列表:https://learn.arm.com/learning-paths/cross-platform/multiplying-matrices-with-sme2/1-get-started#devices

而對于移動端開發(fā)者來說,SME2 技術(shù)為他們帶來了端側(cè) AI 加速功能,有助于實現(xiàn)更迅捷、更智能的端側(cè)體驗,革新移動應(yīng)用功能。得益于 Arm 的軟件加速層 —— Arm KleidiAI,它能夠無縫集成到主流運行時庫和 AI 框架中,開發(fā)者無需改動現(xiàn)有代碼、模型或應(yīng)用,即可直接獲取 SME2 帶來的性能提升。除此之外,SME2 通過 CPU 實現(xiàn) AI 加速的標(biāo)準(zhǔn)化,為開發(fā)者提供了統(tǒng)一、可移植的移動端 AI 基礎(chǔ),基于 SME2 構(gòu)建的應(yīng)用在 iOS 和安卓系統(tǒng)上都能實現(xiàn)一致的性能表現(xiàn)。開發(fā)者一次構(gòu)建應(yīng)用與工作負(fù)載,即可部署至海量基于 Arm 架構(gòu)的設(shè)備上。

端側(cè) AI 的核心并非單純?yōu)樵O(shè)備堆砌更多智能功能,而是讓智能更貼近用戶的應(yīng)用場景,切實升級大家的日常使用體驗。一直以來,Arm 與騰訊混元持續(xù)依托技術(shù)創(chuàng)新,攜手推動端側(cè)應(yīng)用功能與用戶體驗的優(yōu)化升級,助力本土開發(fā)者更高效、順暢地開展端側(cè) AI 創(chuàng)新開發(fā)。

端側(cè) AI 正在重塑移動體驗,而 Arm 正是實現(xiàn)這些無縫交互體驗的計算基礎(chǔ)和強勁驅(qū)動力!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9596

    瀏覽量

    393853
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11337

    瀏覽量

    226011
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3805

    瀏覽量

    5282

原文標(biāo)題:暢游異國無懼語言!Arm SME2 加速騰訊翻譯大模型推理,端側(cè)體驗又快又準(zhǔn)

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    利用ExecuTorch和Arm SME2加速端側(cè)機(jī)器學(xué)習(xí)推理

    貼紙、分離主體以替換背景,或是對圖像局部進(jìn)行選擇性增強。這些效果背后,是輕量級分割模型在運行,這些模型通過 ExecuTorch(PyTorch 的開源端側(cè)推理運行時)以及第二代 Arm
    的頭像 發(fā)表于 03-03 10:27 ?743次閱讀
    利用ExecuTorch和<b class='flag-5'>Arm</b> <b class='flag-5'>SME2</b><b class='flag-5'>加速</b>端側(cè)機(jī)器學(xué)習(xí)<b class='flag-5'>推理</b>

    Arm率先適配騰訊混元HY-1.8B-2Bit模型

    計算平臺,Arm 率先完成了對該模型的成功適配。HY-1.8B-2Bit 現(xiàn)已能夠在搭載啟用第二代可伸縮矩陣擴(kuò)展 (SME2) 技術(shù)的 Ar
    的頭像 發(fā)表于 02-10 17:29 ?2115次閱讀

    Arm SME2技術(shù)賦能端側(cè)AI加速實現(xiàn)卓越移動端體驗

    試想這樣的場景:當(dāng)你正在發(fā)消息時,手機(jī)能在你輸入過程中實時翻譯文字,還能即時總結(jié)整段對話內(nèi)容;或是在拍照時,手機(jī)能在你按下快門之前,迅速解析復(fù)雜場景畫面,并自動對關(guān)鍵主體進(jìn)行聚焦。換言之,以往需要停頓處理的手機(jī)應(yīng)用,如今已能實時預(yù)判并滿足你的需求。
    的頭像 發(fā)表于 01-22 14:18 ?751次閱讀

    LLM推理模型是如何推理的?

    這篇文章《(How)DoReasoningModelsReason?》對當(dāng)前大型推理模型(LRM)進(jìn)行了深刻的剖析,超越了表面的性能宣傳,直指其技術(shù)本質(zhì)和核心局限。以下是基于原文的詳細(xì)技術(shù)原理、關(guān)鍵
    的頭像 發(fā)表于 01-19 15:33 ?738次閱讀
    LLM<b class='flag-5'>推理模型</b>是如何<b class='flag-5'>推理</b>的?

    沐曦曦云C500/C550 GPU產(chǎn)品適配騰訊混元開源翻譯模型1.5版本

    12月30日,騰訊混元宣布推出并開源翻譯模型1.5,共包含兩個模型:Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B,兩個
    的頭像 發(fā)表于 01-06 14:13 ?618次閱讀
    沐曦曦云C500/C550 GPU產(chǎn)品適配<b class='flag-5'>騰訊</b>混元開源<b class='flag-5'>翻譯</b><b class='flag-5'>模型</b>1.5版本

    壁仞科技壁礪166M產(chǎn)品適配騰訊混元開源翻譯模型1.5版本

    12月30日,騰訊混元正式開源翻譯模型1.5版本,該版本共包含兩個模型:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B,支持33個語種互譯以及5種民
    的頭像 發(fā)表于 01-05 15:39 ?472次閱讀
    壁仞科技壁礪166M產(chǎn)品適配<b class='flag-5'>騰訊</b>混元開源<b class='flag-5'>翻譯</b><b class='flag-5'>模型</b>1.5版本

    Arm Lumex平臺賦能新一代旗艦智能手機(jī)體驗升級

    可伸縮矩陣擴(kuò)展 (SME2) 技術(shù)的全新 Arm C1 CPU 集群與Arm Mali G1-Ultra GPU,Lumex 將先進(jìn)智能計算帶到全球數(shù)十億手機(jī)用戶的手中,并依托各大旗
    的頭像 發(fā)表于 12-15 14:27 ?936次閱讀

    Arm助力MediaTek天璣9500重塑旗艦體驗

    Arm 合作伙伴產(chǎn)品上“芯”!近日,MediaTek 發(fā)布了天璣 9500 旗艦 5G 智能體 AI 芯片,該芯片基于啟用 SME2 的全新 Arm C1 CPU 集群打造,并搭載 Arm
    的頭像 發(fā)表于 10-10 11:28 ?1418次閱讀

    什么是AI模型推理能力

    NVIDIA 的數(shù)據(jù)工廠團(tuán)隊為 NVIDIA Cosmos Reason 等 AI 模型奠定了基礎(chǔ),該模型近日在 Hugging Face 的物理推理模型排行榜中位列榜首。
    的頭像 發(fā)表于 09-23 15:19 ?1526次閱讀

    Arm正式取消Cortex命名!CPU向著高算力進(jìn)發(fā),Lumex CSS平臺加持!

    Lumex、面向PC市場的Niva,以及面向物聯(lián)網(wǎng)和邊緣 AI的Orbis。 ? Lumex CSS 平臺集成了搭載第二代可伸縮矩陣擴(kuò)展 (SME2) 技術(shù)
    的頭像 發(fā)表于 09-17 08:25 ?3390次閱讀
    <b class='flag-5'>Arm</b>正式取消Cortex命名!CPU向著高算力進(jìn)發(fā),Lumex CSS平臺加持!

    全新Arm Lumex CSS平臺實現(xiàn)兩位數(shù)性能提升

    及下一代個人電腦加速其人工智能 (AI) 體驗的先進(jìn)計算平臺。Lumex CSS 平臺集成了搭載第二代可伸縮矩陣擴(kuò)展 (SME2) 技術(shù)的最高性能 Arm CPU、GPU 及系統(tǒng) IP
    的頭像 發(fā)表于 09-10 16:14 ?1079次閱讀
    全新<b class='flag-5'>Arm</b> Lumex CSS平臺實現(xiàn)兩位數(shù)性能提升

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準(zhǔn)確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?2058次閱讀
    NVIDIA Nemotron Nano <b class='flag-5'>2</b><b class='flag-5'>推理模型</b>發(fā)布

    Arm率先適配騰訊混元開源模型,助力端側(cè)AI創(chuàng)新開發(fā)

    共同賦能端側(cè)人工智能 (AI) 部署,助力本土開發(fā)者實現(xiàn) AI 應(yīng)用創(chuàng)新! 這次的首日開源適配是雙方再次攜手提升端側(cè)應(yīng)用功能和用戶體驗的又一例證。去年,ArmArm KleidiAI 技術(shù)
    的頭像 發(fā)表于 08-08 09:16 ?1580次閱讀
    <b class='flag-5'>Arm</b>率先適配<b class='flag-5'>騰訊</b>混元開源<b class='flag-5'>模型</b>,助力端側(cè)AI創(chuàng)新開發(fā)

    Arm SME2 技術(shù)加速安卓 AI 升級,驅(qū)動移動應(yīng)用下一代功能革新

    從按下快門前就對照片進(jìn)行即時銳化,到通話過程中實時消除背景噪音,再到離線狀態(tài)下與人工智能 (AI) 助手互動,端側(cè) AI 正在重塑移動體驗。而 Arm 計算平臺正是實現(xiàn)這些無縫交互體驗的強勁驅(qū)動力
    的頭像 發(fā)表于 07-18 20:28 ?1985次閱讀

    模型推理顯存和計算量估計方法研究

    ,如乘法、加法等; (2)根據(jù)各層計算操作的類型和復(fù)雜度,確定每層所需的計算量; (3)將各層計算量相加,得到模型總的計算量。 基于硬件加速的算力估計 隨著硬件加速
    發(fā)表于 07-03 19:43
    富源县| 汪清县| 全南县| 当涂县| 彰化市| 西盟| 甘谷县| 密山市| 综艺| 扶沟县| 樟树市| 维西| 福建省| 东安县| 延长县| 策勒县| 搜索| 盐池县| 买车| 壤塘县| 嘉峪关市| 邢台市| 平武县| 衡阳县| 蒲江县| 从化市| 邛崃市| 五台县| 泸定县| 泰州市| 高青县| 湟源县| 奉新县| 乌苏市| 叙永县| 含山县| 和顺县| 津南区| 清徐县| 威信县| 耒阳市|