日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm率先適配騰訊混元HY-1.8B-2Bit模型

Arm社區(qū) ? 來源:Arm社區(qū) ? 2026-02-10 17:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著人工智能 (AI) 加速向智能手機(jī)、PC 與物聯(lián)網(wǎng)終端等滲透,如何在邊緣設(shè)備上實現(xiàn)高性能、低功耗的智能體驗,已成為行業(yè)共同關(guān)注的核心議題。

騰訊混元今日發(fā)布了 HY-1.8B-2Bit,這是一款等效參數(shù)量僅有 0.3B 的極低比特壓縮模型,有助于移動設(shè)備廠商和開發(fā)者加速實現(xiàn)生成式 AI 的創(chuàng)新落地。作為全球應(yīng)用最為廣泛的高性能、高能效計算平臺,Arm 率先完成了對該模型的成功適配。HY-1.8B-2Bit 現(xiàn)已能夠在搭載啟用第二代可伸縮矩陣擴(kuò)展 (SME2) 技術(shù)的 Armv9 計算平臺的移動設(shè)備上實現(xiàn)高效運(yùn)行。

在資源受限的邊緣設(shè)備上部署與運(yùn)行生成式 AI,普遍面臨性能、能效、內(nèi)存等諸多挑戰(zhàn)。通過有效縮減模型規(guī)模,是將生成式 AI 用例拓展至更廣泛設(shè)備的行之有效的方法之一。規(guī)模更小的模型在與原始模型保持相近推理精度的前提下,能在端側(cè)實現(xiàn)更出色的性能表現(xiàn)與能效水平,進(jìn)而在兼顧設(shè)備續(xù)航表現(xiàn)的同時,為用戶帶來響應(yīng)更迅捷、運(yùn)行更流暢的端側(cè) AI 體驗。

騰訊混元此次推出的 HY-1.8B-2Bit 通過對 HY?1.8B?Instruct 模型進(jìn)行 2 比特量化感知訓(xùn)練 (QAT) 產(chǎn)出,對比原始精度模型等效參數(shù)量降低了 6 倍,可以在邊緣設(shè)備上靈活部署,并保持了與 INT4-PTQ 方法相當(dāng)?shù)哪P托阅?。同時,該模型沿用了 HY-1.8B-Instruct 的全思考能力,用戶可以根據(jù)其應(yīng)用的復(fù)雜性和資源限制,靈活地選擇推理模式。得益于上述優(yōu)勢,HY-1.8B-2Bit 在實時性要求高、資源受限的場景中依然能夠提供快速且可靠的推理表現(xiàn)。

而在此基礎(chǔ)上,Arm SME2 技術(shù)使得移動端開發(fā)者能更輕松獲取端側(cè) AI 加速功能。SME2 是 Armv9 架構(gòu)中的高級 CPU 指令,能夠在 AI 異構(gòu)計算框架下,高效支持各類實時移動端推理任務(wù)。實際測試結(jié)果顯示,HY-1.8B-2Bit 運(yùn)行在啟用 SME2 技術(shù)的移動設(shè)備上時,對比 HY-1.8B-Q4 模型,在不同窗口大小下的首詞元延遲 (TTFT) 和生成速度均實現(xiàn)了顯著提升。這將有助于在資源受限的場景中,實現(xiàn)更卓越、流暢、智能的使用體驗。例如,通用聊天機(jī)器人和 AI 助手能夠在端側(cè)實現(xiàn)更復(fù)雜、自然的語言處理能力。與此同時,SME2 已被集成至多個主流框架中,深度嵌入軟件棧。開發(fā)者可通過 llama.cpp 直接在啟用 SME2 技術(shù)的硬件上部署 HY-1.8B-2Bit 模型,加速實現(xiàn)生成式 AI 應(yīng)用的性能躍升。

模型地址:

https://huggingface.co/AngelSlim/HY-1.8B-2Bit

https://huggingface.co/AngelSlim/HY-1.8B-2Bit-GGUF

各位開發(fā)者們,也可點擊閱讀原文,跳轉(zhuǎn)模型地址,了解更多關(guān)于 HY-1.8B-2Bit 的信息及如何部署!

SME2 技術(shù)已獲得業(yè)界領(lǐng)先生態(tài)伙伴的廣泛采用與認(rèn)可。vivo、OPPO 等手機(jī)廠商已推出集成啟用 SME2 的 Arm C1 CPU 與 Mali G1-Ultra GPU 的旗艦智能手機(jī),為端側(cè) AI 帶來了實際的體驗提升;此外,SME2 也已在 iOS 中大幅啟用。而開發(fā)者們正借助 SME2 技術(shù),加速語言模型推理、圖像處理、音頻生成等核心能力,為各類主流應(yīng)用打造出更迅捷的實時體驗。與此同時,Arm 也正積極將 SME2 技術(shù)擴(kuò)展至更廣泛的 CPU 平臺。預(yù)計到 2030 年,SME 與 SME2 技術(shù)將為超過 30 億臺設(shè)備新增超 100 億 TOPS 的計算能力,持續(xù)降低端側(cè) AI 的部署成本與隱私風(fēng)險。

Arm 與騰訊混元持續(xù)依托技術(shù)創(chuàng)新,攜手推動端側(cè)應(yīng)用功能與用戶體驗的優(yōu)化升級,助力本土開發(fā)者更高效、順暢地開展端側(cè) AI 創(chuàng)新開發(fā)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9589

    瀏覽量

    393778
  • 騰訊
    +關(guān)注

    關(guān)注

    7

    文章

    1687

    瀏覽量

    51008
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3831

    瀏覽量

    52285

原文標(biāo)題:SME2 技術(shù)加持,Arm 率先適配騰訊混元 HY-1.8B-2Bit 模型,為端側(cè) AI 帶來卓越體驗

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    沐曦股份曦云C系列GPU產(chǎn)品Day 0適配騰訊Hy3 preview語言模型

    4月23日,騰訊團(tuán)隊正式發(fā)布并開源Hy3 preview語言模型。沐曦股份旗下曦云 C 系列 GPU已完成Day 0
    的頭像 發(fā)表于 04-28 15:51 ?637次閱讀
    沐曦股份曦云C系列GPU產(chǎn)品Day 0<b class='flag-5'>適配</b><b class='flag-5'>騰訊</b><b class='flag-5'>混</b><b class='flag-5'>元</b><b class='flag-5'>Hy</b>3 preview語言<b class='flag-5'>模型</b>

    燧原科技L600適配騰訊Hy3 preview語言模型

    2026年4月23日,騰訊 Hy3 preview 語言模型發(fā)布并開源,燧原 L600已同步完成對
    的頭像 發(fā)表于 04-28 15:13 ?178次閱讀
    燧原科技L600<b class='flag-5'>適配</b><b class='flag-5'>騰訊</b><b class='flag-5'>混</b><b class='flag-5'>元</b><b class='flag-5'>Hy</b>3 preview語言<b class='flag-5'>模型</b>

    壁仞科技率先完成中國移動九天35B模型預(yù)適配

    據(jù)了解,中國移動即將發(fā)布自主研發(fā)的九天35B通用大模型。該模型將憑借強(qiáng)大的語言理解、復(fù)雜推理與行業(yè)場景適配能力,有望成為央企自研大模型的標(biāo)桿
    的頭像 發(fā)表于 04-28 14:06 ?683次閱讀
    壁仞科技<b class='flag-5'>率先</b>完成中國移動九天35<b class='flag-5'>B</b>大<b class='flag-5'>模型</b>預(yù)<b class='flag-5'>適配</b>

    壁仞科技壁礪166系列GPU產(chǎn)品率先支持騰訊Hy3 preview語言模型

    4月23日,騰訊Hy3 preview語言模型發(fā)布并開源。依托全棧自研技術(shù)優(yōu)勢,壁仞科技基于vLLM主流開源框架實現(xiàn)
    的頭像 發(fā)表于 04-28 14:01 ?575次閱讀
    壁仞科技壁礪166系列GPU產(chǎn)品<b class='flag-5'>率先</b>支持<b class='flag-5'>騰訊</b><b class='flag-5'>混</b><b class='flag-5'>元</b><b class='flag-5'>Hy</b>3 preview語言<b class='flag-5'>模型</b>

    摩爾線程 x 中國移動|國產(chǎn)GPU率先支撐央企大模型,S5000完成九天35B模型適配

    ,依托成熟的MUSA軟件棧與高性能算子優(yōu)化,已率先完成九天35B模型的全流程適配與推理驗證。這不僅是國產(chǎn)GPU與央企大模型的深度協(xié)同,更意味
    發(fā)表于 04-28 08:32 ?892次閱讀

    天數(shù)智芯深度適配騰訊開源Hy3 preview大模型

    4 月 23 日,騰訊正式發(fā)布并開源 Hy3 preview 大模型,作為
    的頭像 發(fā)表于 04-24 17:56 ?1717次閱讀
    天數(shù)智芯深度<b class='flag-5'>適配</b><b class='flag-5'>騰訊</b><b class='flag-5'>混</b><b class='flag-5'>元</b>開源<b class='flag-5'>Hy</b>3 preview大<b class='flag-5'>模型</b>

    騰訊Hy3 preview開源:重構(gòu)AI大模型技術(shù)范式,開啟智能計算新紀(jì)元

    2026年4月23日,騰訊正式開源其最新語言模型Hy3 preview,這款被官方定義為“
    的頭像 發(fā)表于 04-24 09:07 ?849次閱讀

    沐曦曦云C500/C550 GPU產(chǎn)品適配騰訊圖像3.0圖生圖模型

    近日,騰訊團(tuán)隊宣布開源圖像3.0圖生圖版本(HunyuanImage 3.0-Instruct),沐曦股份曦云C500/C550 2
    的頭像 發(fā)表于 02-02 14:43 ?572次閱讀

    沐曦曦云C500/C550 GPU產(chǎn)品適配騰訊開源翻譯模型1.5版本

    12月30日,騰訊宣布推出并開源翻譯模型1.5,共包含兩個模型:Tencent-HY-MT1.5-1
    的頭像 發(fā)表于 01-06 14:13 ?601次閱讀
    沐曦曦云C500/C550 GPU產(chǎn)品<b class='flag-5'>適配</b><b class='flag-5'>騰訊</b><b class='flag-5'>混</b><b class='flag-5'>元</b>開源翻譯<b class='flag-5'>模型</b>1.5版本

    壁仞科技壁礪166M產(chǎn)品適配騰訊開源翻譯模型1.5版本

    中文、英語、日語等常見語種,也包含捷克語、馬拉地語、愛沙尼亞語、冰島語等小語種。目前兩個模型均已在騰訊官網(wǎng)上線,在Github和Huggingface等開源社區(qū)也可直接下載使用。壁
    的頭像 發(fā)表于 01-05 15:39 ?467次閱讀
    壁仞科技壁礪166M產(chǎn)品<b class='flag-5'>適配</b><b class='flag-5'>騰訊</b><b class='flag-5'>混</b><b class='flag-5'>元</b>開源翻譯<b class='flag-5'>模型</b>1.5版本

    Arm率先適配騰訊開源模型,助力端側(cè)AI創(chuàng)新開發(fā)

    本周初,騰訊宣布開源四款小尺寸模型(參數(shù)分別為 0.5B1.8B、4
    的頭像 發(fā)表于 08-08 09:16 ?1576次閱讀
    <b class='flag-5'>Arm</b><b class='flag-5'>率先</b><b class='flag-5'>適配</b><b class='flag-5'>騰訊</b><b class='flag-5'>混</b><b class='flag-5'>元</b>開源<b class='flag-5'>模型</b>,助力端側(cè)AI創(chuàng)新開發(fā)

    硬件與應(yīng)用同頻共振,英特爾Day 0適配騰訊開源模型

    于OpenVINO? 構(gòu)建的 AI 軟件平臺的可擴(kuò)展性,英特爾助力ISV生態(tài)伙伴率先實現(xiàn)應(yīng)用端Day 0 模型適配,大幅加速了新模型的落地進(jìn)程,彰顯了 “硬件 +
    的頭像 發(fā)表于 08-07 14:42 ?1558次閱讀
    硬件與應(yīng)用同頻共振,英特爾Day 0<b class='flag-5'>適配</b><b class='flag-5'>騰訊</b>開源<b class='flag-5'>混</b><b class='flag-5'>元</b>大<b class='flag-5'>模型</b>

    萬億參數(shù)!腦企智一體機(jī)率先支持Kimi K2模型

    北京2025年7月21日 /美通社/ --?浪潮信息宣布腦企智一體機(jī)已率先完成對Kimi K2 萬億參數(shù)大模型適配支持,并實現(xiàn)單用戶70
    的頭像 發(fā)表于 07-22 09:27 ?717次閱讀
    萬億參數(shù)!<b class='flag-5'>元</b>腦企智一體機(jī)<b class='flag-5'>率先</b>支持Kimi K<b class='flag-5'>2</b>大<b class='flag-5'>模型</b>

    摩爾線程率先支持騰訊-A13B模型

    近日,騰訊正式開源基于專家混合(MoE)架構(gòu)的大語言模型-A13B。同日,摩爾線程團(tuán)隊?wèi){借技術(shù)前瞻性,
    的頭像 發(fā)表于 07-04 14:10 ?1041次閱讀

    Arm CPU適配通義千問Qwen3系列模型

    近日,阿里巴巴開源了新一代通義千問模型 Qwen3,Arm 率先成為首批成功適配模型的計算平臺廠商。與此同時,
    的頭像 發(fā)表于 05-12 16:37 ?1614次閱讀
    福贡县| 方正县| 交口县| 巴里| 大港区| 弥勒县| 巨鹿县| 江都市| 黎城县| 额敏县| 淳安县| 锡林浩特市| 黄梅县| 浮山县| 太仆寺旗| 策勒县| 河北区| 绥德县| 璧山县| 金川县| 临澧县| 乐至县| 民勤县| 墨江| 兴安县| 江孜县| 禹城市| 清镇市| 西宁市| 阳城县| 丰台区| 河津市| 出国| 天长市| 天津市| 聂荣县| 西城区| 区。| 兴安盟| 深泽县| 谷城县|