日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開(kāi)發(fā)者分享 | 在 MCU 上探索 Qwen2.5 代碼生成

先楫半導(dǎo)體HPMicro ? 2026-06-10 08:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近,我做了一個(gè)開(kāi)發(fā)者實(shí)驗(yàn):嘗試把 Qwen2.5-0.5B-Instruct 部署到 HPM6800EVK 上,讓它在板端完成本地推理。

這里的“本地”不是把 MCU 當(dāng)成串口終端,再去調(diào)用云端 API;也不是由 PC 代跑模型、板子只負(fù)責(zé)顯示結(jié)果。模型權(quán)重、Tokenizer、推理框架、采樣邏輯、交互流程都運(yùn)行在 HPM6800EVK 開(kāi)發(fā)板上。用戶(hù)通過(guò) UART 輸入問(wèn)題,MCU 在本地完成推理并流式輸出回答。

這次視頻演示的是兩個(gè)方向:

第一個(gè)是本地聊天。

我將 Qwen2.5-0.5B-Instruct 移植到 HPM6800EVK 上運(yùn)行。這個(gè)模型約 4.94 億參數(shù),經(jīng)過(guò)混合量化后,模型文件約 414MB,Tokenizer 文件約 2.9MB。板端從 SD/TF 卡加載模型和詞表,在 MCU 上完成前向推理,并通過(guò) UART 提供交互式聊天體驗(yàn)。

在這個(gè)演示工程中,主要做了幾件關(guān)鍵工作:

將模型推理流程用 C 實(shí)現(xiàn)并適配 MCU 運(yùn)行環(huán)境;

將 Qwen2.5 的 Tokenizer 導(dǎo)出為板端可加載的二進(jìn)制格式;

針對(duì) HPM6880 的 RISC-V/Andes D45 內(nèi)核使用 P 擴(kuò)展 SIMD 指令優(yōu)化矩陣計(jì)算;

對(duì) KV cache、權(quán)重布局和運(yùn)行時(shí)內(nèi)存進(jìn)行壓縮與規(guī)劃,讓模型能夠在板載 DDR 資源中運(yùn)行;

保留 UART 流式輸出,讓用戶(hù)能看到模型逐 token 生成結(jié)果。

在當(dāng)前實(shí)驗(yàn)配置下,這個(gè)聊天 demo 可以演示中文問(wèn)答、多輪對(duì)話(huà)和一些基礎(chǔ)代碼類(lèi)問(wèn)題。需要注意的是,整體生成速度并不快,更適合觀察流式輸出過(guò)程和驗(yàn)證鏈路,而不是追求即時(shí)響應(yīng)。它驗(yàn)證的重點(diǎn)不是“MCU 要和 GPU 拼吞吐”,而是在特定硬件和模型配置下,觀察小規(guī)模量化語(yǔ)言模型的完整推理鏈路能在 MCU 平臺(tái)上做到什么。


第二個(gè)是代碼生成。

聊天只是第一步。更進(jìn)一步,我希望嘗試讓板端模型不僅能回答問(wèn)題,還能把自然語(yǔ)言任務(wù)轉(zhuǎn)成可執(zhí)行代碼。

在代碼生成 demo 中,用戶(hù)可以輸入類(lèi)似這樣的任務(wù):

求 10 的階乘,并打印結(jié)果

板端大模型會(huì)生成 Python 代碼,然后交給同一塊 MCU 上嵌入的 MicroPython 運(yùn)行時(shí)執(zhí)行,最后把結(jié)果打印出來(lái)。

這部分的交互速度會(huì)更慢,更像是等待模型逐步生成一段可執(zhí)行腳本,而不是云端代碼助手那種即時(shí)響應(yīng)體驗(yàn)。

也就是說(shuō),這條鏈路不是簡(jiǎn)單地“模型輸出一段文本”,而是:


自然語(yǔ)言任務(wù) → 本地大模型生成 Python → MicroPython 在板端執(zhí)行 → 輸出運(yùn)行結(jié)果

為了讓這條鏈路真正跑通,代碼生成 demo 中需要增加幾個(gè)工程模塊:

針對(duì)代碼生成任務(wù)設(shè)計(jì) prompt,讓模型盡量輸出可執(zhí)行 Python;

在 MCU 上集成 MicroPython 編譯器、VM 和 GC 運(yùn)行時(shí);

增加mathrandom等常用能力的板端適配;

將 MicroPython 的open()和簡(jiǎn)化os模塊橋接到板端文件系統(tǒng)接口;

支持代碼運(yùn)行失敗后的錯(cuò)誤反饋和重試,讓模型有機(jī)會(huì)根據(jù)錯(cuò)誤重新生成代碼;

因此,視頻里看到的文件讀寫(xiě)也不是預(yù)置輸出。模型生成的 Python 代碼可以通過(guò) MicroPython 直接訪問(wèn) SD/TF 卡上的文件系統(tǒng),例如創(chuàng)建文件、寫(xiě)入內(nèi)容、讀取文件、遍歷目錄等。

這里也需要強(qiáng)調(diào):代碼生成 demo 更適合簡(jiǎn)單、受控任務(wù)演示,例如計(jì)算、字符串處理和基礎(chǔ)文件讀寫(xiě)。它不能被理解為可以穩(wěn)定完成復(fù)雜工程代碼,也不能直接用于安全關(guān)鍵或?qū)崟r(shí)控制邏輯。


這塊板子是什么?

本次演示使用的是 HPM6800EVK 開(kāi)發(fā)板。它搭載 HPM6800/HPM6880 系列高性能 RISC-V MCU,主頻可達(dá) 600MHz,并配備大容量 DDR3L 外部存儲(chǔ)、Quad SPI NOR Flash、eMMC、TF 卡等存儲(chǔ)資源。開(kāi)發(fā)板還提供 LCD、MIPI-DSI、MIPI-CSI、DVP 攝像頭、千兆以太網(wǎng)、USB 2.0 OTG、音頻、CAN、RGB LED 等豐富外設(shè)接口,適合用于圖形顯示、音視頻處理、工業(yè)控制以及邊緣 AI 等場(chǎng)景驗(yàn)證。

在這次 LLM demo 中,模型文件從 SD/TF 卡加載,模型權(quán)重、KV cache、運(yùn)行時(shí)緩沖區(qū)等主要依賴(lài)板載 DDR 資源,推理和交互邏輯運(yùn)行在 MCU 端,通過(guò) UART 與用戶(hù)交互。


為什么要在 MCU 上跑大模型?

從開(kāi)發(fā)者視角看,我主要關(guān)注三個(gè)點(diǎn)。

首先,它讓我能觀察小規(guī)模量化語(yǔ)言模型在 MCU 平臺(tái)上的運(yùn)行邊界。過(guò)去更多討論的是服務(wù)器、PC、手機(jī)、邊緣計(jì)算盒子,現(xiàn)在具備外部 DDR 的高性能 MCU 也可以進(jìn)入本地模型推理的實(shí)驗(yàn)范圍。

其次,它讓我看到傳統(tǒng) MCU 工程可以接入一些語(yǔ)言模型相關(guān)模塊,比如 Tokenizer、采樣、腳本運(yùn)行時(shí)和文件系統(tǒng)接口。

第三,代碼生成這段比較有意思:模型先生成一段腳本,再由板端 MicroPython 執(zhí)行?,F(xiàn)在只適合簡(jiǎn)單任務(wù),但這個(gè)鏈路本身值得繼續(xù)試。

當(dāng)然,這仍然是一個(gè)展示和方向探索 demo。它依賴(lài)特定硬件、板載 DDR 和量化后的模型配置,響應(yīng)速度也比較慢。目前更適合用來(lái)觀察“MCU 本地跑小模型”這條路能走到哪里,而不是作為產(chǎn)品應(yīng)用來(lái)理解。

這也是我做這個(gè) demo 最想表達(dá)的點(diǎn):


這次 demo 至少說(shuō)明:在這類(lèi)硬件和模型配置下,MCU 本地跑小模型推理鏈路是可以做方向探索的。


下面這條視頻,是從開(kāi)發(fā)者視角做的一次實(shí)際演示。視頻中展示了 HPM6800EVK 上的本地聊天、自然語(yǔ)言代碼生成、MicroPython 板端執(zhí)行,以及 SD/TF 卡文件讀寫(xiě)。

后續(xù)我也會(huì)繼續(xù)關(guān)注邊緣 AI、本地小模型和 MCU 智能化方向的更多探索。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • mcu
    mcu
    +關(guān)注

    關(guān)注

    147

    文章

    19313

    瀏覽量

    405702
  • uart
    +關(guān)注

    關(guān)注

    22

    文章

    1328

    瀏覽量

    107306
  • 開(kāi)發(fā)者
    +關(guān)注

    關(guān)注

    1

    文章

    810

    瀏覽量

    18132
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    openEuler基于vLLM Ascend部署Qwen3

    驗(yàn)證。目前,開(kāi)發(fā)者可以基于OpenAtom openEuler(簡(jiǎn)稱(chēng)“openEuler”)和vLLM昇騰設(shè)備完成 Qwen3 推理。
    的頭像 發(fā)表于 05-07 14:44 ?2216次閱讀
    <b class='flag-5'>在</b>openEuler<b class='flag-5'>上</b>基于vLLM Ascend部署<b class='flag-5'>Qwen</b>3

    2024年上海海思MCU開(kāi)發(fā)者體驗(yàn)官招募,手機(jī)/MatePad大獎(jiǎng)等你拿!

    名。 2)優(yōu)秀MCU開(kāi)發(fā)者體驗(yàn)官獎(jiǎng):按評(píng)選標(biāo)總分第4-10名。 3)MCU開(kāi)發(fā)者體驗(yàn)官貢獻(xiàn)獎(jiǎng):按評(píng)選標(biāo)準(zhǔn)總分大于60分,不含前10名。 4)最具商業(yè)價(jià)值獎(jiǎng):
    發(fā)表于 08-02 17:29

    MCU代碼自動(dòng)生成功能,Gokit二次開(kāi)發(fā)視頻教學(xué)

    Gokit3V的程序?qū)崿F(xiàn)原理,以及開(kāi)發(fā)中所需注意的數(shù)據(jù)處理。針對(duì)于已使用過(guò)“代碼自動(dòng)生成工具”,并且想要深入了解設(shè)備端MCU版程序?qū)崿F(xiàn)機(jī)制的開(kāi)發(fā)者
    發(fā)表于 10-31 18:30

    代碼自動(dòng)生成工具,支持獨(dú)立MCU方案、SOC方案

    1.什么是“代碼自動(dòng)生成工具”為了降低開(kāi)發(fā)者開(kāi)發(fā)門(mén)檻,縮短開(kāi)發(fā)周期,降低開(kāi)發(fā)資源投入,機(jī)智云推
    發(fā)表于 12-20 16:25

    STM32峰會(huì):機(jī)智云MCU代碼開(kāi)發(fā)工具降低智能硬件開(kāi)發(fā)成本

    全球最大的物聯(lián)網(wǎng)應(yīng)用開(kāi)發(fā)者社區(qū)。平臺(tái)通過(guò)多元化的API支持,完善的SDK、IDE開(kāi)發(fā)環(huán)境,全自動(dòng)的嵌入式和移動(dòng)應(yīng)用代碼生成器等完整的工具鏈,幫助開(kāi)發(fā)
    發(fā)表于 04-27 12:02

    絕對(duì)干貨!HarmonyOS開(kāi)發(fā)者日資料全公開(kāi),鴻蒙開(kāi)發(fā)者都在看

    731HarmonyOS開(kāi)發(fā)者日大會(huì)PPT資料全在這了,想要了解的小伙伴可以自行下載啦~下載資料的小伙伴還可以評(píng)論區(qū)回復(fù)領(lǐng)取5個(gè)積分哦1、HarmonyOS 職業(yè)認(rèn)證解讀:該主題是開(kāi)發(fā)者非常關(guān)注
    發(fā)表于 08-04 14:36

    c語(yǔ)言代碼自動(dòng)生成工具,MCU代碼自動(dòng)生成工具介紹

    MCU代碼自動(dòng)生成工具介紹文檔編輯原標(biāo)題:GoKit3二次開(kāi)發(fā)-代碼自動(dòng)生成工具介紹前文需知1.
    發(fā)表于 10-28 17:36 ?8次下載
    c語(yǔ)言<b class='flag-5'>代碼</b>自動(dòng)<b class='flag-5'>生成</b>工具,<b class='flag-5'>MCU</b><b class='flag-5'>代碼</b>自動(dòng)<b class='flag-5'>生成</b>工具介紹

    涂鴉標(biāo)準(zhǔn)模組MCU SDK開(kāi)發(fā)流程

    MCU SDK 是根據(jù)涂鴉 IoT 開(kāi)發(fā)平臺(tái)定義的產(chǎn)品功能,自動(dòng)生成MCU 代碼。目前主要支持的MC
    發(fā)表于 10-28 20:36 ?15次下載
    涂鴉標(biāo)準(zhǔn)模組<b class='flag-5'>MCU</b> SDK<b class='flag-5'>開(kāi)發(fā)</b>流程

    openEuler Summit開(kāi)發(fā)者峰會(huì):歐拉社區(qū)與開(kāi)發(fā)者持續(xù)活躍 原創(chuàng)項(xiàng)目代碼倉(cāng)新增50%

    openEuler Summit開(kāi)發(fā)者峰會(huì):歐拉社區(qū)與開(kāi)發(fā)者持續(xù)活躍,原創(chuàng)項(xiàng)目代碼倉(cāng)新增50%,多樣性算力多樣化場(chǎng)景的全方面發(fā)展。
    的頭像 發(fā)表于 11-10 10:17 ?1845次閱讀
    openEuler Summit<b class='flag-5'>開(kāi)發(fā)者</b>峰會(huì):歐拉社區(qū)與<b class='flag-5'>開(kāi)發(fā)者</b>持續(xù)活躍 原創(chuàng)項(xiàng)目<b class='flag-5'>代碼</b>倉(cāng)新增50%

    號(hào)稱(chēng)全球最強(qiáng)開(kāi)源模型 ——Qwen2.5 系列震撼來(lái)襲!PerfXCloud同步上線,快來(lái)體驗(yàn)!

    。PerfXCloud(澎峰云)大模型開(kāi)發(fā)與服務(wù)平臺(tái)第一時(shí)間支持 Qwen2.5 72B 并在平臺(tái)完成上線,趕快來(lái)體驗(yàn)吧! Qwen2.5系列模型 更大的訓(xùn)練數(shù)據(jù)集: Qwen2.5語(yǔ)
    的頭像 發(fā)表于 09-25 16:52 ?2674次閱讀
    號(hào)稱(chēng)全球最強(qiáng)開(kāi)源模型 ——<b class='flag-5'>Qwen2.5</b> 系列震撼來(lái)襲!PerfXCloud同步上線,快來(lái)體驗(yàn)!

    阿里云開(kāi)源Qwen2.5-Coder代碼模型系列

    Qwen2.5-Coder-32B-Instruct,代碼生成領(lǐng)域取得了顯著成就。據(jù)官方介紹,該模型EvalPlus等十多個(gè)主流的
    的頭像 發(fā)表于 11-14 11:28 ?1937次閱讀

    Qwen大模型助力開(kāi)發(fā)低成本AI推理方案

    阿里巴巴的開(kāi)源Qwen2.5模型近期AI領(lǐng)域引發(fā)了廣泛關(guān)注。這一大模型的推出,為斯坦福大學(xué)與伯克利大學(xué)的研究人員提供了強(qiáng)大的技術(shù)支持,使他們能夠成功開(kāi)發(fā)出低成本的AI推理模型。 據(jù)悉,斯坦福大學(xué)
    的頭像 發(fā)表于 02-12 09:19 ?1293次閱讀

    阿里巴巴Qwen大模型助力開(kāi)發(fā)低成本DeepSeek替代方案

    近日,阿里巴巴的開(kāi)源Qwen2.5模型AI領(lǐng)域再次展現(xiàn)其強(qiáng)大實(shí)力,為斯坦福大學(xué)與伯克利大學(xué)的研究人員提供了低成本的AI訓(xùn)練解決方案。借助這一技術(shù),兩所知名學(xué)府的研究團(tuán)隊(duì)成功開(kāi)發(fā)出價(jià)格低于50美元
    的頭像 發(fā)表于 02-12 13:42 ?1596次閱讀

    開(kāi)發(fā)者分享】開(kāi)源硬核玩家集結(jié):這些MCU板子泰酷了!

    前言本篇文章內(nèi)容主要收錄了由開(kāi)發(fā)者基于先楫半導(dǎo)體高性能MCU開(kāi)發(fā)的各類(lèi)DIY開(kāi)源硬件項(xiàng)目,涵蓋不同應(yīng)用方向與創(chuàng)意實(shí)踐。部分項(xiàng)目代碼可直接在本倉(cāng)庫(kù)下載,部分則由
    的頭像 發(fā)表于 05-26 17:31 ?1966次閱讀
    【<b class='flag-5'>開(kāi)發(fā)者</b>分享】開(kāi)源硬核玩家集結(jié):這些<b class='flag-5'>MCU</b>板子泰酷了!

    GTT2.5協(xié)議開(kāi)發(fā)者手冊(cè)解讀

    GTT2.5協(xié)議開(kāi)發(fā)者手冊(cè)解讀 一、GTT2.5協(xié)議簡(jiǎn)介 GTT 2.5命令協(xié)議是面向?qū)ο筌浖O(shè)計(jì)的一次進(jìn)化。它允許用戶(hù)通過(guò)RAM中存儲(chǔ)值
    的頭像 發(fā)表于 06-02 14:05 ?109次閱讀
    施甸县| 屯留县| 红桥区| 治县。| 积石山| 诸城市| 阳原县| 乡城县| 冀州市| 沾益县| 女性| 济源市| 盐津县| 子洲县| 搜索| 盐池县| 黄浦区| 兰考县| 肥西县| 灵山县| 天峨县| 大安市| 临洮县| 德昌县| 绩溪县| 营口市| 六盘水市| 方城县| 怀集县| 台南市| 舞钢市| 监利县| 白河县| 沽源县| 赞皇县| 蓝田县| 富源县| 海安县| 鲁甸县| 绥棱县| 洛浦县|