日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從視覺(jué)檢測(cè)到多模態(tài)交互:RK1820如何賦能下一代智能嵌入式設(shè)備?

合眾恒躍 ? 2026-03-02 11:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

對(duì)于嵌入式AI開(kāi)發(fā)者而言,最具挑戰(zhàn)性的莫過(guò)于模型選型與部署。面對(duì)層出不窮的AI模型,哪些能夠高效運(yùn)行在RK3588、RK182X等瑞芯微平臺(tái)?如何在性能與功耗之間取得平衡?哪些模型在視覺(jué)檢測(cè)、機(jī)器人交互等實(shí)際場(chǎng)景中表現(xiàn)最優(yōu)?本文整理了9款主流AI模型的完整部署方案,覆蓋多模態(tài)對(duì)話、目標(biāo)檢測(cè)、圖像分類三大核心場(chǎng)景。每個(gè)模型均提供可直接運(yùn)行的代碼及實(shí)測(cè)效果展示,無(wú)論是新手還是資深開(kāi)發(fā)者,都可以快速上手。

重點(diǎn)提示:本文所有模型均已適配RKNN框架,可直接調(diào)用RK3588/RK182X的NPU資源,無(wú)需復(fù)雜適配,復(fù)制代碼即可運(yùn)行~

一、多模態(tài)對(duì)話模型:端側(cè)實(shí)現(xiàn)圖文交互自由

多模態(tài)是當(dāng)下AI的核心趨勢(shì),這三款輕量級(jí)模型,讓你的嵌入式設(shè)備既能“看懂圖”,也能“聊得來(lái)”,無(wú)需依賴云端,本地就能實(shí)現(xiàn)實(shí)時(shí)交互。

1. InternVL3-2B:2B規(guī)模多模態(tài)天花板

由上海人工智能實(shí)驗(yàn)室開(kāi)發(fā),是2B參數(shù)級(jí)開(kāi)源多模態(tài)模型中的佼佼者,專門為端側(cè)設(shè)備優(yōu)化,完美適配RK3588/RK182X平臺(tái)。

核心優(yōu)勢(shì):融合高性能視覺(jué)編碼器與輕量化語(yǔ)言模型,支持動(dòng)態(tài)高分辨率輸入,能精準(zhǔn)捕捉OCR文字、復(fù)雜圖表細(xì)節(jié);2B參數(shù)量平衡顯存占用與推理速度,適合本地化視覺(jué)對(duì)話、智能監(jiān)控分析。

關(guān)鍵實(shí)操

wKgZPGmlBLWAQNLIAABjtlGLUYk769.png

運(yùn)行亮點(diǎn):視覺(jué)延遲僅267.66ms,F(xiàn)PS達(dá)3.74,能精準(zhǔn)描述圖像內(nèi)容,支持多輪圖文對(duì)話,OCR識(shí)別精度拉滿。


2. Qwen2.5-1.5B-Instruct:輕量級(jí)對(duì)話“小鋼炮”

阿里巴巴通義千問(wèn)團(tuán)隊(duì)出品,1.54B參數(shù)量,卻能超越部分7B模型性能,是端側(cè)對(duì)話場(chǎng)景的首選。

核心優(yōu)勢(shì):INT4量化后顯存占用極低,適配RK3588的NPU,邊緣側(cè)實(shí)現(xiàn)“秒回”;支持128K長(zhǎng)上下文,數(shù)學(xué)解題、代碼編寫(xiě)能力突出,還能支持29種語(yǔ)言,適配多場(chǎng)景需求。

關(guān)鍵實(shí)操

wKgZO2mlBMuAV_IoAAA3_Y0lWyg391.png

3. Qwen3-1.7B-Instruct:新一代端側(cè)對(duì)話標(biāo)桿

通義千問(wèn)最新迭代款,1.7B參數(shù)量精準(zhǔn)卡位端側(cè),引入動(dòng)態(tài)權(quán)重分配與增強(qiáng)型注意力機(jī)制,邏輯推理能力大幅提升。

核心優(yōu)勢(shì):通過(guò)KV Cache內(nèi)存占用優(yōu)化,在RK3588/RK182X平臺(tái)實(shí)現(xiàn)顯著的低功耗高速推理;具備強(qiáng)大的復(fù)雜指令跟隨與長(zhǎng)文本處理能力,同時(shí)完美適配視覺(jué)編碼器,可作為多模態(tài)系統(tǒng)的本地化語(yǔ)言中樞。

關(guān)鍵實(shí)操

wKgZPGmlBNyAHJMxAABFPw9_qGU939.png

運(yùn)行亮點(diǎn):生成速度達(dá)95.45 Tokens/秒,能穩(wěn)定輸出結(jié)構(gòu)化數(shù)據(jù)(如JSON),完美對(duì)接ROS 2機(jī)器人系統(tǒng),實(shí)現(xiàn)自然語(yǔ)言轉(zhuǎn)控制指令。

二、目標(biāo)檢測(cè)模型:實(shí)時(shí)識(shí)別,工業(yè)級(jí)落地首選

目標(biāo)檢測(cè)是嵌入式AI最常用的場(chǎng)景,無(wú)論是智能安防、機(jī)器人避障,還是工業(yè)質(zhì)檢,這3款模型都能滿足需求,尤其適配RK3588的NPU加速,推理速度拉滿。

1. YOLOv5s:目標(biāo)檢測(cè)“常青樹(shù)”

Ultralytics團(tuán)隊(duì)出品,輕量化版本,14MB左右的權(quán)重文件,是工業(yè)界和學(xué)術(shù)界應(yīng)用最廣泛的目標(biāo)檢測(cè)模型。

核心優(yōu)勢(shì):采用CSP結(jié)構(gòu)和PANet路徑聚合網(wǎng)絡(luò),計(jì)算量小、速度快;INT4/INT8量化后,在RK3588上FPS輕松突破100幀,實(shí)時(shí)性拉滿;社區(qū)生態(tài)豐富,可輕松進(jìn)行定制化訓(xùn)練。

關(guān)鍵實(shí)操

wKgZO2mlBP-AU57aAABOB6yssNc481.png

適用場(chǎng)景:智能安防(人員入侵、車輛識(shí)別)、機(jī)器人視覺(jué)避障、工業(yè)質(zhì)檢(產(chǎn)品缺陷識(shí)別)。

2. YOLOv6s:工業(yè)級(jí)高精度之選

美團(tuán)視覺(jué)智能部研發(fā),專為工業(yè)應(yīng)用設(shè)計(jì),平衡計(jì)算效率與檢測(cè)精度,在硬件推理平臺(tái)上表現(xiàn)突出。

核心優(yōu)勢(shì):采用RepVGG-style參數(shù)化主干網(wǎng)絡(luò),推理時(shí)結(jié)構(gòu)簡(jiǎn)化,速度極快;解耦檢測(cè)頭提升邊界框定位精度,SimOTA算法優(yōu)化小目標(biāo)檢測(cè);適配RKNN-Toolkit2,與ROS 2機(jī)器人感知系統(tǒng)兼容性強(qiáng)。

關(guān)鍵實(shí)操

wKgZO2mlBRGAKhw0AABSSNqdwpY361.png

3. FasterVLM:多模態(tài)實(shí)時(shí)場(chǎng)景解析

專注于邊緣側(cè)多模態(tài)推理,打破“大模型跑不動(dòng)”的僵局,能快速實(shí)現(xiàn)圖文交互與場(chǎng)景解析,完美適配RK3588平臺(tái),可實(shí)現(xiàn)接近實(shí)時(shí)的交互體驗(yàn)。

核心優(yōu)勢(shì):采用輕量級(jí)視覺(jué)+語(yǔ)言架構(gòu),優(yōu)化特征對(duì)齊模塊,降低計(jì)算開(kāi)銷;首Token響應(yīng)速度快,功耗低,適合機(jī)器人、無(wú)人機(jī)、智能頭顯等移動(dòng)設(shè)備;支持看圖說(shuō)話、視覺(jué)問(wèn)答,能識(shí)別復(fù)雜場(chǎng)景邏輯。

關(guān)鍵實(shí)操

wKgZPGmlBSuAXeISAABh5CUt03c444.png

運(yùn)行亮點(diǎn):視覺(jué)延遲150.21ms,F(xiàn)PS達(dá)6.66,能精準(zhǔn)描述復(fù)雜場(chǎng)景細(xì)節(jié),適合自動(dòng)化巡檢、智能安防等場(chǎng)景。

三、圖像分類模型:輕量高效,適配端側(cè)資源

圖像分類是AI視覺(jué)的基礎(chǔ),這3款模型各有側(cè)重,從超輕量到高精度全覆蓋,完美適配RK3588/RK182X的硬件資源,滿足不同場(chǎng)景的分類需求。

1. ResNet50v2:工業(yè)級(jí)高精度特征提取

微軟研究院推出,殘差網(wǎng)絡(luò)的改進(jìn)版本,50層深度,解決梯度消失問(wèn)題,特征提取能力強(qiáng),是工業(yè)級(jí)場(chǎng)景的首選。

核心優(yōu)勢(shì):預(yù)激活結(jié)構(gòu)讓梯度傳遞更順暢,恒等映射降低深層模型訓(xùn)練難度;NPU適配極佳,INT8量化后吞吐量高,常作為目標(biāo)檢測(cè)、語(yǔ)義分割的基礎(chǔ)骨干網(wǎng)絡(luò)。

關(guān)鍵實(shí)操

wKgZO2mlBUyAFH30AABQTfNCPUk719.png

適用場(chǎng)景:工業(yè)質(zhì)檢、醫(yī)療影像、高精度圖像分類。

2. MobileNetV1:輕量級(jí)分類鼻祖

Google團(tuán)隊(duì)出品,徹底打破“高性能依賴大參數(shù)”的認(rèn)知,專為移動(dòng)端和嵌入式設(shè)備設(shè)計(jì),結(jié)構(gòu)簡(jiǎn)單、效率極高。

核心優(yōu)勢(shì):采用深度可分離卷積,計(jì)算量?jī)H為標(biāo)準(zhǔn)卷積的1/9,精度輕微下降;NPU適配性極佳,INT8量化后單幀推理延遲毫秒級(jí),模型文件極小,節(jié)省存儲(chǔ)空間。

關(guān)鍵實(shí)操

wKgZO2mlBZeAOuoSAABTgF9qS_c165.png

3. MobileNetV2:端側(cè)主流骨干網(wǎng)絡(luò)

MobileNetV1的升級(jí)款,Google推出的第二代輕量級(jí)模型,準(zhǔn)確率更高、推理延遲更低,是目前端側(cè)最主流的特征提取網(wǎng)絡(luò)。

核心優(yōu)勢(shì):采用倒殘差結(jié)構(gòu)和線性瓶頸,有效利用計(jì)算資源,避免信息損失;與SSDLite搭配,可實(shí)現(xiàn)輕量級(jí)目標(biāo)檢測(cè);內(nèi)存占用低,無(wú)縫適配RK3588/RK182X等邊緣芯片的資源限制,大幅降低移植與部署門檻。

關(guān)鍵實(shí)操

wKgZPGmlBaaAMGD8AABT5MP-CT4844.png

多模態(tài)對(duì)話/圖文交互:優(yōu)先選Qwen3-1.7B(邏輯強(qiáng)、適配ROS 2),追求高精度選InternVL3-2B,追求速度選FasterVLM;

實(shí)時(shí)目標(biāo)檢測(cè):工業(yè)場(chǎng)景選YOLOv6s(高精度),通用場(chǎng)景選YOLOv5s(易上手、生態(tài)好);

圖像分類/特征提取:高精度選ResNet50v2,輕量高速選MobileNetV2,極致輕量化選MobileNetV1;

RK182X/RK3588適配:所有模型均已適配RKNN框架,優(yōu)先選擇參數(shù)量≤2B的模型(如Qwen2.5-1.5B、MobileNet系列),功耗更低、運(yùn)行更流暢。

嵌入式AI部署的核心是“選對(duì)模型+高效適配”,這9款模型覆蓋了從基礎(chǔ)分類到復(fù)雜多模態(tài)的全場(chǎng)景,無(wú)論是新手入門還是項(xiàng)目落地,都能找到合適的選擇。

HZ-RK1820協(xié)處理器近期上新,敬請(qǐng)期待...

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 半導(dǎo)體
    +關(guān)注

    關(guān)注

    339

    文章

    31279

    瀏覽量

    266743
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31494

    瀏覽量

    223820
  • 嵌入式設(shè)備
    +關(guān)注

    關(guān)注

    0

    文章

    126

    瀏覽量

    17750
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4116

    瀏覽量

    99649
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    DSP Concepts與AMD助力打造下一代汽車音頻

    DSP Concepts 與 AMD 正在將 Audio Weaver 嵌入式音頻框架引入 AMD 銳龍 AI 嵌入式 P100 系列處理器——從而實(shí)現(xiàn)下一代沉浸車載音頻與數(shù)字座艙體
    的頭像 發(fā)表于 03-19 09:40 ?4438次閱讀

    嵌入式視覺(jué)技術(shù)工業(yè)自動(dòng)化領(lǐng)域變革

    機(jī)器視覺(jué)(Machine Vision)是實(shí)現(xiàn)非接觸檢測(cè)和高度柔性生產(chǎn)的關(guān)鍵技術(shù),其主要功能可歸納為識(shí)別、測(cè)量、檢測(cè)以及定位與引導(dǎo)等四類。嵌入式
    的頭像 發(fā)表于 03-06 09:28 ?1079次閱讀
    <b class='flag-5'>嵌入式</b><b class='flag-5'>視覺(jué)</b>技術(shù)<b class='flag-5'>賦</b><b class='flag-5'>能</b>工業(yè)自動(dòng)化領(lǐng)域變革

    “連接”到“管理”,工業(yè)智能網(wǎng)關(guān)如何設(shè)備監(jiān)控與智慧運(yùn)維?

    智慧的“大腦”。對(duì)此,物通博聯(lián)提供工業(yè)智能網(wǎng)關(guān),工業(yè)設(shè)備“沉默運(yùn)行”到“主動(dòng)表達(dá)”。 工業(yè)智能
    的頭像 發(fā)表于 01-12 13:39 ?377次閱讀
    <b class='flag-5'>從</b>“連接”到“管理”,工業(yè)<b class='flag-5'>智能</b>網(wǎng)關(guān)如何<b class='flag-5'>賦</b><b class='flag-5'>能</b><b class='flag-5'>設(shè)備</b>監(jiān)控與智慧運(yùn)維?

    低功耗工業(yè)圖像采集卡 | 節(jié)能設(shè)計(jì),適配嵌入式工業(yè)設(shè)備

    嵌入式工業(yè)設(shè)備的嚴(yán)苛運(yùn)行需求,為工業(yè)檢測(cè)、智能機(jī)器人、便攜檢測(cè)終端等場(chǎng)景提供高效、穩(wěn)定的圖像采集解決方案。核心優(yōu)勢(shì):低功耗設(shè)計(jì),
    的頭像 發(fā)表于 12-22 18:05 ?1116次閱讀
    低功耗工業(yè)圖像采集卡 | 節(jié)能設(shè)計(jì),適配<b class='flag-5'>嵌入式</b>工業(yè)<b class='flag-5'>設(shè)備</b>

    Amphenol 4 端口千兆以太網(wǎng)交換機(jī):適用于下一代無(wú)人機(jī)、機(jī)器人和嵌入式應(yīng)用

    Amphenol 4 端口千兆以太網(wǎng)交換機(jī):適用于下一代無(wú)人機(jī)、機(jī)器人和嵌入式應(yīng)用 在電子工程領(lǐng)域,為下一代無(wú)人機(jī)、機(jī)器人和嵌入式應(yīng)用開(kāi)發(fā)先進(jìn)的網(wǎng)絡(luò)解決方案至關(guān)重要。Amphenol
    的頭像 發(fā)表于 12-10 15:25 ?611次閱讀

    Firefly 推出基于 RK1820 / RK1828 的開(kāi)發(fā)套件與 AI NVR 服務(wù)器

    RK1820/RK1828是瑞芯微面向AI時(shí)代推出的算力協(xié)處理器,采用先進(jìn)的3D堆疊封裝技術(shù),集成高帶寬嵌入式片內(nèi)DRAM(2.5GB/5GB版本),端側(cè)生成速率超100tokens/s,端到端延遲
    的頭像 發(fā)表于 11-05 18:52 ?6134次閱讀
    Firefly 推出基于 <b class='flag-5'>RK1820</b> / <b class='flag-5'>RK</b>1828 的開(kāi)發(fā)套件與 AI NVR 服務(wù)器

    工業(yè)視覺(jué)網(wǎng)關(guān):RK3576多路檢測(cè)與邊緣AI

    ~150ms6TOPS NPU 邊緣AI推理易對(duì)接 MES / 追溯系統(tǒng) 、產(chǎn)線痛點(diǎn):“人看”到“機(jī)判”的轉(zhuǎn)變· 工位/多角度同步:?jiǎn)螜C(jī)位覆蓋不足,典型項(xiàng)目需 8~12 路并發(fā),且畫(huà)面時(shí)序
    發(fā)表于 10-16 17:56

    RK3399:性能與效的嵌入式先鋒,解鎖場(chǎng)景應(yīng)用潛力

    在尋求卓越性能與出色效平衡的嵌入式計(jì)算和智能設(shè)備領(lǐng)域,瑞芯微(Rockchip)推出的RK3399處理器無(wú)疑是
    的頭像 發(fā)表于 09-26 14:30 ?1326次閱讀
    <b class='flag-5'>RK</b>3399:性能與<b class='flag-5'>能</b>效的<b class='flag-5'>嵌入式</b>先鋒,解鎖<b class='flag-5'>多</b>場(chǎng)景應(yīng)用潛力

    瑞迅科技AI產(chǎn)品矩陣精彩亮相 | 瑞芯微全新端側(cè)協(xié)處理器RK1820 昇騰新品全球首發(fā)

    9月23日,第25屆中國(guó)國(guó)際工業(yè)博覽會(huì)(上海)在國(guó)家會(huì)展中心盛大開(kāi)幕!此次展會(huì),瑞迅科技展臺(tái)全球首發(fā)基于華為昇騰平臺(tái)的AI新品&瑞芯微全新端側(cè)協(xié)處理器RK1820,展出了邊端側(cè)AI的場(chǎng)景創(chuàng)新
    的頭像 發(fā)表于 09-25 11:29 ?1565次閱讀
    瑞迅科技AI產(chǎn)品矩陣精彩亮相 | 瑞芯微全新端側(cè)協(xié)處理器<b class='flag-5'>RK1820</b> 昇騰新品全球首發(fā)

    用于下一代 GGE 和 HSPA 手機(jī)的模式/頻段功率放大器模塊 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()用于下一代 GGE 和 HSPA 手機(jī)的模式/頻段功率放大器模塊相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有用于下一代 GGE 和 HSPA 手機(jī)的
    發(fā)表于 09-08 18:33
    用于<b class='flag-5'>下一代</b> GGE 和 HSPA 手機(jī)的<b class='flag-5'>多</b>模式/<b class='flag-5'>多</b>頻段功率放大器模塊 skyworksinc

    適用于下一代 GGE 和 HSPA 手機(jī)的模/頻段 PAM skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()適用于下一代 GGE 和 HSPA 手機(jī)的模/頻段 PAM相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有適用于下一代 GGE 和 HSPA 手機(jī)的
    發(fā)表于 09-05 18:34
    適用于<b class='flag-5'>下一代</b> GGE 和 HSPA 手機(jī)的<b class='flag-5'>多</b>模/<b class='flag-5'>多</b>頻段 PAM skyworksinc

    米爾RK3576部署端側(cè)模態(tài)輪對(duì)話,6TOPS算力驅(qū)動(dòng)30億參數(shù)LLM

    滲透到智能家居、工業(yè)質(zhì)檢、穿戴設(shè)備等千萬(wàn)級(jí)場(chǎng)景中。RK3576 的模態(tài)交互對(duì)話方案,其價(jià)值遠(yuǎn)不
    發(fā)表于 09-05 17:25

    SiLM92108-232EW-AQ 高度集成8路智能半橋驅(qū)動(dòng)器,下一代車身域控系統(tǒng)

    : SiLM92108-232EW-AQ的核心價(jià)值在于其突破性的高集成度、智能自適應(yīng)的驅(qū)動(dòng)性能以及完備的診斷保護(hù)功能,為下一代集中式車身域控制器(BDU)提供了高度優(yōu)化、安全可靠的驅(qū)動(dòng)解決方案。#車身域控 #電機(jī)驅(qū)動(dòng) #SiLM92108 #
    發(fā)表于 08-29 08:38

    飛凌嵌入式RK3576模態(tài)大模型圖像理解助手,讓嵌入式設(shè)備“看懂”世界

    (LLM)+視覺(jué)語(yǔ)言模型(VLM)模態(tài)架構(gòu),推出模態(tài)大模型圖像理解助手,為嵌入式
    的頭像 發(fā)表于 07-25 11:09 ?1840次閱讀
    飛凌<b class='flag-5'>嵌入式</b><b class='flag-5'>RK</b>3576<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大模型圖像理解助手,讓<b class='flag-5'>嵌入式</b><b class='flag-5'>設(shè)備</b>“看懂”世界

    汽車模態(tài)交互測(cè)試:智能交互的深度驗(yàn)證

    在汽車智能座艙測(cè)試的關(guān)鍵進(jìn)程中,北京沃華慧通測(cè)控技術(shù)有限公司展現(xiàn)出了獨(dú)特的價(jià)值與優(yōu)勢(shì)。作為家專注于測(cè)控技術(shù)領(lǐng)域的企業(yè),沃華慧通在智能座艙測(cè)試方面積累了豐富的經(jīng)驗(yàn)和專業(yè)的技術(shù)能力。其研發(fā)的測(cè)試
    的頭像 發(fā)表于 06-25 09:00 ?1553次閱讀
    汽車<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>交互</b>測(cè)試:<b class='flag-5'>智能</b><b class='flag-5'>交互</b>的深度驗(yàn)證
    绵阳市| 抚远县| 汉中市| 庆安县| 宁强县| 凤庆县| 垦利县| 顺平县| 桦南县| 太谷县| 江北区| 特克斯县| 靖边县| 黄大仙区| 岐山县| 化德县| 利辛县| 防城港市| 永嘉县| 辽宁省| 鹤山市| 苍南县| 河间市| 安宁市| 双鸭山市| 阿尔山市| 桦甸市| 泗水县| 马山县| 张家口市| 稻城县| 巫溪县| 额济纳旗| 安化县| 米林县| 万宁市| 宁河县| 连江县| 阜平县| 桂平市| 财经|