日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

端側(cè)AI算力新秀,RK182X系列算力卡如何讓大模型落地更簡(jiǎn)單?

飛凌嵌入式 ? 2026-06-05 14:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

當(dāng)下,邊緣AI全面進(jìn)入大語言模型+多模態(tài)感知深度融合階段,儲(chǔ)能、工業(yè)網(wǎng)關(guān)、智能機(jī)器人、視頻分析等場(chǎng)景,對(duì)本地實(shí)時(shí)推理、低延遲響應(yīng)、數(shù)據(jù)安全合規(guī)的需求爆發(fā)式增長(zhǎng)。但RK3588/RK3576/RK3568等主流主控,原生NPU算力有限、內(nèi)存帶寬不足,3B參數(shù)量以上的大模型跑不動(dòng)、響應(yīng)慢、并發(fā)差,“業(yè)務(wù)剛需猛、端側(cè)算力弱”的沖突日益尖銳。

瑞芯微推出了面向人工智能應(yīng)用的高性能RK182X系列算力卡,依托RKNN3 SDKV1.0.4的發(fā)布,為端側(cè)AI模型部署提供全棧式軟件支撐,在端側(cè)推理性能、模型適配、功能接口、推理精度上全方位升級(jí),兼具高性能、高適配、高能耗比優(yōu)勢(shì),即插即用補(bǔ)滿算力缺口,讓LLM/VLM在邊緣設(shè)備穩(wěn)定流暢落地!

文章配圖-1

一、20TOPS硬核算力,8B大模型端側(cè)推理無壓力

RK182X系列內(nèi)置多核RISC-V CPU與3D堆疊高帶寬DRAM,集成多核高算力NPU,峰值算力可達(dá)20TOPS且廣泛支持從INT4到FP16的多種計(jì)算精度,通過 PCIe/USB 接口與主控設(shè)備高速互聯(lián),支持從 0.5B 到 8B 多種參數(shù)量的大語言 / 多模態(tài)模型及傳統(tǒng) CNN 模型推理及本地化部署,專注于 AI 端側(cè)推理,不占主控資源,算力獨(dú)立輸出。

文章配圖-1

二、主流模型全覆蓋 ,打通算法生態(tài)壁壘

RK182X算力卡完成主流AI算法全適配,原生支持LLM大語言、VLM圖文多模態(tài)、CNN卷積網(wǎng)絡(luò)三類核心模型,覆蓋自然語言交互、跨模態(tài)圖文解析、圖像分類檢測(cè)、音頻信號(hào)處理等全場(chǎng)景AI應(yīng)用 ,算力調(diào)度穩(wěn)定、推理時(shí)延優(yōu)異,配套完備的模型編譯工具鏈,輕松實(shí)現(xiàn)模型量化轉(zhuǎn)換、適配優(yōu)化與嵌入式端快速投產(chǎn)。

文章配圖-1RK182X支持模型列表

三、兼容全主控+雙系統(tǒng),老設(shè)備零成本煥新算力

RK182X系列算力卡全兼容RK3588、RK3576、RK3568等瑞芯微主流主控,適配Linux/Android雙系統(tǒng),PCIe直插即用無需額外驅(qū)動(dòng)適配。依托該架構(gòu)設(shè)計(jì),產(chǎn)品實(shí)現(xiàn)跨主控、跨系統(tǒng)通用,存量在用設(shè)備可零改造升級(jí)AI大模型算力,無需更換主板、修改整機(jī)結(jié)構(gòu)、重新做產(chǎn)品認(rèn)證,老舊邊緣網(wǎng)關(guān)、工控主機(jī)、AI邊緣盒能夠低成本迭代升級(jí)為高性能AI推理終端,規(guī)避硬件換代帶來的高額改造成本與周期損耗。

文章配圖-1上圖為OK3588-C開發(fā)板搭配RK1828算力卡

以下為各主控平臺(tái)搭配RK182X算力卡前后大模型推理性能對(duì)比:

文章配圖-1

測(cè)試參數(shù)說明:

  • Input_Tokens和New_tokens分別代表輸入/輸出Tokens數(shù)量;
  • TPS:模型每秒能生成的token數(shù)量。

RK3568作為大批量商用落地平臺(tái),自帶1TOPS板載NPU,原生算力無法適配端側(cè)大模型推理場(chǎng)景;設(shè)備預(yù)留PCIe擴(kuò)展位,選配RK1820/RK1828算力卡后可新增20TOPS獨(dú)立NPU算力,存量整機(jī)無需改版,低成本完成算力擴(kuò)容,穩(wěn)定運(yùn)行大語言、多模態(tài)大模型。

軟件層面,飛凌嵌入式已完成RK182X全系列在Linux/Android雙系統(tǒng)的深度驅(qū)動(dòng)調(diào)試與全量算子落地驗(yàn)證:工業(yè)視覺、服務(wù)機(jī)器人(Linux端)、智能交互一體機(jī)、商用智慧屏(Android端)等多場(chǎng)景均可即插即用。單張算力卡可跨硬件平臺(tái)、跨操作系統(tǒng)復(fù)用,有效壓縮客戶備貨庫存、后期運(yùn)維成本,落地「一卡通用 ,舊機(jī)煥新」的邊緣算力升級(jí)方案。結(jié)合真實(shí)業(yè)務(wù)場(chǎng)景下的上下文尺寸和輸出長(zhǎng)度,RK182X算力卡搭配各RK主控平臺(tái)的各參數(shù)量LLM/VLM模型的端側(cè)推理實(shí)測(cè)性能數(shù)據(jù)見文末。

四、儲(chǔ)能行業(yè)私有化知識(shí)庫落地案

針對(duì)儲(chǔ)能BMS場(chǎng)景的儲(chǔ)能系統(tǒng)AI問答交互系統(tǒng)需求,飛凌嵌入式基于RK3588+RK1828算力卡打造儲(chǔ)能專屬私有化知識(shí)庫,集成語音識(shí)別ASR與語音合成TTS模塊支持全語音問答,支持多級(jí)BMS儲(chǔ)能設(shè)備實(shí)時(shí)運(yùn)行數(shù)據(jù)查詢和儲(chǔ)能系統(tǒng)故障智能診斷,精準(zhǔn)解析運(yùn)維人員的提問意圖,支持故障排查、數(shù)據(jù)查詢、分析建議等連續(xù)交互,端側(cè)離線部署無需聯(lián)網(wǎng),實(shí)現(xiàn)數(shù)據(jù)本地閉環(huán)、合規(guī)安全。

核心能力

  • 本地部署:數(shù)據(jù)不出場(chǎng)站,滿足電力儲(chǔ)能行業(yè)安全合規(guī)要求;
  • 高速響應(yīng):大語言模型端側(cè)推理輸出速度穩(wěn)定60+tokens/s,故障診斷、數(shù)據(jù)查詢實(shí)時(shí)輸出;
  • 開箱即用:支持知識(shí)庫快速導(dǎo)入、語音交互、自定義MCP、接口標(biāo)準(zhǔn)化。

演示畫面的截圖:

wKgZO2oiZu-AZCWWAAWc_bwNQsg292.pngwKgZO2oiZvWAHAn5AAW_WdS4tV4931.pngwKgZO2oiZweAd5KZAAfwXoJ6VzM002.pngwKgZO2oiZxGAG8SwAAgbdvtgNHs092.png

五、為什么選擇RK182X算力卡?

1. 即插即用

PCIe/USB雙接口 ,雙系統(tǒng)支持,部署周期縮短50%+。

2. 全平臺(tái)覆蓋

完美支持RK3588/3576/3568,存量設(shè)備一鍵升級(jí)算力。

3. 場(chǎng)景化方案

儲(chǔ)能、工業(yè)、機(jī)器人等垂直場(chǎng)景定制優(yōu)化,提供全套技術(shù)支持。

4. 穩(wěn)定可靠

工業(yè)級(jí)品質(zhì),批量交付有保障,技術(shù)團(tuán)隊(duì)全程護(hù)航。

RK182X系列算力卡真正解決端側(cè)大模型算力短缺,讓LLM/VLM本地跑得穩(wěn)、跑得快、用得起!

以下為RK182X算力卡搭配各RK主控平臺(tái)的LLM/VLM模型端側(cè)推理實(shí)測(cè)性能數(shù)據(jù):

Ubuntu系統(tǒng)RK3568+RK1828算力卡:

LLM模型端側(cè)推理核心性能數(shù)據(jù):

文章配圖-1

VLM模型端側(cè)推理核心性能數(shù)據(jù):

文章配圖-1

Ubuntu系統(tǒng)RK3576+RK1828算力卡:

LLM模型端側(cè)推理核心性能數(shù)據(jù):

文章配圖-2

VLM模型端側(cè)推理核心性能數(shù)據(jù):

文章配圖-1

Android系統(tǒng)RK3588+RK1828算力卡:

LLM模型端側(cè)推理核心性能數(shù)據(jù):

文章配圖-2

VLM模型端側(cè)推理核心性能數(shù)據(jù):

文章配圖-3

測(cè)試參數(shù)說明:

1.測(cè)試基于主控SOC+RK1820/RK1828,兩者之間通過PCIe連接;

2.TTFT:模型生成第一個(gè)token所需的時(shí)間;

3.TPOT:生成每個(gè)輸出token所需的平均時(shí)間;

4.TPS:模型每秒能生成的token數(shù)量;

5.VLM的Vision和LLM耗時(shí)為獨(dú)立測(cè)試。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5213

    文章

    20859

    瀏覽量

    339620
  • Linux
    +關(guān)注

    關(guān)注

    88

    文章

    11892

    瀏覽量

    220207
  • 人工智能
    +關(guān)注

    關(guān)注

    1822

    文章

    50630

    瀏覽量

    268335
  • 國(guó)產(chǎn)化
    +關(guān)注

    關(guān)注

    0

    文章

    154

    瀏覽量

    8522
  • AI算力
    +關(guān)注

    關(guān)注

    1

    文章

    203

    瀏覽量

    10078
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI網(wǎng)絡(luò):大模型時(shí)代的飛躍與高效部署

    模型時(shí)代AI網(wǎng)絡(luò)如何決定GPU訓(xùn)練效率?本文深度解析智網(wǎng)絡(luò)四大平面、無損網(wǎng)絡(luò)核心技術(shù)及萬集群
    的頭像 發(fā)表于 06-08 16:36 ?426次閱讀
    <b class='flag-5'>AI</b>智<b class='flag-5'>算</b>網(wǎng)絡(luò):大<b class='flag-5'>模型</b>時(shí)代的<b class='flag-5'>算</b><b class='flag-5'>力</b>飛躍與高效部署

    技術(shù)分享 | RK182X 如何在 RK3588 上進(jìn)行應(yīng)用測(cè)試

    過去兩年,我們?cè)诖?b class='flag-5'>模型上的焦慮往往源于“連接”——網(wǎng)絡(luò)頓、數(shù)據(jù)泄露、按量付費(fèi)的賬單。但瑞芯微在2025年三季度發(fā)布的RK182X,或許能讓我們松一口氣。這顆全球首款3D封裝
    的頭像 發(fā)表于 06-04 17:28 ?456次閱讀
    技術(shù)分享 | <b class='flag-5'>RK182X</b> 如何在 <b class='flag-5'>RK</b>3588 上進(jìn)行應(yīng)用測(cè)試

    側(cè)AI破局,RK182X系列如何模型落地簡(jiǎn)單

    3576/RK3568等主流主控,原生NPU有限、內(nèi)存帶寬不足,3B參數(shù)量以上的大模型跑不動(dòng)、響應(yīng)慢、并發(fā)差,“業(yè)務(wù)剛需猛、
    的頭像 發(fā)表于 06-04 11:09 ?1818次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>破局,<b class='flag-5'>RK182X</b><b class='flag-5'>系列</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>卡</b>如何<b class='flag-5'>讓</b>大<b class='flag-5'>模型</b><b class='flag-5'>落地</b><b class='flag-5'>更</b><b class='flag-5'>簡(jiǎn)單</b>?

    安謀科技“周易”X3 NPU R2升級(jí),最高翻倍+密度躍升

    X3系列NPU在智能座艙、AI推理加速芯片及新興市場(chǎng)等多領(lǐng)域的落地案例。 1、“周易”X3 R2版本升級(jí),最高
    的頭像 發(fā)表于 05-18 15:02 ?197次閱讀
    安謀科技“周易”<b class='flag-5'>X</b>3 NPU R2升級(jí),最高<b class='flag-5'>算</b><b class='flag-5'>力</b>翻倍+<b class='flag-5'>算</b><b class='flag-5'>力</b>密度躍升

    想用RK3588在邊緣跑大模型?你的還差多少?

    在邊緣計(jì)算與嵌入式AI應(yīng)用飛速發(fā)展的今天,瑞芯微RK3588平臺(tái)憑借其強(qiáng)大的多媒體處理能力和6TOPS的NPU,已成為高端AIoT項(xiàng)目的首選之一。然而,面對(duì)日益復(fù)雜的大
    的頭像 發(fā)表于 04-10 17:31 ?2970次閱讀
    想用<b class='flag-5'>RK</b>3588在邊緣<b class='flag-5'>端</b>跑大<b class='flag-5'>模型</b>?你的<b class='flag-5'>算</b><b class='flag-5'>力</b>還差多少?

    國(guó)產(chǎn)RK182X協(xié)處理器 + RK3588實(shí)測(cè),大模型“極速流暢”

    是瑞芯微針對(duì)側(cè)AI模型推出的協(xié)處理器,它在性能與成本之間取得了出色平衡。它采用先進(jìn)3D堆
    的頭像 發(fā)表于 03-13 11:05 ?926次閱讀
    國(guó)產(chǎn)<b class='flag-5'>RK182X</b><b class='flag-5'>算</b><b class='flag-5'>力</b>協(xié)處理器 + <b class='flag-5'>RK</b>3588實(shí)測(cè),大<b class='flag-5'>模型</b>“極速流暢”

    邊緣AI臨界點(diǎn):深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價(jià)值

    、內(nèi)存革命:48GB/96GB LPDDR4X 背后的帶寬博弈 很多開發(fā)者容易陷入唯論的誤區(qū),但在實(shí)際部署大模型時(shí),內(nèi)存容量和帶寬往往是真正的性能瓶頸。OrangePi
    發(fā)表于 03-10 14:19

    Hailo-8 + RK3588實(shí)測(cè)!26TOPS加持,助力AI視覺升級(jí)!

    近年來,AI視覺在邊緣應(yīng)用廣泛,行業(yè)對(duì)AI推理硬件的要求也日益提升。傳統(tǒng)CPU在CNN等視覺模型推理任務(wù)中逐漸顯露瓶頸,而專用AI加速器成
    的頭像 發(fā)表于 03-02 16:46 ?652次閱讀
    Hailo-8<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>卡</b> + <b class='flag-5'>RK</b>3588實(shí)測(cè)!26TOPS加持,助力<b class='flag-5'>AI</b>視覺升級(jí)!

    瑞芯微RK182X全面適配主流多模態(tài)大模型

    在全球側(cè)人工智能加速滲透的今天, “生態(tài)適配廣度”與“場(chǎng)景落地深度”正成為衡量側(cè)AI平臺(tái)核心
    的頭像 發(fā)表于 01-27 16:16 ?1349次閱讀

    應(yīng)對(duì)側(cè)AI、內(nèi)存、功耗“三堵墻”困境,安謀科技Arm China “周易”X3給出技術(shù)錦囊

    AI模型正加速?gòu)脑贫讼蜻吘壟c側(cè)滲透,然而,、內(nèi)存、功耗等卻成了制約其規(guī)?;?/div>
    的頭像 發(fā)表于 12-18 13:45 ?649次閱讀
    應(yīng)對(duì)<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>、內(nèi)存、功耗“三堵墻”困境,安謀科技Arm China “周易”<b class='flag-5'>X</b>3給出技術(shù)錦囊

    引領(lǐng)側(cè)模型落地!Firefly-RK182X 開發(fā)套件上線發(fā)售

    海量參數(shù)的大模型AI行業(yè)帶來顛覆性的體驗(yàn),然而在側(cè)設(shè)備中,由于有限的DRAM帶寬、硬件、
    的頭像 發(fā)表于 11-26 16:33 ?3081次閱讀
    引領(lǐng)<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>大<b class='flag-5'>模型</b><b class='flag-5'>落地</b>!Firefly-<b class='flag-5'>RK182X</b> 開發(fā)套件上線發(fā)售

    湘軍,變成生產(chǎn)?

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領(lǐng)域,全力推動(dòng)AI邊緣計(jì)算行業(yè)的深度發(fā)展。隨著AI技術(shù)的不斷演進(jìn)和物聯(lián)網(wǎng)應(yīng)用的持續(xù)拓展,騰視科技的
    的頭像 發(fā)表于 09-19 15:26 ?2356次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領(lǐng)域,全力推動(dòng)AI邊緣計(jì)算行業(yè)的深度發(fā)展。隨著AI技術(shù)的不斷演進(jìn)和物聯(lián)網(wǎng)應(yīng)用的持續(xù)拓展,騰視科技的
    的頭像 發(fā)表于 09-19 15:25 ?1266次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    米爾RK3576部署側(cè)多模態(tài)多輪對(duì)話,6TOPS驅(qū)動(dòng)30億參數(shù)LLM

    滲透到智能家居、工業(yè)質(zhì)檢、穿戴設(shè)備等千萬級(jí)場(chǎng)景中。RK3576 的多模態(tài)交互對(duì)話方案,其價(jià)值遠(yuǎn)不止 “實(shí)現(xiàn)了一項(xiàng)技術(shù)”,更在于提供了一套 “適配 - 工程封裝 - 二次拓展” 的
    發(fā)表于 09-05 17:25
    崇信县| 游戏| 全州县| 临桂县| 宁明县| 泊头市| 南部县| 宿松县| 新蔡县| 定结县| 临朐县| 台前县| 株洲县| 宝坻区| 海兴县| 娄烦县| 黄骅市| 隆尧县| 抚松县| 河曲县| 津南区| 盐池县| 阿鲁科尔沁旗| 昌邑市| 上饶县| 赤城县| 静乐县| 永善县| 建水县| 聂荣县| 莱阳市| 贵定县| 大英县| 房山区| 泰安市| 改则县| 治多县| 朔州市| 昌江| 德清县| 华安县|