日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RV1126 開發(fā)OCR文字識別算法組件

ljx2016 ? 來源:ljx2016 ? 作者:ljx2016 ? 2025-04-16 09:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. OCR文字識別簡介

文字識別也是圖像領(lǐng)域一個常見問題。然而,對于自然場景圖像,首先要定位圖像中的文字位置,然后才能進行文字的識別。所以一般包含兩個步驟:

文字檢測:解決的問題是哪里有文字,文字的范圍有多少。

文字識別:對定位好的文字區(qū)域進行識別,主要解決的問題是每個文字是什么,將圖像中的文字區(qū)域進轉(zhuǎn)化為字符信息。

我們的OCR算法是基于CTPN+CRNN設(shè)計的。CTPN是一種文字檢測算法,能有效的檢測出復(fù)雜場景的橫向分布的文字,是目前比較好的文字檢測算法。CRNN算法主要用于端到端地對不定長的文本序列進行識別,不用先對單個文字進行切割,而是將文本識別轉(zhuǎn)化為時序依賴的序列學(xué)習(xí)問題,就是基于圖像的序列識別。

基于EASY-EAI-Nano硬件主板的運行效率:

算法種類 模型大小 運行效率
文字檢測算法 2.79MB 227ms
文字識別算法 4.56MB 89ms

2. 快速上手

2.1 開發(fā)環(huán)境準備

如果您初次閱讀此文檔,請閱讀《入門指南/開發(fā)環(huán)境準備/Easy-Eai編譯環(huán)境準備與更新》,并按照其相關(guān)的操作,進行編譯環(huán)境的部署。

在PC端Ubuntu系統(tǒng)中執(zhí)行run腳本,進入EASY-EAI編譯環(huán)境,具體如下所示。

cd ~/develop_environment ./run.sh

wKgZO2f_BEyAOsEAAACbrHAYX20186.png

2.2 源碼下載以及例程編譯

在EASY-EAI編譯環(huán)境下創(chuàng)建存放源碼倉庫的管理目錄:

cd /opt mkdir EASY-EAI-Toolkit cd EASY-EAI-Toolkit

通過git工具,在管理目錄內(nèi)克隆遠程倉庫

git clone https://github.com/EASY-EAI/EASY-EAI-Toolkit-C-Demo.git

wKgZPGf_BE2AHbU7AADL06HcVzc386.png

注:

* 此處可能會因網(wǎng)絡(luò)原因造成卡頓,請耐心等待。

* 如果實在要在gitHub網(wǎng)頁上下載,也要把整個倉庫下載下來,不能單獨下載本實例對應(yīng)的目錄。

進入到對應(yīng)的例程目錄執(zhí)行編譯操作,具體命令如下所示:

cd EASY-EAI-Toolkit-C-Demo/algorithm-ocr/ ./build.sh

注:

* 若build.sh腳本帶有cpres參數(shù),則會把Release/目錄下的所有資源都拷貝到開發(fā)板上。

* 若build.sh腳本不帶任何參數(shù),則僅會拷貝demo編譯出來的可執(zhí)行文件。

* 由于依賴庫部署在板卡上,因此交叉編譯過程中必須保持adb連接。

wKgZO2f_BE2ABJMwAAGE7T_LyXI914.png

2.3 模型部署

要完成算法Demo的執(zhí)行,需要先下載算法模型。

百度網(wǎng)盤鏈接為:https://pan.baidu.com/s/1w4tf1YolUCpcAFtyP3aJZQ (提取碼:6666 )。

wKgZPGf_BE2AW-E3AAASX4aXfzE122.png

同時需要把下載的OCR識別算法模型復(fù)制粘貼到Release/目錄:

wKgZO2f_BE2AS6QJAABsoqMXJ3w667.png

再通過下方命令將模型署到板卡中,如下所示。

cp Release/ /mnt/userdata/ -rf

2.4 例程運行

通過按鍵Ctrl+Shift+T創(chuàng)建一個新窗口,執(zhí)行adb shell命令,進入板卡運行環(huán)境。

adb shell

wKgZPGf_BE6ABm0gAABc3DEXVxM480.png

進入板卡后,定位到例程上傳的位置,如下所示:

cd /userdata/Release/

運行例程命令如下所示:

./test-ocr test.jpg

2.5 運行效果

test-ocr的Demo執(zhí)行效果如下所示:

wKgZO2f_BE6AALDhAAG-6Ctw4HY520.png

再開一個窗口,在PC端Ubuntu環(huán)境通過以下命令可以把圖片拉回來:

adb pull /userdata/Demo/result.jpg .

結(jié)果圖片如下所示:

wKgZPGf_BE6AVpjNAAEj4BcK8uY110.jpg

API的詳細說明,以及API的調(diào)用(本例程源碼),詳細信息見下方說明。

3. OCR文字識別API說明

3.1 引用方式

為方便客戶在本地工程中直接調(diào)用我們的EASY EAI api庫,此處列出工程中需要鏈接的庫以及頭文件等,方便用戶直接添加。

選項 描述
頭文件目錄 easyeai-api/algorithm_api/ocr
庫文件目錄 easyeai-api/algorithm_api/ocr
庫鏈接參數(shù) -lpthread -locr -lrknn_api

3.2 OCR檢測初始化函數(shù)

設(shè)置OCR檢測初始化函數(shù)原型如下所示。

int ocr_det_init(const char* model_path, rknn_app_context_t* app_ctx);

具體介紹如下所示。

函數(shù)名: ocr_det_init
頭文件 ocr.h
輸入?yún)?shù)
model_path:算法模型名字/路徑
app_ctx:算法模型句柄
返回值 成功返回:0
失敗返回:-1
注意事項

3.3 OCR檢測運行函數(shù)

設(shè)置OCR檢測運行原型如下所示。

int ocr_det_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_det_postprocess_params* params, ocr_det_result* out_result);

具體介紹如下所示。

函數(shù)名: ocr_det_run
頭文件 ocr.h
輸入?yún)?shù)
app_ctx:算法模型句柄
input_image:Cv::Mat輸入圖像
Params:ocr檢測算法參數(shù)
out_result:返回結(jié)果
返回值
成功返回:0
失敗返回:-1
注意事項

3.4 OCR檢測釋放函數(shù)

設(shè)置OCR檢測釋放原型如下所示。

int ocr_det_release(rknn_app_context_t* app_ctx);

具體介紹如下所示。

函數(shù)名: ocr_det_release
頭文件 ocr.h
輸入?yún)?shù) app_ctx:算法模型句柄
返回值 成功返回:0
失敗返回:-1
注意事項

3.5 OCR識別初始化函數(shù)

OCR識別初始化函數(shù)原型如下所示。

int ocr_rec_init(const char* model_path, rknn_app_context_t* app_ctx);

具體介紹如下所示。

函數(shù)名: ocr_rec_init
頭文件 ocr.h
輸入?yún)?shù)
model_path:算法模型名字/路徑
app_ctx:算法模型句柄
返回值
成功返回:0
失敗返回:-1
注意事項

3.6 OCR識別運行函數(shù)

OCR識別運行函數(shù)原型如下所示。

int ocr_rec_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_rec_result* out_result);

具體介紹如下所示。

函數(shù)名: ocr_rec_run
頭文件 ocr.h
輸入?yún)?shù)
app_ctx:算法模型句柄
input_image:輸入圖像
out_result:返回結(jié)果
返回值
成功返回:0
失敗返回:-1
注意事項

3.7 OCR識別釋放函數(shù)

OCR識別釋放函數(shù)原型如下所示。

int ocr_rec_release(rknn_app_context_t* app_ctx);

具體介紹如下所示。

函數(shù)名: ocr_rec_release
頭文件 ocr.h
輸入?yún)?shù) app_ctx:算法模型句柄
返回值 成功返回:0
失敗返回:-1
注意事項

4. OCR識別算法例程

例程目錄為Toolkit-C-Demo/ocr/test-ocr.cpp,操作流程如下。

wKgZO2f_BE6AR-wwAABFnLXCW4I978.png

參考例程如下所示。

#include #include #include #include"ocr.h" using namespace cv; using namespace std; #define INDENT " " #define THRESHOLD 0.3 // pixel score threshold #define BOX_THRESHOLD 0.9 // box score threshold #define USE_DILATION false // whether to do dilation, true or false #define DB_UNCLIP_RATIO 1.5 // unclip ratio for poly type int main(int argc, char **argv) { if (argc != 2) { printf("%s n", argv[0]); return -1; } /* 參數(shù)初始化 */ const char *img_path = argv[1]; Mat input_image, rgb_img; input_image = imread(img_path); if (input_image.empty()) { cout

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4811

    瀏覽量

    98628
  • 文字識別
    +關(guān)注

    關(guān)注

    0

    文章

    18

    瀏覽量

    8917
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    176

    瀏覽量

    17284
  • rv1126
    +關(guān)注

    關(guān)注

    0

    文章

    118

    瀏覽量

    4462
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【飛凌嵌入式RV1126B開發(fā)板試用體驗】初識飛凌嵌入式RV1126B開發(fā)板試

    排列也整齊合理。下面是飛凌嵌入式RV1126B開發(fā)板的詳細介紹,文字中有鏈接可以到達飛凌嵌網(wǎng)站做詳細了解。 飛凌嵌入式RV1126B 是由保定飛凌嵌入式技術(shù)有限公司基于 瑞芯微(Roc
    發(fā)表于 04-13 17:27

    ElfBoard新品發(fā)布|【RV1126B】ELF-RV1126B開發(fā)板正式發(fā)布

    ELF-RV1126B開發(fā)板基于瑞芯微RV1126B處理器設(shè)計,集成四核ARMCortex-A53架構(gòu),主頻達1.6GHz,并內(nèi)置3TOPS@INT8算力的NPU,支持INT8/INT16混合精度
    的頭像 發(fā)表于 01-16 16:59 ?3334次閱讀
    ElfBoard新品發(fā)布|【<b class='flag-5'>RV1126</b>B】ELF-<b class='flag-5'>RV1126</b>B<b class='flag-5'>開發(fā)</b>板正式發(fā)布

    瑞芯微(EASY EAI)RV1126B OCR文字識別

    有多少。文字識別:對定位好的文字區(qū)域進行識別,主要解決的問題是每個文字是什么,將圖像中的文字區(qū)域
    的頭像 發(fā)表于 01-12 10:19 ?7312次閱讀
    瑞芯微(EASY EAI)<b class='flag-5'>RV1126</b>B <b class='flag-5'>OCR</b><b class='flag-5'>文字</b><b class='flag-5'>識別</b>

    別再用舊款了!RV1126B NPU實測2.6倍提速,YOLO算法絲滑運行

    AI視覺芯片的核心競爭力,NPU性能尤為關(guān)鍵。瑞芯微RV1126B作為RV1126迭代款,性能提升有多少?繼上集CPU性能實測,今天為您帶來NPU性能實測對比,為您的選型提供真實參考。
    的頭像 發(fā)表于 12-22 12:11 ?1294次閱讀
    別再用舊款了!<b class='flag-5'>RV1126</b>B NPU實測2.6倍提速,YOLO<b class='flag-5'>算法</b>絲滑運行

    替代升級實錘!實測RV1126B,CPU性能吊打RV1126

    RV1126B核心板已上市并穩(wěn)定量產(chǎn)供應(yīng)實測開始,設(shè)備使用觸覺智能RV1126核心板與RV1126B核心板各自配套的開發(fā)板進行對比。RV1126
    的頭像 發(fā)表于 12-11 17:13 ?2635次閱讀
    替代升級實錘!實測<b class='flag-5'>RV1126</b>B,CPU性能吊打<b class='flag-5'>RV1126</b>

    瑞芯微RV1126B:邊緣AI視覺處理的“性能標(biāo)桿”

    作為RV1126系列的全面升級版本,RV1126B憑借3TOPS的NPU算力、專用的AI-ISP架構(gòu)以及全面的硬件級安全特性,正成為多行業(yè)智能化升級的理想選擇。
    的頭像 發(fā)表于 11-21 08:03 ?9825次閱讀
    瑞芯微<b class='flag-5'>RV1126</b>B:邊緣AI視覺處理的“性能標(biāo)桿”

    告別 RV1126,迎來更強選擇!RV1126B 加量不加價,重塑 AI 硬件新標(biāo)桿

    在科技飛速迭代的當(dāng)下,嵌入式 AI 硬件領(lǐng)域的產(chǎn)品更新速度始終保持著高頻節(jié)奏。曾經(jīng)憑借穩(wěn)定性能在市場中占據(jù)一席之地的 RV1126,如今正式迎來產(chǎn)品生命周期的新階段 —— 停產(chǎn)。這一消息傳出時,不少
    的頭像 發(fā)表于 10-22 17:48 ?1421次閱讀

    瑞芯微RV1126B特性概述

    RV1126B是瑞芯微Rockchip在2025年第二季度全新推出的Arm架構(gòu)AI視覺芯片,搭載4核Cortex-A53與自研3Tops算力NPU。全面替代上一代的RV1126,為智能安防、工業(yè)視覺
    的頭像 發(fā)表于 10-09 11:22 ?2279次閱讀
    瑞芯微<b class='flag-5'>RV1126</b>B特性概述

    音諾恒YNH-363 RV1126人臉識別主板規(guī)格書

    音諾恒RV1126人臉識別主板規(guī)格書
    發(fā)表于 09-20 11:15 ?0次下載

    新品發(fā)布!RV1126B正式上線!

    新品發(fā)布!RV1126B正式上線!
    的頭像 發(fā)表于 09-15 09:16 ?7587次閱讀
    新品發(fā)布!<b class='flag-5'>RV1126</b>B正式上線!

    RV1126系列選型指南:從RV1126RV1126B,一文看懂升級差異

    2025年7月,瑞芯微正式發(fā)布新一代AI視覺芯片RV1126B。作為其金牌方案商,EASYEAI靈眸科技同步推出搭載該芯片的AIoT核心板EAI1126B-Core-T。相較于前代RV1126
    的頭像 發(fā)表于 09-04 10:50 ?5284次閱讀
    <b class='flag-5'>RV1126</b>系列選型指南:從<b class='flag-5'>RV1126</b>到<b class='flag-5'>RV1126</b>B,一文看懂升級差異

    基于RV1109/RV1126的直播推流方案

    基于RV1109/RV1126 的直播推流方案 新龍鵬科技有限公司 ? ?關(guān)鍵特性 1)輸入輸出接口支持MIPI/BT1120/LVDS輸入,MIPI/LVDS輸出 ? 2)網(wǎng)絡(luò)接口支持千兆網(wǎng)口
    的頭像 發(fā)表于 09-01 12:25 ?962次閱讀
    基于<b class='flag-5'>RV</b>1109/<b class='flag-5'>RV1126</b>的直播推流方案

    瑞芯微全新AI視覺芯片RV1126B解析,性能參數(shù)配置與型號差異全攻略

    瑞芯微(Rockchip)在2025年第二季度推出了全新的Arm架構(gòu)AI視覺芯片,搭載4核Cortex-A53與自研3Tops算力NPU。該芯片在前代RV1126的基礎(chǔ)上進行了全面升級,為智能安防
    的頭像 發(fā)表于 08-14 23:43 ?4400次閱讀
    瑞芯微全新AI視覺芯片<b class='flag-5'>RV1126</b>B解析,性能參數(shù)配置與型號差異全攻略

    瑞芯微RV1126&RV1109替換RV1126B-P說明_V1.0

    瑞芯微RV1126&RV1109替換RV1126B-P說明_V1.0目前RV1109/1126已停產(chǎn)可提供新版本樣品與技術(shù)支持
    發(fā)表于 08-11 12:02 ?2次下載

    端側(cè)OCR文字識別實現(xiàn) -- Core Vision Kit ##HarmonyOS SDK AI##

    ,使用場景中就包括了“通用文字識別”,即我們前文中所說的ocr功能。 其整體流程概括為: 首先通過各種方法得到一張圖片,例如拍照、從相冊中選擇、甚至你也可以通過canvas畫布生成的圖片或者通過
    發(fā)表于 06-30 18:07
    台前县| 光山县| 图木舒克市| 乌什县| 鄢陵县| 福海县| 浑源县| 兴和县| 正镶白旗| 荥阳市| 蒙城县| 叙永县| 丹东市| 永寿县| 牡丹江市| 镇赉县| 丰宁| 汨罗市| 北宁市| 高州市| 夏河县| 高安市| 凤庆县| 黔南| 叶城县| 崇礼县| 喀喇沁旗| 孙吴县| 根河市| 蕉岭县| 会理县| 常德市| 武邑县| 福建省| 牙克石市| 玛多县| 麻城市| 婺源县| 河源市| 林西县| 普格县|