日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OCR識(shí)別技術(shù)

新機(jī)器視覺 ? 來源:企通查 ? 作者:企通查 ? 2021-03-12 09:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在爬蟲對(duì)驗(yàn)證碼進(jìn)行破解時(shí),經(jīng)常需要對(duì)圖片中的文字內(nèi)容進(jìn)行識(shí)別,這時(shí)就需要用到OCR技術(shù)了,那么 OCR識(shí)別技術(shù)是如何實(shí)現(xiàn)對(duì)文字內(nèi)容“即拍即得”的呢?

OCR(Optical Character Recognition)即光學(xué)字符識(shí)別技術(shù),實(shí)質(zhì)屬于計(jì)算機(jī)輸入技術(shù)。OCR通過利用光學(xué)技術(shù)與計(jì)算機(jī)技術(shù)對(duì)圖片、紙張、物體等處的文本內(nèi)容進(jìn)行分析識(shí)別,并讀取轉(zhuǎn)換成計(jì)算機(jī)和人類都能理解接受的格式。

OCR主要可以分為手寫體識(shí)別和印刷體識(shí)別。

由于印刷體都是計(jì)算機(jī)自助生成再進(jìn)行輸出,通常較為規(guī)律,因此較手寫體識(shí)別來說要更簡單。而手寫體由于往往會(huì)帶有個(gè)人特色,每個(gè)人的風(fēng)格不盡相同,由于其千人千面的特性,手寫體識(shí)別也成了OCR界一直想攻克的難關(guān)。當(dāng)然,除了手寫體與印刷體外,OCR也可以根據(jù)識(shí)別內(nèi)容來分類。例如按語言分類,要識(shí)別的內(nèi)容將可能包括漢語、英語、日語、法語等,而如果僅滿足國人需求,要識(shí)別的內(nèi)容就可能會(huì)包括漢字、英文字母、阿拉伯?dāng)?shù)字、標(biāo)點(diǎn)符號(hào)等。

通常根據(jù)要識(shí)別的內(nèi)容不同,識(shí)別的難度也不同。比如僅識(shí)別阿拉伯?dāng)?shù)字,只需能識(shí)別出0-9,而英文字母則需要識(shí)別52個(gè)字符(僅考慮大小寫),而中文識(shí)別則會(huì)高達(dá)數(shù)千個(gè),且由于漢字的結(jié)構(gòu)偏旁較為復(fù)雜,要將這些字符都準(zhǔn)確識(shí)別出來會(huì)使難度系數(shù)直線上升。一個(gè)典型的OCR技術(shù)處理流程如下圖所示:

圖:來源于網(wǎng)絡(luò)

其中,圖像預(yù)處理通常為能使圖像中的文字更明顯便于識(shí)別,會(huì)對(duì)圖像的成像問題進(jìn)行修正,通常是基于數(shù)字圖像處理和傳統(tǒng)機(jī)器學(xué)習(xí)等方法對(duì)圖像進(jìn)行操作。

常見的圖像預(yù)處理包括幾何變換(透視、翻轉(zhuǎn)、旋轉(zhuǎn)、扭曲、拉直等)、畸變矯正、去模糊、銳化、圖像增強(qiáng)、光線矯正、灰度化、二值化等。其中,在對(duì)付驗(yàn)證碼時(shí)常用的灰度化、二值化處理對(duì)于內(nèi)容較為簡單的文本信息有增強(qiáng)作用,但對(duì)復(fù)雜背景的內(nèi)容處理效果就會(huì)收效甚微。

文字檢測,顧名思義是對(duì)圖片中存在的文字內(nèi)容進(jìn)行檢測,檢測內(nèi)容包括文本所在的位置、范圍、布局、數(shù)量等,通常也包括整體版面分析和文字行檢測等。部分OCR軟件為了保證檢測范圍的準(zhǔn)確性,還會(huì)套用圖像檢測的方法,對(duì)圖像中的文本區(qū)域進(jìn)行框選,并像下圖所示將框選與待識(shí)別區(qū)域交由令用戶進(jìn)行校驗(yàn)確認(rèn)。

圖:某OCR軟件識(shí)別界面

文本檢測完成后,建立在其基礎(chǔ)之上的文本識(shí)別將會(huì)對(duì)選定的文本內(nèi)容進(jìn)行識(shí)別,并將圖像中的字符轉(zhuǎn)化為可供人類和計(jì)算機(jī)識(shí)別的文本信息。文本信息主要需要解決的問題是每個(gè)字符是什么。

對(duì)于識(shí)別后輸出的文本通常需要再次核對(duì)驗(yàn)證以確保其準(zhǔn)確率,即文本校正,通常也被認(rèn)為屬于文字檢測的環(huán)節(jié)。當(dāng)識(shí)別的內(nèi)容是由詞庫中的詞匯構(gòu)成時(shí)就稱之為有詞典識(shí)別,反之則稱為無詞典識(shí)別。在整個(gè)處理流程過程中,對(duì)識(shí)別準(zhǔn)確率影響最大的步驟就是文本檢測與文本識(shí)別。相比一般文本,通常對(duì)OCR技術(shù)的評(píng)測會(huì)從最終識(shí)別率、識(shí)別速度、版面理解正確率、版面還原滿意度4方面來作為依據(jù)。

OCR識(shí)別技術(shù)對(duì)于手寫體識(shí)別目前尚在發(fā)展階段,而對(duì)于印刷體識(shí)別的技術(shù)已經(jīng)發(fā)展的較為純熟。而且,對(duì)于印刷體識(shí)別的應(yīng)用劃分可能遠(yuǎn)比你我想象的更為細(xì)致。例如用于對(duì)人身份進(jìn)行核查驗(yàn)證的證件OCR識(shí)別、用于移動(dòng)支付綁卡的銀行卡OCR識(shí)別、用于存儲(chǔ)管理名片的名片OCR識(shí)別、用于大量文字資料、檔案卷宗的錄入和處理的文檔OCR識(shí)別、用于銀行、金融、電信機(jī)構(gòu)的票據(jù)OCR識(shí)別、用于交通安全的車輛OCR識(shí)別等。

OCR技術(shù)的出現(xiàn)無疑提升了工作效率,也改變了我們的生活。

參考文獻(xiàn):

https://www.sohu.com/a/233167039_205239

https://zhuanlan.zhihu.com/p/45376274

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    176

    瀏覽量

    17280

原文標(biāo)題:文字識(shí)別界的“拍立得”——OCR識(shí)別技術(shù)

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    工業(yè)級(jí)OCR手持終端怎么選?國產(chǎn)OCR智能識(shí)別pda實(shí)測

    工業(yè)環(huán)境專用OCR智能PDA怎么選?鳥鳥科技N70Socr具備IP67防塵防水+1.5米抗跌落,5000mAh可拆卸電池支持24小時(shí)輪班作業(yè)。專業(yè)OCR掃描頭+斑馬/霍尼二維碼引擎雙模組,285g人體工學(xué)設(shè)計(jì),讓高強(qiáng)度數(shù)據(jù)采集更輕松。點(diǎn)擊查看詳細(xì)防護(hù)測試與續(xù)航實(shí)測數(shù)據(jù)!
    的頭像 發(fā)表于 02-07 17:45 ?514次閱讀
    工業(yè)級(jí)<b class='flag-5'>OCR</b>手持終端怎么選?國產(chǎn)<b class='flag-5'>OCR</b>智能<b class='flag-5'>識(shí)別</b>pda實(shí)測

    友思特案例 | 金屬行業(yè)視覺檢測案例四:挖掘機(jī)鋼板表面光學(xué)字符識(shí)別OCR)檢測

    在挖掘機(jī)鋼板表面光學(xué)字符識(shí)別OCR)檢測中,通過實(shí)施友思特深度學(xué)習(xí)視覺檢測解決方案,解決了挖掘機(jī)零部件生產(chǎn)所用鋼板上標(biāo)記識(shí)別的問題。這有助于防止材料分配錯(cuò)誤,顯著提高了生產(chǎn)效率。
    的頭像 發(fā)表于 02-05 11:40 ?381次閱讀
    友思特案例 | 金屬行業(yè)視覺檢測案例四:挖掘機(jī)鋼板表面光學(xué)字符<b class='flag-5'>識(shí)別</b>(<b class='flag-5'>OCR</b>)檢測

    DeepX OCR:以 DeepX NPU 加速 PaddleOCR 推理,在 ARM 與 x86 平臺(tái)交付可規(guī)模化的高性能 OCR 能力

    一、行業(yè)背景與核心挑戰(zhàn):OCR 規(guī)?;瘧?yīng)用的關(guān)鍵瓶頸 **隨著文檔識(shí)別技術(shù)的不斷成熟,OCR 技術(shù)已從實(shí)驗(yàn)性階段逐步走向?qū)嶋H業(yè)務(wù)場景,在政務(wù)
    的頭像 發(fā)表于 01-22 21:02 ?357次閱讀
    DeepX <b class='flag-5'>OCR</b>:以 DeepX NPU 加速 PaddleOCR 推理,在 ARM 與 x86 平臺(tái)交付可規(guī)?;母咝阅?<b class='flag-5'>OCR</b> 能力

    瑞芯微(EASY EAI)RV1126B OCR文字識(shí)別

    1.OCR文字識(shí)別簡介文字識(shí)別也是圖像領(lǐng)域一個(gè)常見問題。然而,對(duì)于自然場景圖像,首先要定位圖像中的文字位置,然后才能進(jìn)行文字的識(shí)別。所以一般包含兩個(gè)步驟:文字檢測:解決的問題是哪里有文
    的頭像 發(fā)表于 01-12 10:19 ?7230次閱讀
    瑞芯微(EASY EAI)RV1126B <b class='flag-5'>OCR</b>文字<b class='flag-5'>識(shí)別</b>

    識(shí)別身份證和護(hù)照OCR識(shí)別的手持終端設(shè)備

    鳥鳥科技N70S身份證護(hù)照識(shí)別手持終端設(shè)備,集成身份證、護(hù)照OCR識(shí)別及生物核驗(yàn)功能,工業(yè)級(jí)IP67三防設(shè)計(jì)+高性能配置,支持多場景移動(dòng)辦公,續(xù)航持久、掃碼精準(zhǔn),是執(zhí)法、海關(guān)、醫(yī)療等行業(yè)提升身份核驗(yàn)效率的優(yōu)選神器。
    的頭像 發(fā)表于 01-06 11:57 ?441次閱讀
    能<b class='flag-5'>識(shí)別</b>身份證和護(hù)照<b class='flag-5'>OCR</b><b class='flag-5'>識(shí)別</b>的手持終端設(shè)備

    【嘉楠堪智K230開發(fā)板試用體驗(yàn)】+OCR實(shí)現(xiàn)

    OCR OCR(Optical Character Recognition,光學(xué)字符識(shí)別)是一種將圖像中的文字內(nèi)容轉(zhuǎn)換為可編輯、可搜索文本的技術(shù)。其核心在于通過圖像預(yù)處理、字符分割、特
    發(fā)表于 08-23 18:53

    如何利用OCR技術(shù)實(shí)現(xiàn)高效集裝箱箱號(hào)識(shí)別?

    在現(xiàn)代物流和海關(guān)監(jiān)管領(lǐng)域,快速準(zhǔn)確地識(shí)別集裝箱箱號(hào)是提升通關(guān)效率、降低運(yùn)營成本的關(guān)鍵。OCR(光學(xué)字符識(shí)別技術(shù)的應(yīng)用,為這一需求提供了智能化解決方案。通過結(jié)合高清成像設(shè)備和先進(jìn)的算法
    的頭像 發(fā)表于 08-12 10:48 ?1004次閱讀
    如何利用<b class='flag-5'>OCR</b><b class='flag-5'>技術(shù)</b>實(shí)現(xiàn)高效集裝箱箱號(hào)<b class='flag-5'>識(shí)別</b>?

    ocr識(shí)別時(shí)數(shù)據(jù)集上傳壓縮包,上傳成功,但不顯示圖片,圖片數(shù)量仍顯示0,為什么?

    ocr識(shí)別時(shí)數(shù)據(jù)集上傳壓縮包,上傳成功,但不顯示圖片,圖片數(shù)量仍顯示0
    發(fā)表于 07-23 08:11

    端側(cè)OCR文字識(shí)別實(shí)現(xiàn) -- Core Vision Kit ##HarmonyOS SDK AI##

    獲取圖片url,把這個(gè)url和token再發(fā)給百度的ocr接口獲取識(shí)別數(shù)據(jù)……或者圖片轉(zhuǎn)base64以后把這個(gè)base64發(fā)給接口,然而鴻蒙這里,目前我也不知道啥原因(可能是發(fā)送請(qǐng)求的數(shù)據(jù)長度有限
    發(fā)表于 06-30 18:07

    OCR技術(shù)如何實(shí)現(xiàn)鐵路集裝箱號(hào)的自動(dòng)識(shí)別?

    在鐵路物流運(yùn)輸中,集裝箱號(hào)的快速準(zhǔn)確識(shí)別是提升效率的關(guān)鍵環(huán)節(jié)。通過先進(jìn)的OCR(光學(xué)字符識(shí)別技術(shù),結(jié)合計(jì)算機(jī)視覺與深度學(xué)習(xí)方法,可以實(shí)現(xiàn)鐵路集裝箱號(hào)的高效、可靠
    的頭像 發(fā)表于 06-13 10:32 ?777次閱讀

    OCR技術(shù)vs傳統(tǒng)識(shí)別:哪種更適合火車集裝箱識(shí)別?

    在鐵路物流領(lǐng)域,集裝箱箱號(hào)識(shí)別是提升運(yùn)輸效率的關(guān)鍵環(huán)節(jié)。隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,OCR識(shí)別與傳統(tǒng)識(shí)別
    的頭像 發(fā)表于 06-11 10:54 ?766次閱讀

    明治案例 | 150個(gè)/分鐘!電阻【OCR識(shí)別】+【尺寸測量】一步到位

    真實(shí)案例——看明治傳感如何用一個(gè)視覺傳感器,同時(shí)搞定電阻的尺寸測量和OCR識(shí)別,讓質(zhì)檢效率翻倍,成本直降!場景需求希望在同一工位完成尺寸測量與OCR識(shí)別,減少設(shè)備占
    的頭像 發(fā)表于 06-10 07:33 ?925次閱讀
    明治案例 | 150個(gè)/分鐘!電阻【<b class='flag-5'>OCR</b><b class='flag-5'>識(shí)別</b>】+【尺寸測量】一步到位

    集裝箱箱號(hào)識(shí)別手持終端的核心技術(shù)解析

    在現(xiàn)代港口物流智能化領(lǐng)域,集裝箱箱號(hào)識(shí)別手持終端已成為提升作業(yè)效率的關(guān)鍵設(shè)備。這類設(shè)備集成了多項(xiàng)前沿技術(shù),為行業(yè)提供了高效、精準(zhǔn)的移動(dòng)識(shí)別解決方案。本文將深入解析其核心技術(shù)優(yōu)勢。 一、
    的頭像 發(fā)表于 06-05 10:13 ?710次閱讀

    OCR識(shí)別訓(xùn)練完成后給的是空壓縮包,為什么?

    OCR識(shí)別 一共弄了26張圖片,都標(biāo)注好了,點(diǎn)擊開始訓(xùn)練,顯示訓(xùn)練成功了,也將壓縮包發(fā)到郵箱了,下載下來后,壓縮包里面是空的 OCR圖片20幾張圖太少了。麻煩您多添加點(diǎn),參考我們的ocr
    發(fā)表于 05-28 06:46

    深度學(xué)習(xí)賦能:正面吊車載箱號(hào)識(shí)別系統(tǒng)的核心技術(shù)

    在現(xiàn)代物流與智慧港口建設(shè)中,集裝箱的高效精準(zhǔn)識(shí)別是提升作業(yè)效率的關(guān)鍵環(huán)節(jié)?;?b class='flag-5'>OCR+AI深度學(xué)習(xí)技術(shù)的正面吊車載箱號(hào)識(shí)別系統(tǒng),憑借99%以上的識(shí)別
    的頭像 發(fā)表于 05-07 10:10 ?685次閱讀
    湖南省| 阿合奇县| 天峨县| 临邑县| 梅河口市| 巴彦县| 临湘市| 清流县| 民乐县| 河间市| 岢岚县| 乐东| 光山县| 瓦房店市| 尚志市| 曲水县| 将乐县| 合水县| 成安县| 西乌| 常州市| 高唐县| 德阳市| 汉中市| 洪雅县| 湖南省| 濮阳县| 兴隆县| 中西区| 云林县| 上栗县| 文安县| 长乐市| 扎囊县| 新竹县| 遵化市| 河间市| 绵竹市| 临邑县| 阳城县| 长武县|