日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenCV中支持的非分類與檢測視覺模型

OpenCV學堂 ? 來源:OpenCV學堂 ? 作者:OpenCV學堂 ? 2022-08-19 09:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

引言 ·

前面給大家分別匯總了OpenCV中支持的圖像分類與對象檢測模型,視覺視覺任務(wù)除了分類與檢測還有很多其他任務(wù),這里我們就來OpenCV中支持的非分類與檢測的視覺模型匯總一下。注意一點,匯總支持的模型都是OpenCV4.4 Github上已經(jīng)提供的,事實上除了官方的提供的模型,讀者還可以自己探索更多非官方模型支持。這里的匯總模型主要來自O(shè)penCV社區(qū)官方測試過的。

語義分割網(wǎng)絡(luò)

OpenCV4 DNN支持的語義分割網(wǎng)絡(luò)FCN與ENet、ResNet101_DUC_HDC等三個語義分割模型。

FCN

其中FCN主要是基于VGG16~VGG19作為基礎(chǔ)網(wǎng)絡(luò),速度很慢,該網(wǎng)絡(luò)是在2015年時候提出,是早期很典型的圖像語義分割網(wǎng)絡(luò),不是一個對稱的卷積反卷積分割網(wǎng)絡(luò),在編碼階段網(wǎng)絡(luò)過長,解碼網(wǎng)絡(luò)很少,結(jié)果堪憂!網(wǎng)絡(luò)結(jié)構(gòu)如下:

c95bf7f8-1f09-11ed-ba43-dac502259ad0.png

c97b257e-1f09-11ed-ba43-dac502259ad0.png

分別支持不同分辨率的上采樣。

ENet

ENet是一種實時語義分割網(wǎng)絡(luò),在2016年提出的,關(guān)于ENet語義分割網(wǎng)絡(luò),我其實之前寫過一篇文章,詳細介紹過,這里就不再啰嗦了,直接看這個鏈接即可:

詳解ENet | CPU可以實時的道路分割網(wǎng)絡(luò)

論文下載地址:

https://arxiv.org/pdf/1606.02147.pdf

ResNet101_DUC_HDC

該模型在編碼網(wǎng)絡(luò)中基于殘差網(wǎng)絡(luò)與混合空洞卷積(HDC-Hybrid Dilated Convolution),在解碼階段采用密集上采樣卷積(DUC-Dense Upsampling Convolution),最終實現(xiàn)了像素級別的圖像語義分割網(wǎng)絡(luò)。網(wǎng)絡(luò)模型結(jié)構(gòu)如下:

c9bc0e90-1f09-11ed-ba43-dac502259ad0.png

該論文在2017發(fā)表,論文地址如下:

https://arxiv.org/pdf/1702.08502.pdf

姿態(tài)評估

OpenCV DNN支持的姿態(tài)評估是基于OpenPose網(wǎng)絡(luò)實現(xiàn)的身體與手部姿態(tài)評估,OpenPose是一個開源的姿態(tài)評估項目支持2D與3D模型的姿態(tài)評估,提供了C++/Python的API調(diào)用接口。模型可以從它github地址獲得

https://github.com/CMU-Perceptual-Computing-Lab/openpose

相關(guān)的模型主要來自它們的系列論文, 姿態(tài)評估的基本原理與流程如下:

c9cd63f2-1f09-11ed-ba43-dac502259ad0.png

c9dd5f82-1f09-11ed-ba43-dac502259ad0.png

完整的姿態(tài)評估流程入上圖,首先預(yù)測熱圖與PAF,然后進行匹配與解析,最終得到輸出的姿態(tài)評估結(jié)果。相關(guān)的論文地址如下

https://arxiv.org/pdf/1812.08008v2.pdfhttps://arxiv.org/pdf/1611.08050.pdf

圖像處理

OpenCV中圖像處理網(wǎng)絡(luò)支持圖像色彩遷移、圖像風格遷移、邊緣檢測。

色彩遷移:

其中灰度圖像轉(zhuǎn)換彩色圖像的模型結(jié)構(gòu)如下:

c9fa8ada-1f09-11ed-ba43-dac502259ad0.png

其中有個重要的輸入特征點是要把RGB彩色圖像轉(zhuǎn)換為LAB通道圖像,然后對AB輸入,最后結(jié)果重新加上L分量。代碼在這里

http://richzhang.github.io/colorization/

風格遷移

風格遷移網(wǎng)絡(luò)主要是來自于2016李飛飛等提出感知損失的圖像風格遷移與超分辨率論文實現(xiàn)的,網(wǎng)絡(luò)結(jié)構(gòu)如下:

ca265912-1f09-11ed-ba43-dac502259ad0.png

github地址如下:

https://github.com/jcjohnson/fast-neural-style

邊緣檢測

OpenCV中傳統(tǒng)的圖像邊緣檢測算法Canny,現(xiàn)在OpenCV支持基于深度學習的邊緣檢測算法HED,它與Canny算法的邊緣提取效果對比如下:

ca4e0f02-1f09-11ed-ba43-dac502259ad0.png

該論文是在2015年提出的,模型結(jié)構(gòu)如下:

ca6403b6-1f09-11ed-ba43-dac502259ad0.png

作者選擇了VGGNet作為特征提取與基礎(chǔ)網(wǎng)絡(luò)。

論文地址:

https://arxiv.org/pdf/1504.06375.pdf

人臉識別

人臉識別來自O(shè)penFace,OpenFace是一種典型的移動端實時的人臉識別模型,跟它相似的還有LightCNN模型。OpenFace是基于facenet的Inception網(wǎng)絡(luò)作為backbone網(wǎng)絡(luò)訓練生存的torch網(wǎng)絡(luò)模型,然后基于SVM實現(xiàn)了分類推理,完整的OpenFace項目結(jié)構(gòu)如下:

ca78d03e-1f09-11ed-ba43-dac502259ad0.png

其中預(yù)處理階段的人臉對齊示意圖如下:

caa247e8-1f09-11ed-ba43-dac502259ad0.png

關(guān)于FaceNet的人臉識別論文

https://arxiv.org/pdf/1503.03832.pdf

OpenCV DNN支持的8位的量化之后的人臉識別模型,最終輸出的向量是128維的,模型下載可以從Github地址:

https://github.com/cmusatyalab/openface

場景文字檢測

場景文字檢測來自2017年曠視科技提出的EAST場景文字檢測模型,相關(guān)的模型結(jié)構(gòu)如下:

cacdf406-1f09-11ed-ba43-dac502259ad0.png

最終輸出的文本區(qū)域解析后處理如下:

cadb25ea-1f09-11ed-ba43-dac502259ad0.png

最常見的是解析位RBOX,即帶角度的旋轉(zhuǎn)矩形(最小外接矩形)。

最后總結(jié)一下,上述網(wǎng)絡(luò)均支持在OpenCV4.4版本上直接推理運行,或者自定義數(shù)據(jù)學習之后的在OpenCV4 DNN部署,推理調(diào)用。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編碼
    +關(guān)注

    關(guān)注

    6

    文章

    1041

    瀏覽量

    57156
  • 視覺模型
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    7057
  • OpenCV
    +關(guān)注

    關(guān)注

    33

    文章

    652

    瀏覽量

    45108

原文標題:匯總 | OpenCV4中的非典型深度學習模型

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【幸狐Omni3576邊緣計算套件試用體驗】YOLO26 板端部署

    識別、姿態(tài)估計、圖像分割、圖像分類、旋轉(zhuǎn)框檢測的項目設(shè)計,包括環(huán)境部署、模型獲取、關(guān)鍵代碼、效果演示等。 項目介紹 準備工作:OpenCV 安裝、Ultralytics 軟件包安裝、Y
    發(fā)表于 04-19 22:02

    人工智能多模態(tài)與視覺模型開發(fā)實戰(zhàn) - 2026必會

    和訓練,模型可以逐漸提升對圖像的理解能力,實現(xiàn)對各種視覺任務(wù)的精準處理。 此外,視覺模型的發(fā)展還得益于大規(guī)模數(shù)據(jù)集和強大計算資源的支持。海
    發(fā)表于 04-15 16:06

    沒有專利的opencv-python 版本

    opencv-python==3.4.15.55 -i https://pypi.tuna.tsinghua.edu.cn/simple 注意:3.4.x 核心版同樣無專利風險,但僅支持 Python
    發(fā)表于 12-13 12:37

    那些年我用OpenCV+Qt趟過哪些坑?寫給視覺應(yīng)用開發(fā)者的避坑指南

    從一個寫腳本的算法愛好者,到能獨立設(shè)計交付跨平臺視覺檢測系統(tǒng),中間踩了無數(shù)的坑,也總結(jié)出一套還算行之有效的方法。今天,中際賽威劉老師不談高深理論,就想把這套從基礎(chǔ)搭建、核心架構(gòu)到項目實戰(zhàn)的完整
    發(fā)表于 12-02 09:43

    基于級聯(lián)分類器的人臉檢測基本原理

    本次分享的內(nèi)容是基于級聯(lián)分類器的人臉檢測基本原理 1) 人臉檢測概述 關(guān)于人臉檢測算法,目前主流方法分為兩類,一類是基于知識,主要方法包括模板匹配,人臉特征,形狀和邊緣,紋理特征,
    發(fā)表于 10-30 06:14

    借助NVIDIA技術(shù)構(gòu)建實時視覺檢測工作流

    構(gòu)建一套可靠的視覺檢測流程來實現(xiàn)缺陷檢測和質(zhì)量控制面臨諸多挑戰(zhàn),例如針對特定領(lǐng)域定制通用視覺 AI 模型、在算力受限的邊緣設(shè)備上優(yōu)化
    的頭像 發(fā)表于 10-21 11:01 ?1179次閱讀
    借助NVIDIA技術(shù)構(gòu)建實時<b class='flag-5'>視覺</b><b class='flag-5'>檢測</b>工作流

    機器視覺雙雄YOLO 和 OpenCV 到底有啥區(qū)別?別再傻傻分不清!

    如何在深圳市鋇錸技術(shù)有限公司的AI邊緣計算產(chǎn)品中結(jié)合,實現(xiàn)真正的“視覺智能”。 一、前言:為什么總有人把YOLO和OpenCV搞混? 在AI視覺項目中,你可能聽過這樣的討論:“要做人臉檢測
    的頭像 發(fā)表于 10-14 16:00 ?1758次閱讀
    機器<b class='flag-5'>視覺</b>雙雄YOLO 和 <b class='flag-5'>OpenCV</b> 到底有啥區(qū)別?別再傻傻分不清!

    廣和通發(fā)布端側(cè)目標檢測模型FiboDet

    為提升端側(cè)設(shè)備視覺感知與決策能力,廣和通全自研端側(cè)目標檢測模型FiboDet應(yīng)運而生。該模型基于廣和通在邊緣計算與人工智能領(lǐng)域的深度積累,面向工業(yè)、交通、零售等多個行業(yè)提供高性能、低功
    的頭像 發(fā)表于 09-26 13:39 ?1746次閱讀

    如何使用樹莓派與OpenCV實現(xiàn)面部和運動追蹤的云臺系統(tǒng)?

    使用樹莓派和OpenCV實時掃描并存儲二維碼使用樹莓派和OpenCV實現(xiàn)物體與動物識別使用樹莓派、攝像頭和OpenCV進行速度檢測用樹莓派+Open
    的頭像 發(fā)表于 08-14 17:45 ?2517次閱讀
    如何使用樹莓派與<b class='flag-5'>OpenCV</b>實現(xiàn)面部和運動追蹤的云臺系統(tǒng)?

    如何板端編譯OpenCV并搭建應(yīng)用--基于瑞芯微米爾RK3576開發(fā)板

    支持 TensorFlow Lite、PyTorch、Caffe 等主流框架的模型加速(需 Rockchip 提供的 RKNN Toolkit 工具鏈)。 因此,我們可以在米爾RK3576開發(fā)板上
    發(fā)表于 08-08 17:14

    【Milk-V Duo S 開發(fā)板免費體驗】SDK編譯、人臉檢測OpenCV測試

    【Milk-V Duo S 開發(fā)板免費體驗】SDK編譯、人臉檢測OpenCV測試 本文介紹了 Milk-V Duo S 開發(fā)板實現(xiàn) Buildroot SDK 鏡像編譯、基于 TDL 模型的人
    發(fā)表于 07-11 13:48

    基于LockAI視覺識別模塊:手寫數(shù)字識別

    前準備 **請確保你已經(jīng)下載了 **凌智視覺模塊手寫數(shù)字分類模型 5.2 運行過程 在凌智視覺模塊輸入以下命令: chmod 777 Test-DigitHandRecog # 調(diào)用攝
    發(fā)表于 06-30 16:45

    基于LockAI視覺識別模塊:C++目標檢測

    是基于百度飛槳深度學習框架開發(fā)的一個高效的目標檢測庫,支持多種先進的目標檢測模型,如 YOLO 系列、SSD、Faster R-CNN、Mask R-CNN 等。它提供了簡單易用的接
    發(fā)表于 06-06 14:43

    從FA模型切換到Stage模型時:module的切換說明

    支持,在extensionAbilities標簽中支持。 configChanges標識Ability關(guān)注的系統(tǒng)配置集合。/Stage模型支持。 mission標識Ability指
    發(fā)表于 06-05 08:16

    基于LockAI視覺識別模塊:C++輪廓檢測

    本文檔展示了如何使用 OpenCV 進行圖像處理和特征檢測,包括邊緣檢測、直線檢測、圓檢測以及多邊形擬合。通過這些技術(shù),可以實現(xiàn)對攝像頭捕獲
    發(fā)表于 05-22 10:05
    庄河市| 新兴县| 巴林右旗| 施甸县| 绥阳县| 北票市| 白银市| 织金县| 屯门区| 盘山县| 孝感市| 汾阳市| 密山市| 静宁县| 嘉义县| 图片| 阿合奇县| 星子县| 洪洞县| 甘谷县| 南澳县| 遂昌县| 陈巴尔虎旗| 贵溪市| 云林县| 弥勒县| 上高县| 沙雅县| 于都县| 东乡县| 沙湾县| 抚州市| 常德市| 达孜县| 台南市| 托里县| 德钦县| 绥滨县| 阆中市| 汾阳市| 广州市|