亚洲视频八区,欧美一级视频久久,日本一本高清免费

在目標檢測領域，可以劃分為人臉檢測與通用目標檢測，往往人臉這方面會有專門的算法（包括人臉檢測、人臉識別、人臉其他屬性的識別等），并且和通用目標檢測（識別）會有一定的差別。這主要來源于人臉的特殊性（譬如有時候目標比較小、人臉之間特征不明顯、遮擋問題等），本文將主要從人臉檢測方面來講解目標檢測。

目前主要的人臉檢測方法分類

當前，人臉檢測方法主要包含兩個區(qū)域：傳統(tǒng)人臉檢測算法和基于深度學習的人臉檢測算法。傳統(tǒng)人臉檢測算法主要可以分為 4 類：

基于知識的人臉檢測方法；

基于模型的人臉檢測方法；

基于特征的人臉檢測方法；

基于外觀的人臉檢測方法。

2006 年，Hinton 首次提出深度學習（Deep Learning）的概念，它是通過組合低層的特征形成更高層的抽象特征。隨后研究者將深度學習應用在人臉檢測領域，主要集中在基于卷積神經網絡（CNN）的人臉檢測研究，如基于級聯(lián)卷積神經網絡的人臉檢測（Cascade CNN）、基于多任務卷積神經網絡的人臉檢測（MTCNN）、Facebox 等，很大程度上提高了人臉檢測的魯棒性。

當然，像Faster RCNN、YOLO、SSD等通用目標檢測算法也有用在人臉檢測領域，也可以實現比較不錯的結果，但是和專門人臉檢測算法比還是有差別。

如何檢測圖片中不同大小的人臉？

傳統(tǒng)人臉檢測算法中針對不同大小人臉主要有兩個策略：

縮放圖片的大?。▓D像金字塔如圖 1 所示）；

圖1 圖像金字塔

縮放滑動窗的大小（如圖 2 所示）。

圖 2 縮放滑動窗口

基于深度學習的人臉檢測算法中，針對不同大小人臉主要也有兩個策略，但和傳統(tǒng)人臉檢測算法有點區(qū)別，主要包括：

縮放圖片大?。?/strong>不過也可以通過縮放滑動窗的方式，基于深度學習的滑動窗人臉檢測方式效率會很慢存在多次重復卷積，所以要采用全卷積神經網絡（FCN），用 FCN 將不能用滑動窗的方法。

通過 anchor box 的方法：如圖 3 所示，不要和圖 2 混淆，這里是通過特征圖預測原圖的 anchorbox 區(qū)域，具體在 Facebox 中有描述。

圖 3 anchor box

如何設定算法檢測最小人臉尺寸？

主要是看滑動窗的最小窗口和 anchorbox 的最小窗口。

滑動窗的方法

假設通過 12×12 的滑動窗，不對原圖做縮放的話，就可以檢測原圖中 12×12 的最小人臉。

但是往往通常給定最小人臉 a=40、或者 a=80，以這么大的輸入訓練 CNN 進行人臉檢測不太現實，速度會很慢，并且下一次需求最小人臉 a=30*30 又要去重新訓練，通常還會是 12×12 的輸入，為滿足最小人臉框 a，只需要在檢測的時候對原圖進行縮放即可：w=w×12/a。

anchorbox 的方法

原理類似，這里主要看 anchorbox 的最小 box，通過可以通過縮放輸入圖片實現最小人臉的設定。

如何定位人臉的位置

滑動窗的方式：

滑動窗的方式是基于分類器識別為人臉的框的位置確定最終的人臉。

圖 4 滑動窗

FCN 的方式：

通過特征圖映射到原圖的方式確定最終識別為人臉的位置，特征圖映射到原圖人臉框是要看特征圖相比較于原圖有多少次縮放（縮放主要查看卷積的步長和池化層）。

假設特征圖上(2,3)的點，可粗略計算縮放比例為 8 倍，原圖中的點應該是(16,24)；如果訓練的 FCN 為 12*12 的輸入，對于原圖框位置應該是(16,24,12,12)。

當然這只是估計位置，具體的在構建網絡時要加入回歸框的預測，主要是相對于原圖框的一個平移與縮放。

通過 anchor box 的方式：

通過特征圖映射到圖的窗口，通過特征圖映射到原圖到多個框的方式確定最終識別為人臉的位置。

如何通過一個人臉的多個框確定最終人臉框位置？

圖 5 通過 NMS 得到最終的人臉位置

NMS 改進版本有很多，最原始的 NMS 就是判斷兩個框的交集。如果交集大于設定的閾值，將刪除其中一個框。

那么兩個框應該怎么選擇刪除哪一個呢？因為模型輸出有概率值，一般會優(yōu)選選擇概率小的框刪除。

基于級聯(lián)卷積神經網絡的人臉檢測（Cascade CNN）

Cascade CNN 的框架結構是什么？

級聯(lián)結構中有 6 個 CNN，3 個 CNN 用于人臉非人臉二分類，另外 3 個 CNN 用于人臉區(qū)域的邊框校正。

給定一幅圖像，12-net 密集掃描整幅圖片，拒絕 90% 以上的窗口。剩余的窗口輸入到 12-calibration-net 中調整大小和位置，以接近真實目標。接著輸入到 NMS 中，消除高度重疊窗口。下面網絡與上面類似。

Cascade CNN 人臉校驗模塊原理是什么？

該網絡用于窗口校正，使用三個偏移變量：

Xn:水平平移量，Yn:垂直平移量，Sn:寬高比縮放。

候選框口(x,y,w,h)中，(x,y)表示左上點坐標，(w,h)表示寬和高。

我們要將窗口的控制坐標調整為：

這項工作中，我們有種模式。偏移向量三個參數包括以下值：

同時對偏移向量三個參數進行校正。

訓練樣本應該如何準備？

人臉樣本；

非人臉樣本。

級聯(lián)的好處

最初階段的網絡可以比較簡單，判別閾值可以設得寬松一點，這樣就可以在保持較高召回率的同時排除掉大量的非人臉窗口；

最后階段網絡為了保證足夠的性能，因此一般設計的比較復雜，但由于只需要處理前面剩下的窗口，因此可以保證足夠的效率；

級聯(lián)的思想可以幫助我們去組合利用性能較差的分類器，同時又可以獲得一定的效率保證。

基于多任務卷積神經網絡的人臉檢測（MTCNN）

MTCNN 模型有三個子網絡，分別是 P-Net,R-Net,O-Net。

為了檢測不同大小的人臉，開始需要構建圖像金字塔，先經過 PNet 模型，輸出人臉類別和邊界框（邊界框的預測為了對特征圖映射到原圖的框平移和縮放得到更準確的框），將識別為人臉的框映射到原圖框位置可以獲取 patch，之后每一個 patch 通過 resize 的方式輸入到 RNet，識別為人臉的框并且預測更準確的人臉框，最后 RNet 識別為人臉的的每一個 patch 通過 resize 的方式輸入到 ONet，跟 RNet 類似，關鍵點是為了在訓練集有限情況下使模型更魯棒。

還要注意一點：構建圖像金字塔的的縮放比例要保留，為了將邊界框映射到最開始原圖上。

Facebox

（1）Rapidly Digested Convolutional Layers（RDCL）

在網絡前期，使用 RDCL 快速的縮小 feature map 的大小。主要設計原則如下：

Conv1, Pool1, Conv2 和 Pool2 的 stride 分別是 4, 2, 2 和 2。這樣整個 RDCL 的 stride 就是 32，可以很快把 feature map 的尺寸變小。

卷積（或 pooling）核太大速度就慢，太小覆蓋信息又不足。權衡之后，將 Conv1, Pool1, Conv2 和 Pool2 的核大小分別設為 7x7,3x3,5x5,3x3。

使用 CReLU 來保證輸出維度不變的情況下，減少卷積核數量。

（2）Multiple Scale Convolutional Layers（MSCL）

在網絡后期，使用 MSCL 更好地檢測不同尺度的人臉。主要設計原則有：

類似于 SSD，在網絡的不同層進行檢測；

采用 Inception 模塊。由于 Inception 包含多個不同的卷積分支，因此可以進一步使得感受野多樣化。

（3）Anchor densification strategy

為了 anchor 密度均衡，可以對密度不足的 anchor 以中心進行偏移加倍，如下圖所示：

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

人臉識別

人臉識別

+關注

關注
77

文章
4132

瀏覽量
88783

深度學習

深度學習

+關注

關注
73

文章
5610

瀏覽量
124654

原文標題：深度學習在人臉檢測中的應用 | CSDN 博文精選

文章出處：【微信號：rgznai100，微信公眾號：rgznai100】歡迎添加關注！文章轉載請注明出處。

收藏人收藏

掃一掃，分享給好友

復制鏈接分享

加入交流群

掃碼添加小助手

加入工程師交流群

評論

發(fā)布評論請先登錄

相關推薦

熱點推薦

【智能檢測】基于AI深度學習與飛拍技術的影像測量系統(tǒng)：實現高效精準的全自動光學檢測與智能制造數據閉環(huán)

內容概要：文檔內容介紹了中圖儀器（Chotest）影像測量儀融合人工智能深度學習與飛拍技術的自動化檢測解決方案。系統(tǒng)通過AI深度

發(fā)表于 03-31 17:11

瑞芯微(EASY EAI)RV1126B 人臉檢測使用

野外準確高效的人臉檢測仍然是一個公開的挑戰(zhàn)。這是由于姿勢的變化、面部表情、比例、光照、圖像失真、面部遮擋等因素造成的。與一般的目標檢測不同，人臉檢測

發(fā)表于 01-09 09:52 ?8481次閱讀

穿孔機頂頭檢測儀機器視覺深度學習

，能適用惡劣工況，在粉塵、高溫、氧化皮等惡劣環(huán)境中均可正常工作。測量原理利用頂頭與周圍的物質（水、空氣、導盤等）紅外輻射能量的差異，用熱成像相機拍攝出清晰的圖片，再通過深度學習短時

發(fā)表于 12-22 14:33

【團購】獨家全套珍藏！龍哥LabVIEW視覺深度學習實戰(zhàn)課（11大系列課程，共5000+分鐘）

趨勢：無監(jiān)督學習普及當前工業(yè)場景中80%的缺陷檢測項目面臨\"OK樣本充足而NG樣本稀缺\"的困境，傳統(tǒng)監(jiān)督學習方案難以落地。課程第11系列（無監(jiān)督缺陷

發(fā)表于 12-04 09:28

如何深度學習機器視覺的應用場景

深度學習視覺應用場景大全工業(yè)制造領域復雜缺陷檢測：處理傳統(tǒng)算法難以描述的非標準化缺陷模式非標產品分類：對形狀、顏色、紋理多變的產品進行智能分類外觀質量評估：基于學習的外觀質量標

發(fā)表于 11-27 10:19 ?351次閱讀

基于級聯(lián)分類器的人臉檢測基本原理

檢測到人臉這一結果。注：該算法在github上有開源實現：https://github.com/nenadmarkus/pico 3) 算法流程我們在圖像上設置一定的搜索范圍，初始

發(fā)表于 10-30 06:14

基于FPGA的膚色檢測方案簡介

膚色檢測原理在RGB圖像中，膚色對光照強度的敏感度很高，因此RGB下的膚色沒有明顯的特異性。而在YCbCr圖像中，去除光照強度Y的影響，人的膚色

發(fā)表于 10-28 07:07

自動駕駛中Transformer大模型會取代深度學習嗎？

持續(xù)討論。特別是在自動駕駛領域，部分廠商開始嘗試將多模態(tài)大模型（MLLM）引入到感知、規(guī)劃與決策系統(tǒng)，引發(fā)了“傳統(tǒng)深度學習是否已過時”的激烈爭論。然而，從技術原理、算力成本、安全需求與實際落地路徑等維度來看，Transforme

發(fā)表于 08-13 09:15 ?4392次閱讀

【Milk-V Duo S 開發(fā)板免費體驗】基于Duo S 使用 TDL SDK(V1版本)

地將各種深度學習技術應用于自己的產品和服務中。無論開發(fā)者是否是深度學習領域的專家，有了TDL SDK作為助手，都能輕松構建智能應用。目前

發(fā)表于 08-10 22:09

【Milk-V Duo S 開發(fā)板免費體驗】人臉檢測

多張人臉識別針對畫面中存在多張人臉的情況進行測試識別效果較好，速度較快。同時終端輸出檢測到的人臉數量動態(tài)效果見底部視頻。總

發(fā)表于 07-27 16:53

【Milk-V Duo S 開發(fā)板免費體驗】人臉檢測測試(視頻)

https://bbs.elecfans.com/jishu_2494616_1_1.html我們編譯了人臉檢測的應用，現在攝像頭到了，我們就進行實際測試。視頻見https

發(fā)表于 07-11 22:33

基于LockAI視覺識別模塊：C++人臉識別

基本知識講解 1.1 人臉識別簡介人臉識別是一種利用人的臉部特征進行身份識別的生物識別技術。它通過檢測圖像或視頻中的人臉，提取如眼睛、鼻

發(fā)表于 07-01 12:01

【HarmonyOS 5】VisionKit人臉活體檢測詳解

。而VisionKit中包含人臉活體檢測的功能接口interactiveLiveness 。人臉活體檢測見名知意，主要是為了

發(fā)表于 06-21 11:52 ?1097次閱讀

【正點原子STM32MP257開發(fā)板試用】4.人臉識別體驗

= cap.read() if not ret: break # 轉換為灰度圖像（人臉檢測在灰度圖像上進行） gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY

發(fā)表于 06-18 18:11

提高IT運維效率，深度解讀京東云AIOps落地實踐（異常檢測篇）

基于深度學習對運維時序指標進行異常檢測，快速發(fā)現線上業(yè)務問題時間序列的異常檢測是實際應用中的一個關鍵問題，尤其是

發(fā)表于 05-22 16:38 ?1177次閱讀

日B视频亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

搜索歷史

深度學習在人臉檢測中的應用

評論