日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

比閃電還快,人臉檢測(cè)中的戰(zhàn)斗雞!

nlfO_thejiangme ? 來源:YXQ ? 2019-07-17 17:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人臉檢測(cè)是應(yīng)用最為廣泛的計(jì)算機(jī)視覺任務(wù)之一,特別是在移動(dòng)端上發(fā)揮著不可替代的重要作用,包括美顏、人臉跟蹤、VR、人臉特效、人臉識(shí)別等任務(wù)以及刷臉支付、直播、試妝等應(yīng)用上都有著廣泛的引用,幾乎涵蓋了人工智能落地的方方面面。作為很多后續(xù)工作的第一步,人臉檢測(cè)器需要達(dá)到非常高效的性能,盡可能高速準(zhǔn)確地完成檢測(cè)任務(wù)。

為了不斷提升用戶的流程體驗(yàn)、促進(jìn)人臉相關(guān)應(yīng)用的進(jìn)一步發(fā)展、拓寬支持人臉檢測(cè)的設(shè)備范圍,來自谷歌的研究人員通過改造mobileNet提出更為緊湊的輕量級(jí)特征提取方法、結(jié)合適用于移動(dòng)端GPU高效運(yùn)行的新型錨框機(jī)制,以及代替非極大值抑制的加權(quán)方法保證檢測(cè)結(jié)果的穩(wěn)定性,在移動(dòng)端上實(shí)現(xiàn)了超高速的高性能人臉檢測(cè)BlazeFace,最快不到一毫秒的檢測(cè)速度為眾多人臉相關(guān)的應(yīng)用提供了更廣闊的發(fā)展空間。

強(qiáng)大的模型一定有強(qiáng)大的細(xì)節(jié)在支撐。

BlazeFace模型一共從四個(gè)方面進(jìn)行了有效改進(jìn),從而大幅減小了計(jì)算量并提高了檢測(cè)精度與穩(wěn)定性。它提升了mobilenet中深度可分離卷積的計(jì)算效率和感受野,基于此構(gòu)建了有效的特征抽取器、改進(jìn)錨框機(jī)制后處理過程。

更大的感受野更快的計(jì)算。mobilenet中的深度可分離架構(gòu)包含了每個(gè)通道上的3*3卷積和逐點(diǎn)進(jìn)行的在深度方向上的1*1的卷積操作。

深度可分離卷積

研究人員發(fā)現(xiàn),其中大部分計(jì)算量都發(fā)生在最后逐點(diǎn)計(jì)算1*1的過程中。例如針對(duì)一個(gè)s*s*c的張量,如果使用k*k卷積核為大小的深度可分離操作,那么第一步操作的計(jì)算量是s^2*c*k^2,第二步針對(duì)d個(gè)通道的輸出進(jìn)行逐點(diǎn)1*1卷積的計(jì)算量則是s^2*c*d,第二步相對(duì)于第一步的計(jì)算量消耗是d/k^2倍。在mobilenet論文中也提高1*1卷積對(duì)于計(jì)算資源的占比較高。

讓我們?cè)賮碇庇^的感受一下這兩種操作計(jì)算量的大小。針對(duì)實(shí)際的iPhoneX手機(jī),其中基于Metal Performance Shader實(shí)現(xiàn)的3*3卷積,針對(duì)56*56*128大小的16比特浮點(diǎn)張量操作需要0.07ms,而使用1*1卷積對(duì)128通道到128通道的操作則需要耗時(shí)0.3ms,幾乎是前者的四倍多。

這樣的結(jié)果為研究人員指明了提高效率的方向,增加深度可分離卷積操作中第一步核的大小是相對(duì)高效的選擇。所以在BlazeFace中研究人員將卷積核的大小擴(kuò)大成了5*5。卷積核的增大在bottleneck總量減小的情況下保證了模型感受野的大小。

此外,MobileNetV2的bottleneck通過非線性將深度增加的擴(kuò)張和深度縮減的投影分開。

mobileNet中的深度可分離卷積單元

為了適應(yīng)Blaze單元中更少的通道數(shù),研究人員對(duì)這一階段進(jìn)行掃描使得殘差可以實(shí)現(xiàn)類似拓展通道分辨率的操作。

BlazeBlock的單元構(gòu)造,包括增大的卷積核與殘差連接。

左圖是基本的blaze單元,右圖是雙blaze單元

由于增大了卷積核后的Blaze單元的開銷很小,使得另一個(gè)層的加入成為可能。于是研究人員又在上面模塊的基礎(chǔ)上開發(fā)出了雙份的Blaze單元。不僅增加了感受野的大小,同時(shí)也提高了特征的抽象。

特征抽取器。雖然這一模型同時(shí)適合與后攝和前攝,研究人員在文章中針對(duì)前視攝像頭作為例子來構(gòu)建特征抽取器,前視攝像頭需要搜索的范圍更小,計(jì)算需求也更少。

模型的輸入是針對(duì)128*128大小的rgb圖像展開的,在一個(gè)卷積后疊加了5個(gè)單Blaze單元和6個(gè)雙Blaze單元,可以看到通道數(shù)最多的時(shí)候達(dá)到了96,而最低的空間分辨率則不低于8*8的大小。

可以發(fā)現(xiàn)這一模型的最大通道數(shù)大大小于其他模型,而最低空間分辨率也較高。下面是模型的構(gòu)造細(xì)節(jié):

錨框機(jī)制。錨框在目標(biāo)檢測(cè)中廣泛使用,通常為了適應(yīng)多尺度的目標(biāo),預(yù)定義的錨框都包含了多個(gè)不同的分辨率。同時(shí)大幅度的將采樣也為目標(biāo)檢測(cè)中的計(jì)算量帶來了較多的優(yōu)化。雖然SSD中使用了多個(gè)不同尺度的特征度來進(jìn)行預(yù)測(cè),單池化金字塔架構(gòu)中卻表明過多尺度的特征圖可能在某個(gè)分辨率后變得冗余。

同時(shí)GPU計(jì)算相比于CPU存在一個(gè)需要注意的關(guān)鍵問題,針對(duì)特定層的計(jì)算GPU存在固定的調(diào)度開銷,在對(duì)低分辨率層進(jìn)行計(jì)算時(shí)會(huì)尤其明顯。例如測(cè)試中的MobileNetV1耗時(shí)4.9ms,其中只有3.9ms真正在進(jìn)行計(jì)算。

綜上考慮,研究人員對(duì)于錨框的設(shè)計(jì)作出了以下幾個(gè)方面的改進(jìn):

首先特征圖的尺寸不低于8*8,避免更深的下采樣;

其次將8*8,4*4和2*2各個(gè)特征圖上的兩個(gè)錨框用8*8特征圖上的6個(gè)錨框代替;

由于人臉的寬高比相對(duì)問題,在實(shí)際過程中使用1*1的錨框比例已經(jīng)能夠達(dá)到足夠的精度了。

后處理。由于在8*8的特征圖上存在多個(gè)錨框,很有可能產(chǎn)生多個(gè)重疊的結(jié)果。為了處理多個(gè)不同的框,先前的方法利用執(zhí)行度的非極大值抑制來選擇可能性最高的框作為結(jié)果,但這會(huì)帶來人臉檢測(cè)結(jié)果的抖動(dòng),造成人類感知上的不適。

為了緩解這種抖動(dòng),研究人員使用融合策略代替了非極大值抑制,通過加權(quán)平均多個(gè)重疊結(jié)果的方式來估計(jì)最后回歸的bbox參數(shù)。這不會(huì)增加額外的計(jì)算量,在減小抖動(dòng)的同時(shí)還提升了10%的精度。實(shí)驗(yàn)表明這一機(jī)制使得前視攝像頭的人臉檢測(cè)抖動(dòng)降低了40%,后攝則降低了30%。

優(yōu)異性能

實(shí)驗(yàn)中研究人員利用66K圖像進(jìn)行了訓(xùn)練,2K多樣性圖像進(jìn)行了測(cè)試。下圖顯示了數(shù)據(jù)在地理位置上的多樣性:

針對(duì)前視攝像頭模型,只有超過20%的區(qū)域被人臉(faces)占據(jù)才考慮(后攝5%,為了與實(shí)際情況相符)。下圖顯示了與MobileNetv2-SSD對(duì)比下的前視攝像頭性能,研究人員利用tensorflowLite在16bit下實(shí)現(xiàn)了模型,在iPhoneXS上僅需0.6ms,這意味著達(dá)到了1600fps+的速度。

研究人員還測(cè)試了在不同型號(hào)手機(jī)上的實(shí)現(xiàn)結(jié)果,速度都在約170fs到1600ps之間。

最后研究人員還比較了回歸參數(shù)的預(yù)測(cè)質(zhì)量,由于模型體量較小帶來了一定程度的退化,但不影響AR或者人臉跟蹤中的使用。

應(yīng)用展示

高速準(zhǔn)確的人臉檢測(cè)網(wǎng)絡(luò)將為后續(xù)的人臉相關(guān)任務(wù)提供有效地預(yù)處理,包括關(guān)鍵點(diǎn)檢測(cè)、輪廓、表面幾何估計(jì)、微表情識(shí)別和人臉解譯等任務(wù)。

通過與BlazeFaze給出的人臉關(guān)鍵點(diǎn)結(jié)合,算法可以得到跟隨人臉旋轉(zhuǎn)的bbox,得到居中的、尺度歸一化的、相對(duì)框無較大角度誤差的人臉結(jié)果,這將大幅度降低后續(xù)對(duì)于圖像的旋轉(zhuǎn)和平移處理,節(jié)約了計(jì)算的開銷。

例如在人臉輪廓檢測(cè)中,首先利用BlazeFace模型預(yù)測(cè)出人臉框和對(duì)應(yīng)的關(guān)鍵點(diǎn),隨后利用更為復(fù)雜的模型對(duì)人臉輪廓進(jìn)行進(jìn)一步優(yōu)化估計(jì)。這些檢測(cè)結(jié)果可以用于后續(xù)幀的處理中。

研究人員展示了基于這一人臉檢測(cè)模型的一系列例子,包括人臉幾何重建、分割、美妝等等。

值得一提的是,研究人員還將這一方法集成到了多模態(tài)媒體機(jī)器學(xué)習(xí)工具mediapipe中,這一工具包含了多種圖像處理模塊和方法、可以基于圖機(jī)制來構(gòu)建多模態(tài)的機(jī)器學(xué)習(xí)應(yīng)用工具鏈,并實(shí)現(xiàn)跨平臺(tái)的運(yùn)行。

最后附上一份Blazeface的海報(bào),再次感受下這一算法眾多的創(chuàng)新:

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6260

    瀏覽量

    112030
  • 人臉檢測(cè)
    +關(guān)注

    關(guān)注

    0

    文章

    88

    瀏覽量

    17348

原文標(biāo)題:超高速人臉檢測(cè)器BlazeFace,谷歌將人臉檢測(cè)效率提升到逆天水平

文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    瑞芯微(EASY EAI)RV1126B 人臉98關(guān)鍵點(diǎn)算法識(shí)別

    1.人臉關(guān)鍵點(diǎn)簡(jiǎn)介人臉關(guān)鍵點(diǎn)定位也稱為人臉關(guān)鍵點(diǎn)定檢測(cè)或者人臉對(duì)齊,是指給定人臉圖像,定位出
    的頭像 發(fā)表于 04-03 10:39 ?163次閱讀
    瑞芯微(EASY EAI)RV1126B <b class='flag-5'>人臉</b>98關(guān)鍵點(diǎn)算法識(shí)別

    瑞芯微(EASY EAI)RV1126B 人臉識(shí)別使用

    1.人臉識(shí)別簡(jiǎn)介人臉識(shí)別,是基于人的臉部特征信息進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù)。用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動(dòng)在圖像檢測(cè)
    的頭像 發(fā)表于 01-10 10:00 ?3632次閱讀
    瑞芯微(EASY EAI)RV1126B <b class='flag-5'>人臉</b>識(shí)別使用

    瑞芯微(EASY EAI)RV1126B 人臉檢測(cè)使用

    野外準(zhǔn)確高效的人臉檢測(cè)仍然是一個(gè)公開的挑戰(zhàn)。這是由于姿勢(shì)的變化、面部表情、比例、光照、圖像失真、面部遮擋等因素造成的。與一般的目標(biāo)檢測(cè)不同,人臉檢測(cè)
    的頭像 發(fā)表于 01-09 09:52 ?8529次閱讀
    瑞芯微(EASY EAI)RV1126B <b class='flag-5'>人臉</b><b class='flag-5'>檢測(cè)</b>使用

    基于級(jí)聯(lián)分類器的人臉檢測(cè)基本原理

    ,然后把滑動(dòng)窗口中的像素灰度值和級(jí)聯(lián)分類器里預(yù)先訓(xùn)練好的468棵決策樹的節(jié)點(diǎn)進(jìn)行比較,得到該窗口檢測(cè)結(jié)果為人臉的置信度。如果置信度大于一定的閾值,那么我們認(rèn)為人臉
    發(fā)表于 10-30 06:14

    可存儲(chǔ)1000張人臉特征的3D人臉識(shí)別模塊 支持小程序管理

    在現(xiàn)代社會(huì),人臉識(shí)別技術(shù)早已融入到生活的方方面面,不僅用于日常生活中常見的智能門鎖、銀行身份認(rèn)證、簽到打卡等場(chǎng)景,甚至在公共安全、安全駕駛等場(chǎng)景也會(huì)用到。海凌科研發(fā)的HLK-TX510人臉識(shí)別模塊
    的頭像 發(fā)表于 08-25 12:02 ?440次閱讀
    可存儲(chǔ)1000張<b class='flag-5'>人臉</b>特征的3D<b class='flag-5'>人臉</b>識(shí)別模塊 支持小程序管理

    【上海晶珩睿莓1開發(fā)板試用體驗(yàn)】人臉檢測(cè)

    分辨率:VGA 640*480 或按最大邊長(zhǎng)640等縮放 ) 詳見:Ultra-Light-Fast-Generic-Face-Detector . 模型下載 人臉檢測(cè)模型下載:ultraface
    發(fā)表于 08-19 20:41

    【Milk-V Duo S 開發(fā)板免費(fèi)體驗(yàn)】人臉檢測(cè)

    多張人臉識(shí)別 針對(duì)畫面存在多張人臉的情況進(jìn)行測(cè)試 識(shí)別效果較好,速度較快。 同時(shí)終端輸出檢測(cè)到的人臉數(shù)量 動(dòng)態(tài)效果見底部視頻。 總
    發(fā)表于 07-27 16:53

    【EASY EAI Orin Nano開發(fā)板試用體驗(yàn)】EASY-EAI-Toolkit人臉識(shí)別

    本篇使用算法組件實(shí)現(xiàn)人臉檢測(cè)。 一.準(zhǔn)備工作 1.首先使用到EASY-EAI-Toolkit組件,ubuntu掛載目錄下克隆git clone https://github.com/EASY-EAI
    發(fā)表于 07-20 14:40

    【Milk-V Duo S 開發(fā)板免費(fèi)體驗(yàn)】人臉檢測(cè)測(cè)試(視頻)

    https://bbs.elecfans.com/jishu_2494616_1_1.html我們編譯了人臉檢測(cè)的應(yīng)用,現(xiàn)在攝像頭到了, 我們就進(jìn)行實(shí)際測(cè)試。 視頻見https
    發(fā)表于 07-11 22:33

    【Milk-V Duo S 開發(fā)板免費(fèi)體驗(yàn)】SDK編譯、人臉檢測(cè)、OpenCV測(cè)試

    【Milk-V Duo S 開發(fā)板免費(fèi)體驗(yàn)】SDK編譯、人臉檢測(cè)、OpenCV測(cè)試 本文介紹了 Milk-V Duo S 開發(fā)板實(shí)現(xiàn) Buildroot SDK 鏡像編譯、基于 TDL 模型的人臉
    發(fā)表于 07-11 13:48

    基于LockAI視覺識(shí)別模塊:C++人臉識(shí)別

    基本知識(shí)講解 1.1 人臉識(shí)別簡(jiǎn)介 人臉識(shí)別是一種利用人的臉部特征進(jìn)行身份識(shí)別的生物識(shí)別技術(shù)。它通過檢測(cè)圖像或視頻人臉,提取如眼睛、鼻
    發(fā)表于 07-01 12:01

    基于LockAI視覺識(shí)別模塊:C++人臉識(shí)別

    本文基于RV1106做成的LockAI視覺識(shí)別模塊,采用LZ-Picodet模型訓(xùn)練的人臉檢測(cè)模型LZ-Face,以及ArcFace人臉識(shí)別模型,實(shí)現(xiàn)人臉識(shí)別系統(tǒng)。
    的頭像 發(fā)表于 07-01 10:09 ?1110次閱讀
    基于LockAI視覺識(shí)別模塊:C++<b class='flag-5'>人臉</b>識(shí)別

    單站閃電定位儀和三維閃電定位儀的精度對(duì)比如何

    電子發(fā)燒友網(wǎng)站提供《單站閃電定位儀和三維閃電定位儀的精度對(duì)比如何.docx》資料免費(fèi)下載
    發(fā)表于 06-24 15:26 ?2次下載

    【HarmonyOS 5】VisionKit人臉活體檢測(cè)詳解

    。 而VisionKit包含人臉活體檢測(cè)的功能接口interactiveLiveness 。人臉活體檢測(cè)見名知意,主要是為了
    的頭像 發(fā)表于 06-21 11:52 ?1102次閱讀
    【HarmonyOS 5】VisionKit<b class='flag-5'>人臉</b>活體<b class='flag-5'>檢測(cè)</b>詳解

    【正點(diǎn)原子STM32MP257開發(fā)板試用】4.人臉識(shí)別體驗(yàn)

    # 打開攝像頭(索引為7),自行修改 cap = cv2.VideoCapture(7) # 加載人臉檢測(cè)分類器 face_cascade = cv2.CascadeClassifier
    發(fā)表于 06-18 18:11
    铁岭市| 普定县| 开阳县| 长宁区| 胶南市| 安平县| 淄博市| 宣威市| 高雄县| 农安县| 裕民县| 全州县| 扶绥县| 桑日县| 石城县| 潮州市| 石狮市| 来安县| 乳源| 九龙城区| 日照市| 曲周县| 清涧县| 康定县| 昭平县| 常宁市| 宁津县| 龙陵县| 长海县| 林甸县| 通道| 南靖县| 资中县| 东乡族自治县| 梁山县| 奉贤区| 类乌齐县| 郁南县| 石狮市| 申扎县| 营山县|