日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在超大分辨率的圖片中檢測目標(biāo)

新機(jī)器視覺 ? 來源:新機(jī)器視覺 ? 2023-04-16 09:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文通過一篇YOLT的文章引出超大分辨率的圖片遇到目標(biāo)檢測任務(wù)該如何處理?此類問題一般出現(xiàn)在遙感領(lǐng)域和醫(yī)療影像中居多,我們先來分析超大圖像的目標(biāo)檢測存在哪些問題,然后學(xué)習(xí)一下YOLT是如何解決這些問題的,最后結(jié)合現(xiàn)有技術(shù)探討目前的可行性方案。

1

當(dāng)超大分辨率圖像邂逅目標(biāo)檢測任務(wù)

曾經(jīng)有小伙伴問過我針對超大分辨率的圖像如何做目標(biāo)檢測任務(wù)?

我們先思考一下超大分辨率數(shù)據(jù)在哪些場景中會出現(xiàn),比如衛(wèi)星地圖做建筑物、樓宇的檢測:

a10bc8b4-db92-11ed-bfe3-dac502259ad0.jpg

在醫(yī)療影像中做病灶體的檢測:

a120883a-db92-11ed-bfe3-dac502259ad0.jpg

無人機(jī)航拍圖中做船舶、車輛、房屋等檢測:

a13094f0-db92-11ed-bfe3-dac502259ad0.jpg

是否可以沿用通用框架做該類圖片的目標(biāo)檢測呢?

輸入如此大分辨率的圖片到網(wǎng)絡(luò)中,最直接的問題就是機(jī)器的顯存爆掉,無法進(jìn)行訓(xùn)練任務(wù)。

如果你真的有一個非常牛逼的集群直接訓(xùn)練大尺寸圖像,最后的預(yù)測結(jié)果恐怕也不盡如人意,原因出在大尺寸圖像中的目標(biāo)往往只占5-10個像素點(diǎn),檢測網(wǎng)絡(luò)一旦經(jīng)過多次下采樣后,這些小目標(biāo)的特征很難被提取到。

衛(wèi)星地圖等數(shù)據(jù)非常稀有珍貴,不像無人駕駛的開源數(shù)據(jù)有幾十萬幾百萬張的量級,如何高效的利用高質(zhì)量的訓(xùn)練圖片也是關(guān)鍵所在。

所以直接硬上通用模型檢測出來的效果可能是這樣的,要么伴隨著圖片的resize,目標(biāo)被縮放沒了;要么基于N×N網(wǎng)格的預(yù)測造成密集連續(xù)目標(biāo)的漏檢:

a1455318-db92-11ed-bfe3-dac502259ad0.png

此類任務(wù)的難點(diǎn)或者優(yōu)化方向在哪里?

它的核心在于四個方向:

如何處理高分辨的輸入

如何提高密集小目標(biāo)檢測

如何解決類別不平衡問題

如何利用少量的訓(xùn)練數(shù)據(jù)

下面我們通過一篇名為You Only Look Twice的文章來分析上述幾個問題,名稱有點(diǎn)蹭熱度的嫌疑哦,不過誰讓YOLO系列那么火,大家都喜歡在它的框架上改改發(fā)文章呢!

2

You Only Look Twice

《Rapid Multi-Scale Object Detection In Satellite Imagery》這篇文章描述了大尺寸圖像目標(biāo)檢測的常規(guī)方法,總的來說就是對超大分辨率的圖像進(jìn)行滑窗裁剪成多個子圖,然后對每一個子圖進(jìn)行目標(biāo)檢測,最后將所有子圖的結(jié)果拼接后進(jìn)行NMS過濾。

數(shù)據(jù)端

對超大分辨率圖片進(jìn)行滑窗裁剪,如下圖所示,一個16000×16000像素的圖片,采用416×416像素的滑窗,最后生成約1500個子圖。

a159e09e-db92-11ed-bfe3-dac502259ad0.png

文章指出在滑窗裁剪的時候必須有15%的重疊區(qū)域,原因是如果一個目標(biāo)剛好處于窗口邊緣被切分成2塊,本身目標(biāo)所占像素就少又被截斷會造成更加難以檢測。但是重復(fù)部分會帶來同一個目標(biāo)出現(xiàn)多個檢測框的問題,目前通過將所有子圖的檢測結(jié)果合并起來采用NMS處理進(jìn)行過濾。

a1749f92-db92-11ed-bfe3-dac502259ad0.png

在衛(wèi)星、遙感、航拍等圖片中,目標(biāo)物體往往存在方向信息,如何提高目標(biāo)檢測的旋轉(zhuǎn)不變性呢?在YOLT中通過數(shù)據(jù)增廣的方式旋轉(zhuǎn)圖片生成更多形狀的物體從而緩解問題。但是小編認(rèn)為該方法治標(biāo)不治本,輸出結(jié)果仍然是規(guī)則的矩形框,一旦遇到長條形物體,比如輪船。預(yù)測的矩形框會引入很多冗余區(qū)域??梢試L試在損失函數(shù)中增加旋轉(zhuǎn)角進(jìn)行學(xué)習(xí)。

a193513a-db92-11ed-bfe3-dac502259ad0.jpg

網(wǎng)絡(luò)端

基于YOLOv2的結(jié)構(gòu)做了一些改進(jìn),在YOLO系列或者很多檢測網(wǎng)絡(luò)都進(jìn)行了32倍的下采樣,但是在遙感地圖等超大分辨率圖片中,目標(biāo)物體所占像素本身就很少,經(jīng)過32倍下采樣后,基本無法有效檢測。所以YOLT減少了下采樣的比例收縮到16倍并增加網(wǎng)絡(luò)的層數(shù)提供特征提取能力。

文章借助YOLOv2中的PassThrough層,融合深淺特征圖的特征目的是提升對小目標(biāo)的檢測效果。當(dāng)然這一操作完全可以考慮由PAN替代,在FPN上采樣融合的特征金字塔之后,又增加了一個下采樣融合的特征金字塔。

本文并沒有提到類別不平衡問題,但是任何目標(biāo)檢測任務(wù)其實(shí)都存在前后背景的不平衡,一般會從三種方法進(jìn)行考慮,其一是做數(shù)據(jù)的上采樣和下采樣來平衡不同類別之間的數(shù)據(jù)量;其二是采用某些數(shù)據(jù)增廣的手段來增多前景目標(biāo)在一張圖像中的占比;其三是通過設(shè)計損失函數(shù)通過權(quán)重控制不同類別的優(yōu)化力度。

3

如何處理高分辨的輸入圖像?

較常見的方式就是像上述文章提到的對一張超大分辨率的圖片切割成多個子圖,但是在這一過程中存在幾個問題,比如:

目標(biāo)位于切割邊緣怎么辦?

切割的圖片大小如何設(shè)置?

目標(biāo)切割的問題在上面已經(jīng)提過,可以用重疊切割的方法解決目標(biāo)被截斷的問題。

假設(shè)數(shù)據(jù)集的圖片尺寸不同的前提下,我們可以從結(jié)果端反向思考切割尺寸的問題,一般會設(shè)置一個固定的子圖尺寸比如416×416,但是原圖可能無法剛好切割成整數(shù)個子圖,所以對最邊緣的子圖可以采用letterbox的方式縮放到416的尺寸,相比直接resize能夠保留物體特征。

4

如何提高密集小目標(biāo)檢測?

在目標(biāo)檢測領(lǐng)域中,小目標(biāo)檢測一直都是其中一個難點(diǎn)。針對該問題,近些年也提出了不少優(yōu)化的方式:

圖像金字塔進(jìn)行多尺度訓(xùn)練。將原始圖像生成多個不同分辨率的圖像金字塔,再對每層金字塔用固定輸入分辨率的分類器在該層滑動來檢測目標(biāo)。不過此方法需要對圖像做多次的特征提取,速度太慢。該方法也有改進(jìn)版本,如SNIP網(wǎng)絡(luò)只訓(xùn)練合適尺寸的目標(biāo),當(dāng)真值的尺寸和Anchor接近時才訓(xùn)練檢測器,過大過小的均丟棄。

特征金字塔融合淺層和深層信息,如FPN和PAN等。通過各層融合的方式從淺層網(wǎng)絡(luò)中學(xué)習(xí)更多的細(xì)節(jié)特征,從深層網(wǎng)絡(luò)中學(xué)習(xí)更多的語義特征。

設(shè)計與小目標(biāo)尺寸匹配的Anchor。不同任務(wù)的檢測目標(biāo)尺寸均有差異,可以根據(jù)先驗(yàn)知識,采用手工或者聚類的方式離線得到一定個數(shù)的Anchor。

采用空洞卷積減少下采樣次數(shù),其目的是考慮下采樣會丟失圖片的部分信息,而空洞卷積能夠在不增加參數(shù)量的同時具有更大的感受野,提供降低采樣次數(shù)的一種思路。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42448
  • 分辨率
    +關(guān)注

    關(guān)注

    2

    文章

    1129

    瀏覽量

    43406

原文標(biāo)題:如何在超大分辨率的圖片中檢測目標(biāo)?

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    YOLO5目標(biāo)檢測方案-基于米爾RK3576開發(fā)板

    本文基于米爾MYD-LR3576開發(fā)板,詳細(xì)記錄了如何利用500萬像素USB攝像頭實(shí)現(xiàn)640×640分辨率的YOLO5s目標(biāo)檢測,并將結(jié)果實(shí)時輸出至1080P屏幕的全流程。通過系統(tǒng)級的軟硬件協(xié)同優(yōu)化
    發(fā)表于 01-22 19:21

    淺談掃描電鏡的分辨率概念

    掃描電鏡(SEM)的分辨率是指其能夠分辨樣品表面兩點(diǎn)之間的最小距離,是衡量其成像能力的關(guān)鍵指標(biāo)。
    的頭像 發(fā)表于 01-14 16:55 ?1625次閱讀
    淺談掃描電鏡的<b class='flag-5'>分辨率</b>概念

    DLP9500:高分辨率空間照明調(diào)制的理想之選

    DLP9500:高分辨率空間照明調(diào)制的理想之選 在硬件設(shè)計的世界里,不斷追求高分辨率、高性能的空間照明調(diào)制解決方案是我們電子工程師的目標(biāo)。今天,就來和大家深入探討一下 DLP9500 這款 0.95
    的頭像 發(fā)表于 12-15 10:30 ?1420次閱讀

    紅外焦平面探測器的分辨率有哪些?高分辨率有哪些優(yōu)勢?

    分辨率是我們選購紅外探測器時的一個關(guān)鍵參數(shù),它代表了熱成像像素點(diǎn)的數(shù)量。分辨率越高,像素點(diǎn)就越多,圖像就越清晰,觀測的距離也越遠(yuǎn)。紅外熱成像常見的分辨率有120x90、256x192、384x288
    的頭像 發(fā)表于 12-10 16:12 ?1507次閱讀
    紅外焦平面探測器的<b class='flag-5'>分辨率</b>有哪些?高<b class='flag-5'>分辨率</b>有哪些優(yōu)勢?

    ADC分辨率與精度的區(qū)別是什么

    簡單點(diǎn)說,“精度”是用來描述物理量的準(zhǔn)確程度的,而“分辨率”是 用來描述刻度劃分的。從定義上看,這兩個量應(yīng)該是風(fēng)馬牛不相及的。(是不是有朋友感到愕然^_^)。 很多賣傳感器的JS就是利用這一點(diǎn)
    發(fā)表于 12-05 06:24

    鏡頭分辨率如何匹配工業(yè)相機(jī)的分辨率

    能被分辨開來的兩個物點(diǎn)之間的最小距離,就是鏡頭的物方分辨率。單位為μm。這只是單純鏡頭本身的參數(shù),只反映鏡頭的解析能力,而和工業(yè)相機(jī)多少像素?zé)o關(guān)!它直接反映了,一個理想物點(diǎn)經(jīng)過鏡頭成像后,會模糊
    的頭像 發(fā)表于 11-21 15:43 ?541次閱讀
    鏡頭<b class='flag-5'>分辨率</b>如何匹配工業(yè)相機(jī)的<b class='flag-5'>分辨率</b>

    電能質(zhì)量在線監(jiān)測裝置的暫態(tài)記錄分辨率如何影響故障類型識別?

    暫態(tài)記錄分辨率是故障類型識別的 “細(xì)節(jié)放大鏡”—— 核心通過 采樣、幅值分辨率、時間分辨率 決定故障波形 “特征細(xì)節(jié)的完整性”,高分辨率
    的頭像 發(fā)表于 11-14 16:10 ?2023次閱讀
    電能質(zhì)量在線監(jiān)測裝置的暫態(tài)記錄<b class='flag-5'>分辨率</b>如何影響故障類型識別?

    N9H30 可以支持最大分辨率是多少?

    [i]N9H30 可以支持最大分辨率是多少?
    發(fā)表于 09-05 06:14

    精度,重復(fù)精度和分辨率有什么關(guān)聯(lián)

    精度,重復(fù)精度和分辨率,這三個令人疑惑的術(shù)語有很多種定義方法。
    的頭像 發(fā)表于 07-26 17:13 ?1181次閱讀
    精度,重復(fù)精度和<b class='flag-5'>分辨率</b>有什么關(guān)聯(lián)

    分辨率 vs 噪聲 —— ADC的挑戰(zhàn)

    設(shè)計者常用高分辨率 ADC 以降低最低可量測單位(LSB),提高檢測精度。 比如一個 16 位 ADC 在 5V 范圍內(nèi), LSB ≈ 76 μV ;理想情況下可以檢測到微弱電信號。 問題是: 若
    的頭像 發(fā)表于 06-23 07:38 ?2405次閱讀
    <b class='flag-5'>分辨率</b> vs 噪聲 —— ADC的挑戰(zhàn)

    如何計算存儲示波器的垂直分辨率

    存儲示波器的垂直分辨率是指示波器能夠分辨的最小電壓變化量,它反映了示波器對信號幅度細(xì)節(jié)的測量能力,通常用位數(shù)(bit)來表示,也可通過相關(guān)公式換算為具體的電壓值。以下為你詳細(xì)介紹其計算方法:了解關(guān)鍵
    發(fā)表于 05-30 14:03

    FX3板是否兼容2k和4k分辨率的視頻數(shù)據(jù)流?

    數(shù)據(jù)流的最大幀頻是多少? 3. 電路板支持的最大分辨率是多少? 4.如何計算改變分辨率和幀頻時的 DMA 緩沖區(qū)大?。?請就上述問題向我提供指導(dǎo)。
    發(fā)表于 05-23 06:35

    PC電腦USB3.0接口無法識別CX3設(shè)備分辨率怎么解決?

    我正在使用CX3065來捕獲圖像,我發(fā)現(xiàn)有些USB3.0接口無法找到分辨率,現(xiàn)在我嘗試了幾臺筆記本電腦,我發(fā)現(xiàn)USB3.0接口提供關(guān)機(jī)充電,它可以識別CX3設(shè)備分辨率。 我保存了是或否的USB接口圖片。 我猜想改變 CX3 防火
    發(fā)表于 05-15 08:26

    AN75779中描述的圖像傳感器接口支持的最大分辨率和幀速率嗎?

    AN75779中描述的圖像傳感器接口支持的最大分辨率和幀速率嗎? 我想通過連接 FX3 和 Semtech GS2971(SDI 解串器)來實(shí)現(xiàn) 1920 x1080 @ 30 fps 視頻輸入的 UVC 流設(shè)計,無需 FPGA。 可能嗎?
    發(fā)表于 05-14 06:30

    CX3上的AR0245傳感器的探頭控制分辨率錯誤怎么解決?

    的 cycx3_videostreaming.c 代碼如何在CyCx3UvcAppImageSensorSetVideoResolution 中定義正確的分辨率,但在CyCx3UvcAppGetProbeControlData
    發(fā)表于 05-12 07:02
    库伦旗| 拉孜县| 太仆寺旗| 顺平县| 汝阳县| 弥勒县| 定日县| 安福县| 正镶白旗| 黄冈市| 汽车| 西城区| 漯河市| 山丹县| 逊克县| 德庆县| 平罗县| 马鞍山市| 贺州市| 拉孜县| 安庆市| 荆门市| 广南县| 边坝县| 报价| 乌鲁木齐市| 桂阳县| 芜湖县| 手游| 昂仁县| 株洲县| 双辽市| 彰化市| 纳雍县| 舟山市| 荃湾区| 淮安市| 军事| 砀山县| 宣恩县| 嘉峪关市|