日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

一文帶你讀懂全景分割

自行科技 ? 來源:自行科技 ? 作者:自行科技 ? 2022-09-08 13:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

圖像分割(image segmentation)是根據(jù)灰度、色彩、空間紋理、幾何形狀等特征將圖片分成若干個特定的、具有獨特性質(zhì)的區(qū)域,并提出感興趣目標的技術和過程。

目前圖像分割發(fā)展出以下幾個子領域:

語義分割(semantic segmentation)

是將輸入圖像中的每個像素點預測為不同的語義類別。更注重類別之間的區(qū)分,會重點將前景里的車輛和背景里的房屋、天空、地面分割開,但是不區(qū)分重疊車輛。主要有FCN,DeepLab,PSPNet等方法。

實例分割(instance segmentation)

是目標檢測和語義分割的結(jié)合,將輸入圖像中的目標檢測出來,對目標包含的每個像素分配類別標簽。更注重前景中目標個體之間的分割,背景的房屋、天空、地面均為一類。主要有DeepMask,Mask R-CNN,PANet等方法。

全景分割(panoptic segmentation)

是語義分割和實例分割的綜合,旨在同時分割實例層面的目標(thing)和語義層面的背景內(nèi)容(stuff),將輸入圖像中的每個像素點賦予類別標簽和實例ID,生成全局的,統(tǒng)一的分割圖像。

poYBAGMZgkSAdABMAAD0J0Eu_P8805.png

01 全景分割的應用與發(fā)展

從輸入數(shù)據(jù)上分類,全景分割可以分為基于RGB圖像的全景分割和基于點云數(shù)據(jù)的全景分割。

基于RGB圖像的全景分割算法可以分為三類。

1.box-based,thing和stuff使用不同的分支預測,其中thing的分割基于目標檢測boxes。

如Panoptic FPN模型,首先進行特征提取,然后接兩個分支分別預測實例分割和語義分割。其中實例分割分支的預測過程是先預測出實例的boxes,再在每個box的范圍內(nèi)預測出對應的實例分割,所以box-based的全景分割最終的預測結(jié)果主要取決于boxes的預測精度。語義分割分支直接預測輸出結(jié)果。最后融合兩個分支結(jié)果得到全景分割。

pYYBAGMZgkSADLBvAABmR6Fi6j4677.png

由于通過兩個分支分別預測thing和stuff,會導致出現(xiàn)兩個分支預測結(jié)果有重合區(qū)域,后處理去重過程和NMS比較類似:

(1)根據(jù)不同thing的置信度來去除重疊部分;

(2)以thing優(yōu)先原則去除thing和stuff之間的重疊部分;

(3)去除stuff標記為“其他”或者低于給定面積閾值的區(qū)域。

上述模型中

使用FPN(Feature Pyramid Network)特征金字塔網(wǎng)絡作為主干網(wǎng)絡。使用一個標準的網(wǎng)絡提取多個空間位置的特征,再在網(wǎng)絡的最高層開始上采樣并和對應的特征提取網(wǎng)絡橫向連接,生成多個尺度的特征圖,從而獲得多尺度的語義信息。

因為網(wǎng)絡高層的特征雖然包含了豐富的語義信息,但是由于低分辨率,很難準確地保存物體的位置信息。與之相反,低層的特征雖然語義信息較少,但是由于分辨率高,就可以準確地包含物體位置信息,所以通過融合這些不同層的特征能達到識別和定位更準確的預測效果。

FPN可以應用到各種網(wǎng)絡模型,提升模型效果。如目標檢測模型Faster R-CNN,實例分割模型Mask R-CNN,以及下述全景分割網(wǎng)絡Panoptic FCN。

poYBAGMZgkWAZ3JpAABFiP4HAi432.jpeg

特征金字塔網(wǎng)絡

2.box-free,thing和stuff使用不同的分支預測,先預測語義再生成實例,不需要先進行目標檢測。

如Panoptic-DeepLab模型,去除了Panoptic FPN的box預測部分,直接預測出thing和stuff。為了得到目標實例預測,在實例分割分支同時預測了每個實例的中心點及其heatmap,得到像素點與實例關鍵點之間的關系,并依此融合形成類別未知的不同實例,另外語義分割分支直接預測輸出,最后結(jié)合兩個分支輸出得到全景分割的結(jié)果。

與box-based方法相比,去除了boxes預測步驟,推理速度更快,減少了由于boxes的限制對分割精度的影響。

pYYBAGMZgkWAdRhWAABtE5viB1Q338.png

3.thing和stuff完全使用相同的結(jié)構(gòu)進行預測,如Panoptic-FCN。

Panoptic FCN是將thing和stuff統(tǒng)一成特征描述子(kernels)來進行預測。主要由FPN、Kernel Generator、Kernel Fusion和Feature Encoder四個部分組成。

先通過FPN得到多尺度特征圖,對每個特征圖的thing和stuff生成kernels權(quán)重,然后通過Kernel Fusion對多個特征圖的kernels權(quán)重進行合并。

Kernel Generator由Kernel Head和Position Head兩個分支構(gòu)成,首先同時預測thing和stuff的位置,其中,thing通過預測中心點(centers)來定位和分類,stuff通過預測區(qū)域(regions)來定位和分類,然后根據(jù)thing和stuff的位置,從Kernel Head中產(chǎn)生kernels權(quán)重。Feature Encoder用來對高分辨率特征進行編碼,最后將得到的kernels權(quán)重和編碼特征融合得到最終預測結(jié)果。

上述的box-based和box-free全景分割都是將thing和stuff拆分成兩個分支來進行預測的,這必然會引入更多的后處理還有設計不同分支信息融合的操作,使得整個系統(tǒng)既冗余又復雜。

Panoptic FCN實現(xiàn)了真正的端到端全景分割,省去了子任務融合的操作,推理速度快,效果好。

poYBAGMZgkWAKloVAAC4xAGFBTQ663.png

02 全景分割在自動駕駛中的應用

1.可行駛區(qū)域識別,分割路面及車道線確定機動車行駛區(qū)域或者當前車道區(qū)域等。

由于這種區(qū)域通常是不規(guī)則多邊形,所以使用分割是一種比較好的解決方法。但是也存在邊緣分割不準確的問題。

2.判斷碰撞區(qū)域內(nèi)是否有車輛、行人,與目標檢測相比,分割能更精確表示車輛及行人的邊界位置。但是圖像中目標重疊時,存在像素分配沖突問題。

03 示例圖

1、ADAS視角城市道路全景分割。

pYYBAGMZgkWAebtlAABmxvxrHjU30.jpeg

poYBAGMZgkWAB1UAAACIMknL_fY28.jpeg

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • RGB
    RGB
    +關注

    關注

    4

    文章

    836

    瀏覽量

    62261
  • 圖像分割
    +關注

    關注

    4

    文章

    182

    瀏覽量

    18832
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    讀懂接口模塊的組合應用有哪些?

    讀懂接口模塊的組合應用有哪些?
    發(fā)表于 05-17 07:15

    讀懂如何去優(yōu)化AC耦合電容?

    讀懂如何去優(yōu)化AC耦合電容?
    發(fā)表于 06-08 07:04

    讀懂什么是NEC協(xié)議

    讀懂什么是NEC協(xié)議?
    發(fā)表于 10-15 09:22

    讀懂中斷方式和輪詢操作有什么區(qū)別嗎

    讀懂中斷方式和輪詢操作有什么區(qū)別嗎?
    發(fā)表于 12-10 06:00

    讀懂車載攝像頭產(chǎn)業(yè)鏈

    車載攝像頭的快速成長將帶動產(chǎn)業(yè)鏈中其他環(huán)節(jié)的直接受益,攝像頭主要組成部分是鏡頭、CMOS傳感器、DSP、模組組裝及其他部件。帶你讀懂車載攝像頭產(chǎn)業(yè)鏈~
    發(fā)表于 11-22 15:41 ?29次下載

    匯總當前主流的分割網(wǎng)絡

    本文的12篇文章總結(jié)了當前主流的分割網(wǎng)絡及其結(jié)構(gòu),涵蓋從編解碼結(jié)構(gòu)到解碼器設計;從感受野到多尺度融合;從CNN到RNN與CRF;從2D分割到3D分割;從語義分割到實例
    的頭像 發(fā)表于 06-29 09:21 ?8339次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b>匯總當前主流的<b class='flag-5'>分割</b>網(wǎng)絡

    讀懂NB-IoT 的現(xiàn)狀、挑戰(zhàn)和前景

    讀懂 NB-IoT 的現(xiàn)狀、挑戰(zhàn)和前景
    的頭像 發(fā)表于 02-28 15:42 ?7695次閱讀

    帶你讀懂耦合與退耦,上拉與下拉資料下載

    電子發(fā)燒友網(wǎng)為你提供帶你讀懂耦合與退耦,上拉與下拉資料下載的電子資料下載,更有其他相關的電路圖、源代碼、課件教程、中文資料、英文資料、參考設計、用戶指南、解決方案等資料,希望可以幫
    發(fā)表于 04-21 08:50 ?23次下載
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>帶你</b><b class='flag-5'>讀懂</b>耦合與退耦,上拉與下拉資料下載

    讀懂MCU的特點、功能及如何編寫

    讀懂MCU的特點、功能及如何編寫
    發(fā)表于 12-05 09:51 ?24次下載
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>MCU的特點、功能及如何編寫

    讀懂圖像分割

    圖像分割(Image Segmentation)是計算機視覺領域中的項重要基礎技術,是圖像理解中的重要環(huán)。
    的頭像 發(fā)表于 02-28 09:55 ?3042次閱讀

    沒你想的那么難 | 讀懂圖像分割

    來源:圖靈Topia(ID:turingtopia)圖像分割(ImageSegmentation)是計算機視覺領域中的項重要基礎技術,是圖像理解中的重要環(huán)。近日,數(shù)據(jù)科學家
    的頭像 發(fā)表于 05-16 09:21 ?2217次閱讀
    沒你想的那么難 | <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>圖像<b class='flag-5'>分割</b>

    讀懂,什么是BLE?

    讀懂,什么是BLE?
    的頭像 發(fā)表于 11-27 17:11 ?4897次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>,什么是BLE?

    讀懂車規(guī)級AEC-Q認證

    讀懂車規(guī)級AEC-Q認證
    的頭像 發(fā)表于 12-04 16:45 ?2207次閱讀

    讀懂微力扭轉(zhuǎn)試驗機的優(yōu)勢

    讀懂微力扭轉(zhuǎn)試驗機的優(yōu)勢
    的頭像 發(fā)表于 11-30 09:08 ?1446次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>微力扭轉(zhuǎn)試驗機的優(yōu)勢

    讀懂單燈控制器工作原理

    讀懂單燈控制器工作原理
    的頭像 發(fā)表于 11-11 13:13 ?2778次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>單燈控制器工作原理
    漯河市| 田阳县| 广宗县| 安宁市| 钦州市| 平原县| 广德县| 常州市| 宜川县| 封丘县| 横山县| 九台市| 易门县| 将乐县| 永清县| 贵港市| 塘沽区| 淮阳县| 江阴市| 远安县| 中山市| 乐业县| 潼南县| 荔浦县| 开平市| 台山市| 怀集县| 长沙市| 宜都市| 含山县| 喀喇沁旗| 满洲里市| 久治县| 西畴县| 井研县| 桐乡市| 灵台县| 资兴市| 加查县| 平乡县| 横峰县|