97久久久久久久,亚洲婷婷不卡网

[首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛的純視覺方案中，單目攝像頭因無法直接感知深度，在環(huán)境理解上存在根本局限，雙目視覺技術(shù)在此需求下應(yīng)運(yùn)而生。它通過模擬人眼，利用雙攝像頭的視差來推算距離，將二維圖像轉(zhuǎn)化為三維信息，從而為車輛決策提供關(guān)鍵的深度感知能力。

什么是雙目深度估計(jì)？

平時(shí)我們用眼睛看東西其實(shí)就是一種最自然的深度估計(jì)。人的兩只眼睛有一定的間距，大腦通過融合兩只眼睛看到的略有不同的圖像來判斷遠(yuǎn)近。計(jì)算機(jī)視覺里“雙目深度估計(jì)”就是借鑒這個(gè)原理，將兩個(gè)相機(jī)并排排列，并拍下同一場景，然后分析兩幅圖像的差異來推算距離。

單目攝像頭拍攝的二維圖像，僅包含色彩與亮度信息，無法直接提供場景中物體的距離數(shù)據(jù)。要獲取“距離”這一關(guān)鍵的深度信息，關(guān)鍵在于利用視差，也就是在另一個(gè)位置放置第二個(gè)相機(jī)，同時(shí)對同一場景成像。此時(shí)，物體在兩個(gè)視角的圖像中會(huì)產(chǎn)生位置偏移，通過計(jì)算這一偏移量，便可以精確推算出物體的三維距離。

圖片源自：網(wǎng)絡(luò)

如果我們知道了兩個(gè)攝像頭之間的距離（基線）和攝像機(jī)的焦距，當(dāng)我們找到兩個(gè)圖像里同一個(gè)物體對應(yīng)點(diǎn)的位置差（視差）時(shí)，就能用一個(gè)非常簡單的公式計(jì)算出這個(gè)點(diǎn)的真實(shí)深度，即：

深度=焦距×基線/視差。

從公式中我們可以看到，視差越大，物體越近；視差越小，物體越遠(yuǎn)。

雙目深度估計(jì)的主要步驟

既然說到了視差，那么關(guān)鍵問題來了，怎么從一對左右圖像里找到這些對應(yīng)點(diǎn)？這中間其實(shí)涉及到多個(gè)流程。

圖片源自：網(wǎng)絡(luò)

兩個(gè)攝像頭從出廠到裝在一起時(shí)，會(huì)有一些位置和角度誤差，所以我們需要先做幾何標(biāo)定，確定每個(gè)攝像頭的內(nèi)部參數(shù)（比如焦距、主點(diǎn)位置）和它們之間的外部關(guān)系（位置和朝向）。只有這樣才能讓后面比較兩個(gè)圖像時(shí)的像素位置是準(zhǔn)確對應(yīng)的。

在完成雙目系統(tǒng)的校準(zhǔn)后，接下來要做的就是立體矯正。這一過程的目的是把兩個(gè)圖像都調(diào)整成在同一條水平線上，這樣同一場景點(diǎn)在左右圖像里的對應(yīng)關(guān)系只會(huì)在水平方向上變化，這極大簡化了后面的匹配難度。

立體匹配的核心任務(wù)，就是在左右兩幅圖像中為同一物體找到相互對應(yīng)的像素點(diǎn)。由于之前已經(jīng)做了立體矯正，這個(gè)搜索被大大簡化了，只需要在右圖中沿著與左圖像素點(diǎn)對應(yīng)的同一水平線去掃描，找出看起來最相似的那個(gè)區(qū)域即可。盡管如此，要為圖像中每一個(gè)像素找到對應(yīng)點(diǎn)，計(jì)算量依然會(huì)非常龐大。因此可借助如經(jīng)典的塊匹配（Block Matching）或效果更優(yōu)的半全局匹配（Semi-Global Matching,SGM）來實(shí)現(xiàn)高效的匹配。

當(dāng)我們找到每個(gè)像素的對應(yīng)關(guān)系之后，就可以算出視差值。視差是同一個(gè)點(diǎn)在左右圖像中水平方向坐標(biāo)差的數(shù)量，這個(gè)差值越大代表這個(gè)點(diǎn)離相機(jī)越近。最后，把視差值帶入我們前面提到的公式，就能得到每一個(gè)像素對應(yīng)的深度值。這樣我們就生成了一張“深度圖”，每個(gè)像素不再只是顏色信息，還可以是一個(gè)距離值。

深度學(xué)習(xí)方法對雙目深度估計(jì)有何作用？

通過傳統(tǒng)計(jì)算機(jī)視覺方法完成上面的這些步驟，其實(shí)就可以做好雙目深度估計(jì)了，但是傳統(tǒng)方法主要依賴手工設(shè)計(jì)的特征和匹配算法，如比較左右圖像里像素塊的相似度，然后決定它們是不是對應(yīng)的點(diǎn)。這樣一來在一些紋理稀少的區(qū)域、光照變化大的情況下，這種匹配就很容易出錯(cuò)，而且計(jì)算量也不小。

近年來，深度學(xué)習(xí)也被引入雙目深度估計(jì)領(lǐng)域。其核心目標(biāo)與傳統(tǒng)方法一致，仍是尋找左右圖像間的對應(yīng)關(guān)系并計(jì)算視差，但實(shí)現(xiàn)方式發(fā)生了根本改變。深度學(xué)習(xí)不再依賴人工設(shè)計(jì)的匹配代價(jià)與規(guī)則，而是通過卷積神經(jīng)網(wǎng)絡(luò)自動(dòng)從數(shù)據(jù)中學(xué)習(xí)匹配特征。

圖片源自：網(wǎng)絡(luò)

該網(wǎng)絡(luò)以左右視圖作為輸入，直接輸出視差圖或深度圖。在大量立體圖像數(shù)據(jù)訓(xùn)練下，網(wǎng)絡(luò)能夠自主掌握哪些圖像特征利于匹配、哪些場景容易產(chǎn)生歧義，從而顯著提升匹配的魯棒性。因此，在遮擋區(qū)域、重復(fù)紋理或缺乏紋理的環(huán)境等傳統(tǒng)方法容易失效的場景下，基于深度學(xué)習(xí)的方法會(huì)表現(xiàn)出更高的準(zhǔn)確度和穩(wěn)定性。

深度學(xué)習(xí)方法的處理流程是先用神經(jīng)網(wǎng)絡(luò)提取左右圖像的特征，然后構(gòu)建一個(gè)“代價(jià)體”，表示在不同視差值下左右特征的匹配代價(jià)。接著再讓網(wǎng)絡(luò)學(xué)習(xí)從代價(jià)體里回歸出最終的視差值。整個(gè)過程可以端到端訓(xùn)練，不需要手工調(diào)各種參數(shù)。

當(dāng)然，端到端的深度學(xué)習(xí)系統(tǒng)需要大量帶真實(shí)深度標(biāo)注的數(shù)據(jù)來訓(xùn)練模型，而且在訓(xùn)練數(shù)據(jù)和真實(shí)應(yīng)用場景不一致時(shí)表現(xiàn)可能下降。這就需要一些自監(jiān)督、數(shù)據(jù)增強(qiáng)等策略來提升魯棒性。

雙目深度估計(jì)會(huì)遇到什么問題？

雙目深度估計(jì)一個(gè)常見的問題是像素匹配不準(zhǔn)確。如果物體表面沒什么紋理，兩個(gè)視角的圖像看起來就會(huì)一模一樣，這就讓系統(tǒng)難以判斷哪個(gè)點(diǎn)是對應(yīng)到哪個(gè)點(diǎn)。有些算法為了彌補(bǔ)這個(gè)問題，會(huì)用更復(fù)雜的特征或者上下文信息來輔助匹配，但仍不是萬無一失的。

圖片源自：網(wǎng)絡(luò)

我們講的匹配過程是假設(shè)兩個(gè)圖像在同一時(shí)間點(diǎn)拍的。如果場景里有如行人、車輛等移動(dòng)的物體，而兩個(gè)攝像頭抓拍的時(shí)間有微小差異，這就會(huì)讓匹配變得更難。深度學(xué)習(xí)方法可以用時(shí)序信息來緩解，但這本質(zhì)上還是一個(gè)復(fù)雜問題。

在雙目立體系統(tǒng)的設(shè)計(jì)中，基線長度的選取，本質(zhì)上是在測量精度和工程落地之間做選擇。基線越長，同一物體在左右圖像中產(chǎn)生的視差就越大，這不僅使匹配更容易，也能有效提高深度估計(jì)的精度。過長的基線會(huì)帶來安裝空間、機(jī)械穩(wěn)定性以及視野重疊區(qū)域減少等問題。但基線過短，遠(yuǎn)處物體的視差將變得極其微小，在像素級(jí)的計(jì)算中很容易被圖像噪聲、量化誤差等因素所淹沒，從而導(dǎo)致深度估計(jì)失效。

最后，還有像光照變化、遮擋、反射表面這些現(xiàn)實(shí)場景都會(huì)讓匹配變得不穩(wěn)定。這也是為什么在雙目系統(tǒng)設(shè)計(jì)中，需要花費(fèi)大量精力在圖像預(yù)處理、匹配優(yōu)化、后處理濾波等步驟上。

最后的話

雙目深度估計(jì)的應(yīng)用場景十分廣泛，除了自動(dòng)駕駛，它在工業(yè)檢測、無人機(jī)測繪、實(shí)時(shí)三維建模等領(lǐng)域也發(fā)揮著重要作用。在需要快速感知和重建三維空間的場景中，雙目視覺結(jié)合點(diǎn)云生成等技術(shù)，能夠?qū)崿F(xiàn)高效的實(shí)時(shí)環(huán)境建模。雖然激光雷達(dá)等主動(dòng)式傳感器在精度上更具優(yōu)勢，但雙目方案以其顯著的成本優(yōu)勢，成為許多對成本敏感應(yīng)用的理想選擇。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴