日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

雙目視覺是如何實(shí)現(xiàn)深度估計(jì)的?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2025-12-31 09:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛的純視覺方案中,單目攝像頭因無法直接感知深度,在環(huán)境理解上存在根本局限,雙目視覺技術(shù)在此需求下應(yīng)運(yùn)而生。它通過模擬人眼,利用雙攝像頭的視差來推算距離,將二維圖像轉(zhuǎn)化為三維信息,從而為車輛決策提供關(guān)鍵的深度感知能力。

wKgZPGlUgEmAKvFWAAAQo00DEvw541.jpg

什么是雙目深度估計(jì)?

平時(shí)我們用眼睛看東西其實(shí)就是一種最自然的深度估計(jì)。人的兩只眼睛有一定的間距,大腦通過融合兩只眼睛看到的略有不同的圖像來判斷遠(yuǎn)近。計(jì)算機(jī)視覺里“雙目深度估計(jì)”就是借鑒這個(gè)原理,將兩個(gè)相機(jī)并排排列,并拍下同一場景,然后分析兩幅圖像的差異來推算距離。

單目攝像頭拍攝的二維圖像,僅包含色彩與亮度信息,無法直接提供場景中物體的距離數(shù)據(jù)。要獲取“距離”這一關(guān)鍵的深度信息,關(guān)鍵在于利用視差,也就是在另一個(gè)位置放置第二個(gè)相機(jī),同時(shí)對同一場景成像。此時(shí),物體在兩個(gè)視角的圖像中會(huì)產(chǎn)生位置偏移,通過計(jì)算這一偏移量,便可以精確推算出物體的三維距離。

wKgZO2lUgEqAGQMvAAA24pg8z-g051.jpg

圖片源自:網(wǎng)絡(luò)

如果我們知道了兩個(gè)攝像頭之間的距離(基線)和攝像機(jī)的焦距,當(dāng)我們找到兩個(gè)圖像里同一個(gè)物體對應(yīng)點(diǎn)的位置差(視差)時(shí),就能用一個(gè)非常簡單的公式計(jì)算出這個(gè)點(diǎn)的真實(shí)深度,即:

深度=焦距×基線/視差。

從公式中我們可以看到,視差越大,物體越近;視差越小,物體越遠(yuǎn)。

wKgZPGlUgEqAf93jAAAR42n7O-I885.jpg

雙目深度估計(jì)的主要步驟

既然說到了視差,那么關(guān)鍵問題來了,怎么從一對左右圖像里找到這些對應(yīng)點(diǎn)?這中間其實(shí)涉及到多個(gè)流程。

wKgZO2lUgEqAKapUAABKhNTX3Gc934.jpg

圖片源自:網(wǎng)絡(luò)

兩個(gè)攝像頭從出廠到裝在一起時(shí),會(huì)有一些位置和角度誤差,所以我們需要先做幾何標(biāo)定,確定每個(gè)攝像頭的內(nèi)部參數(shù)(比如焦距、主點(diǎn)位置)和它們之間的外部關(guān)系(位置和朝向)。只有這樣才能讓后面比較兩個(gè)圖像時(shí)的像素位置是準(zhǔn)確對應(yīng)的。

在完成雙目系統(tǒng)的校準(zhǔn)后,接下來要做的就是立體矯正。這一過程的目的是把兩個(gè)圖像都調(diào)整成在同一條水平線上,這樣同一場景點(diǎn)在左右圖像里的對應(yīng)關(guān)系只會(huì)在水平方向上變化,這極大簡化了后面的匹配難度。

立體匹配的核心任務(wù),就是在左右兩幅圖像中為同一物體找到相互對應(yīng)的像素點(diǎn)。由于之前已經(jīng)做了立體矯正,這個(gè)搜索被大大簡化了,只需要在右圖中沿著與左圖像素點(diǎn)對應(yīng)的同一水平線去掃描,找出看起來最相似的那個(gè)區(qū)域即可。盡管如此,要為圖像中每一個(gè)像素找到對應(yīng)點(diǎn),計(jì)算量依然會(huì)非常龐大。因此可借助如經(jīng)典的塊匹配(Block Matching)或效果更優(yōu)的半全局匹配(Semi-Global Matching,SGM)來實(shí)現(xiàn)高效的匹配。

當(dāng)我們找到每個(gè)像素的對應(yīng)關(guān)系之后,就可以算出視差值。視差是同一個(gè)點(diǎn)在左右圖像中水平方向坐標(biāo)差的數(shù)量,這個(gè)差值越大代表這個(gè)點(diǎn)離相機(jī)越近。最后,把視差值帶入我們前面提到的公式,就能得到每一個(gè)像素對應(yīng)的深度值。這樣我們就生成了一張“深度圖”,每個(gè)像素不再只是顏色信息,還可以是一個(gè)距離值。

wKgZPGlUgEuASa8jAAASG3BOmsQ766.jpg

深度學(xué)習(xí)方法對雙目深度估計(jì)有何作用?

通過傳統(tǒng)計(jì)算機(jī)視覺方法完成上面的這些步驟,其實(shí)就可以做好雙目深度估計(jì)了,但是傳統(tǒng)方法主要依賴手工設(shè)計(jì)的特征和匹配算法,如比較左右圖像里像素塊的相似度,然后決定它們是不是對應(yīng)的點(diǎn)。這樣一來在一些紋理稀少的區(qū)域、光照變化大的情況下,這種匹配就很容易出錯(cuò),而且計(jì)算量也不小。

近年來,深度學(xué)習(xí)也被引入雙目深度估計(jì)領(lǐng)域。其核心目標(biāo)與傳統(tǒng)方法一致,仍是尋找左右圖像間的對應(yīng)關(guān)系并計(jì)算視差,但實(shí)現(xiàn)方式發(fā)生了根本改變。深度學(xué)習(xí)不再依賴人工設(shè)計(jì)的匹配代價(jià)與規(guī)則,而是通過卷積神經(jīng)網(wǎng)絡(luò)自動(dòng)從數(shù)據(jù)中學(xué)習(xí)匹配特征。

wKgZO2lUgEuAMCBhAGWxt35A574746.jpg

圖片源自:網(wǎng)絡(luò)

該網(wǎng)絡(luò)以左右視圖作為輸入,直接輸出視差圖或深度圖。在大量立體圖像數(shù)據(jù)訓(xùn)練下,網(wǎng)絡(luò)能夠自主掌握哪些圖像特征利于匹配、哪些場景容易產(chǎn)生歧義,從而顯著提升匹配的魯棒性。因此,在遮擋區(qū)域、重復(fù)紋理或缺乏紋理的環(huán)境等傳統(tǒng)方法容易失效的場景下,基于深度學(xué)習(xí)的方法會(huì)表現(xiàn)出更高的準(zhǔn)確度和穩(wěn)定性。

深度學(xué)習(xí)方法的處理流程是先用神經(jīng)網(wǎng)絡(luò)提取左右圖像的特征,然后構(gòu)建一個(gè)“代價(jià)體”,表示在不同視差值下左右特征的匹配代價(jià)。接著再讓網(wǎng)絡(luò)學(xué)習(xí)從代價(jià)體里回歸出最終的視差值。整個(gè)過程可以端到端訓(xùn)練,不需要手工調(diào)各種參數(shù)。

當(dāng)然,端到端的深度學(xué)習(xí)系統(tǒng)需要大量帶真實(shí)深度標(biāo)注的數(shù)據(jù)來訓(xùn)練模型,而且在訓(xùn)練數(shù)據(jù)和真實(shí)應(yīng)用場景不一致時(shí)表現(xiàn)可能下降。這就需要一些自監(jiān)督、數(shù)據(jù)增強(qiáng)等策略來提升魯棒性。

wKgZPGlUgE2AKAIEAAASAJELks8096.jpg

雙目深度估計(jì)會(huì)遇到什么問題?

雙目深度估計(jì)一個(gè)常見的問題是像素匹配不準(zhǔn)確。如果物體表面沒什么紋理,兩個(gè)視角的圖像看起來就會(huì)一模一樣,這就讓系統(tǒng)難以判斷哪個(gè)點(diǎn)是對應(yīng)到哪個(gè)點(diǎn)。有些算法為了彌補(bǔ)這個(gè)問題,會(huì)用更復(fù)雜的特征或者上下文信息來輔助匹配,但仍不是萬無一失的。

wKgZO2lUgE6AKPLmAAadZZ1MXyI284.jpg

圖片源自:網(wǎng)絡(luò)

我們講的匹配過程是假設(shè)兩個(gè)圖像在同一時(shí)間點(diǎn)拍的。如果場景里有如行人、車輛等移動(dòng)的物體,而兩個(gè)攝像頭抓拍的時(shí)間有微小差異,這就會(huì)讓匹配變得更難。深度學(xué)習(xí)方法可以用時(shí)序信息來緩解,但這本質(zhì)上還是一個(gè)復(fù)雜問題。

在雙目立體系統(tǒng)的設(shè)計(jì)中,基線長度的選取,本質(zhì)上是在測量精度和工程落地之間做選擇。基線越長,同一物體在左右圖像中產(chǎn)生的視差就越大,這不僅使匹配更容易,也能有效提高深度估計(jì)的精度。過長的基線會(huì)帶來安裝空間、機(jī)械穩(wěn)定性以及視野重疊區(qū)域減少等問題。但基線過短,遠(yuǎn)處物體的視差將變得極其微小,在像素級(jí)的計(jì)算中很容易被圖像噪聲、量化誤差等因素所淹沒,從而導(dǎo)致深度估計(jì)失效。

最后,還有像光照變化、遮擋、反射表面這些現(xiàn)實(shí)場景都會(huì)讓匹配變得不穩(wěn)定。這也是為什么在雙目系統(tǒng)設(shè)計(jì)中,需要花費(fèi)大量精力在圖像預(yù)處理、匹配優(yōu)化、后處理濾波等步驟上。

wKgZPGlUgE6APePuAAARwcz1hbg184.jpg

最后的話

雙目深度估計(jì)的應(yīng)用場景十分廣泛,除了自動(dòng)駕駛,它在工業(yè)檢測、無人機(jī)測繪、實(shí)時(shí)三維建模等領(lǐng)域也發(fā)揮著重要作用。在需要快速感知和重建三維空間的場景中,雙目視覺結(jié)合點(diǎn)云生成等技術(shù),能夠?qū)崿F(xiàn)高效的實(shí)時(shí)環(huán)境建模。雖然激光雷達(dá)等主動(dòng)式傳感器在精度上更具優(yōu)勢,但雙目方案以其顯著的成本優(yōu)勢,成為許多對成本敏感應(yīng)用的理想選擇。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 雙目視覺
    +關(guān)注

    關(guān)注

    2

    文章

    39

    瀏覽量

    14539
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    一文帶你了解雙目深度相機(jī)

    在如今的智能化時(shí)代,不管是工業(yè)車間里的機(jī)器人、家里的掃地機(jī)器人,還是AR眼鏡、自動(dòng)駕駛汽車,都需要一雙能“看懂”三維世界的“眼睛”——雙目深度相機(jī)就是這樣一款設(shè)備??赡苡腥藭?huì)問,這東西到底是啥?其實(shí)
    的頭像 發(fā)表于 04-14 14:30 ?240次閱讀
    一文帶你了解<b class='flag-5'>雙目</b><b class='flag-5'>深度</b>相機(jī)

    雙目深度相機(jī):模擬人眼視覺,解鎖三維感知新可能

    在三維感知技術(shù)快速迭代的現(xiàn)在,深度相機(jī)作為機(jī)器獲取空間信息的重要“眼睛”,已滲透到工業(yè)自動(dòng)化、機(jī)器人導(dǎo)航、AR/VR、智能家居等多個(gè)領(lǐng)域。其中,雙目深度相機(jī)憑借其被動(dòng)式工作、成本可控、強(qiáng)光適應(yīng)性強(qiáng)等
    的頭像 發(fā)表于 04-13 14:50 ?283次閱讀
    <b class='flag-5'>雙目</b><b class='flag-5'>深度</b>相機(jī):模擬人眼<b class='flag-5'>視覺</b>,解鎖三維感知新可能

    2026視覺檢測產(chǎn)業(yè)深度調(diào)研及未來趨勢分析

    視覺檢測技術(shù)融合深度學(xué)習(xí)與多模態(tài)傳感,實(shí)現(xiàn)從輔助工具向決策中樞的轉(zhuǎn)變,推動(dòng)智能制造與工業(yè)4.0發(fā)展。
    的頭像 發(fā)表于 04-01 09:26 ?271次閱讀
    2026<b class='flag-5'>視覺</b>檢測產(chǎn)業(yè)<b class='flag-5'>深度</b>調(diào)研及未來趨勢分析

    RTK-SCAM-60 雙目立體視覺相機(jī)|精準(zhǔn)深度感知 全場景智能視覺

    RTK-SCAM-60雙目相機(jī)是一款專為三維空間感知與距離測量打造的高精度雙目立體視覺相機(jī),整機(jī)采用5V低壓供電模式,無需外接獨(dú)立電源,真正實(shí)現(xiàn)即插即用,全方位簡化部署與使用流程。設(shè)備
    的頭像 發(fā)表于 03-27 14:28 ?191次閱讀
    RTK-SCAM-60 <b class='flag-5'>雙目</b>立體<b class='flag-5'>視覺</b>相機(jī)|精準(zhǔn)<b class='flag-5'>深度</b>感知 全場景智能<b class='flag-5'>視覺</b>

    雙目立體視覺相機(jī)產(chǎn)品介紹

    本產(chǎn)品是一款主打高精度感知、采用5V穩(wěn)定供電的雙目立體視覺相機(jī),核心由兩個(gè)經(jīng)過精密同步調(diào)試與專業(yè)校準(zhǔn)的獨(dú)立相機(jī)模塊組成,固定基線嚴(yán)格設(shè)定為60mm,專為各類場景下的三維空間感知與精準(zhǔn)距離測量需求量
    的頭像 發(fā)表于 02-28 15:08 ?284次閱讀
    <b class='flag-5'>雙目</b>立體<b class='flag-5'>視覺</b>相機(jī)產(chǎn)品介紹

    基于SD3589高精度雙目立體視覺相機(jī):助力三維感知與智能化應(yīng)用

    的單獨(dú)相機(jī)模塊組成,固定基線60mm,內(nèi)置高性能雙目光學(xué)采集卡與立體匹配算法,實(shí)現(xiàn)毫秒級(jí)數(shù)據(jù)同步采集,可直接輸出高精度深度圖、點(diǎn)云數(shù)據(jù)及校正后RGB圖像,為自動(dòng)化產(chǎn)
    的頭像 發(fā)表于 01-05 15:29 ?553次閱讀
    基于SD3589高精度<b class='flag-5'>雙目</b>立體<b class='flag-5'>視覺</b>相機(jī):助力三維感知與智能化應(yīng)用

    自動(dòng)駕駛既然有雙目攝像頭了,為什么還要三目攝像頭?

    視覺系統(tǒng)中。 但在實(shí)地落地時(shí),有些廠商并未止步于雙目,而是選擇了三目攝像頭的方案。為什么有了雙目,還要選擇三目攝像頭? 雙目攝像頭怎么“看出”深度
    的頭像 發(fā)表于 12-09 08:59 ?1297次閱讀
    自動(dòng)駕駛既然有<b class='flag-5'>雙目</b>攝像頭了,為什么還要三目攝像頭?

    車載雙目攝像頭如何“看見”世界?

    源自:網(wǎng)絡(luò) 車載雙目攝像頭(也稱立體視覺攝像頭,Stereo Camera)模仿人眼的視覺機(jī)制,通過兩個(gè)略有間距的攝像頭同時(shí)拍攝同一場景,比較兩幅圖像之間的差異,從而計(jì)算出深度信息。
    的頭像 發(fā)表于 11-13 09:17 ?1701次閱讀
    車載<b class='flag-5'>雙目</b>攝像頭如何“看見”世界?

    歐菲光與廣和通聯(lián)合首發(fā)ToF+雙目感知定位模塊

    11月,歐菲光與廣和通共研共創(chuàng),首發(fā)ToF+雙目感知定位模塊,即將批量交付,將機(jī)器視覺感知與端側(cè)AI模型進(jìn)行融合,實(shí)現(xiàn)新一代智能割草機(jī)在深度估算與定位感知性能的全面躍升,為其智能化升級(jí)
    的頭像 發(fā)表于 11-07 15:43 ?611次閱讀

    奧比中光發(fā)布最新一代3D激光雷達(dá)及雙目深度相機(jī)

    近日,世界機(jī)器人大會(huì)現(xiàn)場,奧比中光發(fā)布最新一代3D激光雷達(dá)及雙目深度相機(jī),以“場景拓展”與“極限感知”為核心優(yōu)勢,進(jìn)階全領(lǐng)域能力矩陣,刷新機(jī)器人性能上限,為各類機(jī)器人帶來更靈活可靠的視覺解決方案。
    的頭像 發(fā)表于 08-15 15:05 ?1642次閱讀

    基于凌智視覺識(shí)別模塊的基于單目視覺的目標(biāo)物測量裝置

    1.視覺測量整體方案本視覺測量系統(tǒng)采用單目視覺技術(shù)實(shí)現(xiàn)目標(biāo)物距離
    的頭像 發(fā)表于 07-31 15:35 ?1133次閱讀
    基于凌智<b class='flag-5'>視覺</b>識(shí)別模塊的基于單<b class='flag-5'>目視覺</b>的目標(biāo)物測量裝置

    光子精密雙目3D線激光輪廓測量儀,擺脫視覺盲區(qū),1臺(tái)更比2臺(tái)強(qiáng)!

    光子精密雙目3D線激光輪廓測量儀(GL-8160D),在GL-8000系列的基礎(chǔ)上創(chuàng)新升級(jí)。GL-8160D采用全新雙目單線設(shè)計(jì),突破傳統(tǒng)3D視覺檢測限制,而且不受外部拼接標(biāo)定誤差影響,有效消除單目盲區(qū),抗光干擾能力更強(qiáng),可
    的頭像 發(fā)表于 07-16 17:21 ?1569次閱讀
    光子精密<b class='flag-5'>雙目</b>3D線激光輪廓測量儀,擺脫<b class='flag-5'>視覺</b>盲區(qū),1臺(tái)更比2臺(tái)強(qiáng)!

    雙目視覺在智能駕駛領(lǐng)域的應(yīng)用

    圍繞“雙目智駕應(yīng)用”,我們將推出系列文章深入解析雙目視覺如何跨越技術(shù)鴻溝,在中國智駕的沃土上生根發(fā)芽,探索其賦能未來出行的無限可能。
    的頭像 發(fā)表于 07-09 16:21 ?1496次閱讀

    打破室外全域工作“盲區(qū)”!廣和通雙目視覺算法將成就云深處科技機(jī)器狗“慧眼”

    雙目視覺模塊RV-BOT為云深處科技四足機(jī)器人打通室外工作鏈路。通過深度融合廣和通自主研發(fā)的雙目視覺算法,RV-BOT將顯著提升了室外場景中的定位精度,為國產(chǎn)足式機(jī)器人的自主導(dǎo)航與智能化應(yīng)用開辟了新路徑。 ? ? 四足機(jī)器人在偵
    發(fā)表于 05-15 14:26 ?1705次閱讀
    打破室外全域工作“盲區(qū)”!廣和通<b class='flag-5'>雙目視覺</b>算法將成就云深處科技機(jī)器狗“慧眼”

    奧比中光發(fā)布新一代雙目3D相機(jī)Gemini 435Le

    近日,奧比中光在美國底特律舉辦的Automate 2025展會(huì)上發(fā)布Gemini 435Le,獲得眾多機(jī)器人專業(yè)人士的關(guān)注。作為最新一代工業(yè)級(jí)雙目視覺解決方案,Gemini 435Le雙目3D相機(jī)在前作基礎(chǔ)上針對智能機(jī)器人的工業(yè)自動(dòng)化應(yīng)用場景進(jìn)行了大幅提升,目前具備業(yè)界領(lǐng)
    的頭像 發(fā)表于 05-14 17:15 ?1294次閱讀
    紫金县| 诸暨市| 玉门市| 大新县| 尼玛县| 泰兴市| 昆山市| 芮城县| 堆龙德庆县| 中西区| 渝中区| 台前县| 左贡县| 利辛县| 绥宁县| 晋宁县| 芜湖市| 嘉禾县| 涟源市| 鹤山市| 新宁县| 玉山县| 固始县| 虹口区| 鹿邑县| 巢湖市| 兴和县| 黔南| 本溪| 雷山县| 光泽县| 德惠市| 桐梓县| 卢湾区| 蒙自县| 赤峰市| 济源市| 紫金县| 石柱| 绩溪县| 井冈山市|