日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自動(dòng)駕駛的新技術(shù):根據(jù)視頻生成深度圖

ml8z_IV_Technol ? 來(lái)源:ZF ? 2019-04-29 15:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

目前自動(dòng)駕駛的核心技術(shù)是LiDAR(激光雷達(dá)),一種運(yùn)用雷達(dá)原理,采用光和激光作為主要傳感器的汽車視覺(jué)系統(tǒng)。LiDAR傳感器賦予了自動(dòng)駕駛汽車能夠看到周邊環(huán)境的“雙眼”,激光雷達(dá)技術(shù)越先進(jìn),視覺(jué)感知的精準(zhǔn)程度越高,這是自動(dòng)駕駛得以實(shí)現(xiàn)的底層技術(shù)基礎(chǔ)。但是最近幾年,放在攝像頭上的深度學(xué)習(xí)研究,發(fā)展很蓬勃。相比之下, 雖然激光雷達(dá) (LiDAR)的數(shù)據(jù)有諸多優(yōu)點(diǎn),但相關(guān)學(xué)術(shù)進(jìn)展并不太多。相機(jī)+數(shù)據(jù)+神經(jīng)網(wǎng)絡(luò)的組合,正在迅速縮小與LiDAR的能力差距。

本文來(lái)源圖靈TOPIA 作者:Ariel Gordon等 編譯:劉靜

無(wú)需相機(jī)參數(shù)、單目、以無(wú)監(jiān)督學(xué)習(xí)的方式從未標(biāo)記場(chǎng)景視頻中搞定深度圖!

這是谷歌AI機(jī)器人實(shí)驗(yàn)室聯(lián)合發(fā)布的最新研究結(jié)果,效果可媲美LiDAR。

什么是深度圖?

深度圖像(depth image)也被稱為距離影像(range image),由相機(jī)拍攝,是指將從圖像采集器到場(chǎng)景中各點(diǎn)的距離(深度)作為像素值的圖像,它直接反映了景物可見(jiàn)表面的幾何形狀。單位為mm,效果參考下圖:

在場(chǎng)景視頻景深學(xué)習(xí)領(lǐng)域,谷歌AI和機(jī)器人實(shí)驗(yàn)室聯(lián)合公布了三項(xiàng)最新研究突破:

第一,證明了可以以一種無(wú)監(jiān)督的方式訓(xùn)練深度網(wǎng)絡(luò),這個(gè)深度網(wǎng)絡(luò)可以從視頻本身預(yù)測(cè)相機(jī)的內(nèi)在參數(shù),包括鏡頭失真(見(jiàn)圖1)。

第二,在這種情況下,他們是第一個(gè)以幾何方式從預(yù)測(cè)深度直接解決遮擋的問(wèn)題。

第三,大大減少了處理場(chǎng)景中移動(dòng)元素所需的語(yǔ)義理解量:只需要一個(gè)覆蓋可能屬于移動(dòng)對(duì)象的像素的單個(gè)掩碼,而不是分割移動(dòng)對(duì)象的每個(gè)實(shí)例并跨幀跟蹤它。

圖1:從未知來(lái)源的視頻中學(xué)習(xí)深度的方法的定性結(jié)果,通過(guò)同時(shí)學(xué)習(xí)相機(jī)的外在和內(nèi)在參數(shù)來(lái)實(shí)現(xiàn)。 由于該方法不需要知道相機(jī)參數(shù),因此它可以應(yīng)用于任何視頻集。 所有深度圖(在右側(cè)可視化,作為差異)都是從原始視頻中學(xué)習(xí)而不使用任何相機(jī)內(nèi)在函數(shù)。 從上到下:來(lái)自YouTube8M的幀,來(lái)自EuRoC MAV數(shù)據(jù)集,來(lái)自Cityscapes和來(lái)自KITTI的幀。

推特網(wǎng)友對(duì)此不吝贊美:“這是我見(jiàn)過(guò)的最令人印象深刻的無(wú)監(jiān)督結(jié)果之一。來(lái)自未標(biāo)記視頻的深度圖對(duì)于自動(dòng)駕駛非常有用:)“

以下是論文具體內(nèi)容:

從視頻中估計(jì)3D結(jié)構(gòu)和相機(jī)運(yùn)動(dòng)是計(jì)算機(jī)視覺(jué)中的一個(gè)關(guān)鍵問(wèn)題,這個(gè)技術(shù)在自動(dòng)駕駛領(lǐng)域有著廣闊的工業(yè)應(yīng)用前景。

解決該問(wèn)題的傳統(tǒng)方法依賴于在多個(gè)連續(xù)幀中識(shí)別場(chǎng)景中的相同點(diǎn),并求解在這些幀上最大程度一致的3D結(jié)構(gòu)和相機(jī)運(yùn)動(dòng)。

但是,幀之間的這種對(duì)應(yīng)關(guān)系只能針對(duì)所有像素的子集建立,這導(dǎo)致了深度估計(jì)不確定的問(wèn)題。與通常處理逆問(wèn)題一樣,這些缺口是由連續(xù)性和平面性等假設(shè)填充的。

深度學(xué)習(xí)能夠從數(shù)據(jù)中獲得這些假設(shè),而不是手工指定這些假設(shè)。在信息不足以解決模糊性的地方,深度網(wǎng)絡(luò)可以通過(guò)對(duì)先前示例進(jìn)行歸納,以生成深度圖和流場(chǎng)。

無(wú)監(jiān)督方法允許單獨(dú)從原始視頻中學(xué)習(xí),使用與傳統(tǒng)方法類似的一致性損失,但在訓(xùn)練期間對(duì)其進(jìn)行優(yōu)化。在推論中,經(jīng)過(guò)訓(xùn)練的網(wǎng)絡(luò)能夠預(yù)測(cè)來(lái)自單個(gè)圖像的深度以及來(lái)自成對(duì)或更長(zhǎng)圖像序列的運(yùn)動(dòng)。

隨著對(duì)這個(gè)方向的研究越來(lái)越有吸引力,很明顯,物體運(yùn)動(dòng)是一個(gè)主要障礙,因?yàn)樗`反了場(chǎng)景是靜態(tài)的假設(shè)。已經(jīng)提出了幾個(gè)方向來(lái)解決該問(wèn)題,包括通過(guò)實(shí)例分割利用對(duì)場(chǎng)景的語(yǔ)義理解。

遮擋是另一個(gè)限制因素,最后,在此方向的所有先前工作中,必須給出相機(jī)的內(nèi)在參數(shù)。這項(xiàng)工作解決了這些問(wèn)題,因此減少了監(jiān)督,提高了未標(biāo)記視頻的深度和運(yùn)動(dòng)預(yù)測(cè)質(zhì)量。

首先,我們證明了可以以一種無(wú)監(jiān)督的方式訓(xùn)練深度網(wǎng)絡(luò),這個(gè)深度網(wǎng)絡(luò)從視頻本身預(yù)測(cè)相機(jī)的內(nèi)在參數(shù),包括鏡頭失真(見(jiàn)圖1)。

其次,在這種情況下,我們是第一個(gè)以幾何方式從預(yù)測(cè)深度直接解決遮擋的問(wèn)題。

最后,我們大大減少了處理場(chǎng)景中移動(dòng)元素所需的語(yǔ)義理解量:我們需要一個(gè)覆蓋可能屬于移動(dòng)對(duì)象的像素的單個(gè)掩碼,而不是分割移動(dòng)對(duì)象的每個(gè)實(shí)例并跨幀跟蹤它。

這個(gè)掩??赡芊浅4植?,實(shí)際上可以是矩形邊界框的組合。獲得這樣的粗糙掩模是一個(gè)簡(jiǎn)單得多的問(wèn)題,而且與實(shí)例分割相比,使用現(xiàn)有的模型可以更可靠地解決這個(gè)問(wèn)題。

除了這些定性進(jìn)展之外,我們還對(duì)我們的方法進(jìn)行了廣泛的定量評(píng)估,并發(fā)現(xiàn)它在多個(gè)廣泛使用的基準(zhǔn)數(shù)據(jù)集上建立了新的技術(shù)水平。將數(shù)據(jù)集匯集在一起,這種能力通過(guò)我們的方法得到了極大的提升,證明可以提高質(zhì)量。

自動(dòng)駕駛的新技術(shù):根據(jù)視頻生成深度圖

表1:總結(jié)了在KITTI上訓(xùn)練的模型和評(píng)估結(jié)果,使用給定相機(jī)內(nèi)建和學(xué)習(xí)相機(jī)內(nèi)建兩種方式來(lái)評(píng)估我們方法的深度估計(jì),結(jié)果顯而易見(jiàn),我們獲得了當(dāng)前最佳SOTA。

自動(dòng)駕駛的新技術(shù):根據(jù)視頻生成深度圖

表2:總結(jié)了在Cityscapes上訓(xùn)練和測(cè)試的模型的評(píng)估結(jié)果,我們的方法優(yōu)于以前的方法,并從學(xué)習(xí)的內(nèi)建中獲益。

自動(dòng)駕駛的新技術(shù):根據(jù)視頻生成深度圖

表3:深度估計(jì)的消融實(shí)驗(yàn)。 在所有實(shí)驗(yàn)中,訓(xùn)練集是Cityscapes(CS)和KITTI組合,我們分別在Cityscapes(CS)和KITTI(Eigen partition)上測(cè)試模型。 每行代表一個(gè)實(shí)驗(yàn),其中與主方法相比進(jìn)行了一次更改,如“實(shí)驗(yàn)”行中所述。 數(shù)字越小越好。

除了這些定性的進(jìn)步,我們對(duì)我們的方法進(jìn)行了廣泛的定量評(píng)估,發(fā)現(xiàn)它在多個(gè)廣泛使用的基準(zhǔn)數(shù)據(jù)集上建立了一個(gè)新的技術(shù)狀態(tài)。將數(shù)據(jù)集集中在一起,這種方法大大提高了數(shù)據(jù)集的質(zhì)量。

最后,我們首次演示了可以在YouTube視頻上學(xué)習(xí)深度和相機(jī)內(nèi)在預(yù)測(cè),這些視頻是使用多個(gè)不同的相機(jī)拍攝的,每個(gè)相機(jī)的內(nèi)建都是未知的,而且通常是不同的。

來(lái)自YouTube8M收集的圖像和學(xué)習(xí)的視差圖。

論文摘要

《場(chǎng)景視頻景深學(xué)習(xí)——非特定相機(jī)單眼圖片景深無(wú)監(jiān)督學(xué)習(xí)》

我們提出了一種新穎的方法,僅使用相鄰視頻幀的一致性作為監(jiān)督信號(hào),用于同時(shí)學(xué)習(xí)單眼視頻的深度,運(yùn)動(dòng),物體運(yùn)動(dòng)和相機(jī)內(nèi)建。與先前的工作類似,我們的方法通過(guò)將可微變形應(yīng)用于幀,并將結(jié)果與相鄰結(jié)果進(jìn)行比較來(lái)學(xué)習(xí),但它提供了若干改進(jìn):我們直接使用在訓(xùn)練期間預(yù)測(cè)的深度圖,以幾何和可微的方式處理遮擋。我們介紹了隨機(jī)層標(biāo)準(zhǔn)化,一種新穎的強(qiáng)大正則化器,并考慮了目標(biāo)相對(duì)于場(chǎng)景的運(yùn)動(dòng)。據(jù)我們所知,我們的工作是第一個(gè)以無(wú)監(jiān)督的方式從視頻中學(xué)習(xí)相機(jī)固有參數(shù)(包括鏡頭失真)的工作,從而使我們能夠從規(guī)模未知原點(diǎn)的任意視頻中提取準(zhǔn)確的深度圖和運(yùn)動(dòng)信息。

我們?cè)贑ityscapes,KITTI和EuRoC數(shù)據(jù)集上評(píng)估我們的結(jié)果,建立深度預(yù)測(cè)和測(cè)距的新技術(shù)水平,并定性地證明,深度預(yù)測(cè)可以從YouTube上的一系列視頻中學(xué)到。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    795

    文章

    15046

    瀏覽量

    181932
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    自動(dòng)駕駛汽車如何探測(cè)路面的積水深度?

    自動(dòng)駕駛系統(tǒng)不僅需要發(fā)現(xiàn)前方有水,更需要判斷這灘水到底有多深,是以較低的速度駛過(guò),還是應(yīng)該立刻停下并繞行。這種對(duì)積水深度的探測(cè),目前在技術(shù)層面依然屬于一個(gè)正在不斷探索的課題。 傳感器眼中的積水長(zhǎng)什么樣? 目前
    的頭像 發(fā)表于 04-07 08:51 ?368次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>汽車如何探測(cè)路面的積水<b class='flag-5'>深度</b>?

    NVIDIA和ComfyUI攜手簡(jiǎn)化本地AI視頻生成工作流

    借助 ComfyUI 的應(yīng)用視圖、NVIDIA RTX Video 超分辨率和全新的 NVFP4 模型,AI 驅(qū)動(dòng)的視頻生成更加易用。
    的頭像 發(fā)表于 03-14 16:37 ?2596次閱讀
    NVIDIA和ComfyUI攜手簡(jiǎn)化本地AI<b class='flag-5'>視頻生成</b>工作流

    如何構(gòu)建適合自動(dòng)駕駛的世界模型?

    [首發(fā)于智駕最前沿微信公眾號(hào)]世界模型經(jīng)歷了系統(tǒng)動(dòng)力學(xué)階段(1960年~2000年)、認(rèn)知科學(xué)階段(2001年~2017年)、深度學(xué)習(xí)階段(2018年至今),但將其應(yīng)用到自動(dòng)駕駛汽車上,還是近幾年才
    的頭像 發(fā)表于 02-18 08:14 ?1.1w次閱讀
    如何構(gòu)建適合<b class='flag-5'>自動(dòng)駕駛</b>的世界模型?

    自動(dòng)駕駛場(chǎng)景生成方法及優(yōu)選方案:康謀aiSim 3DGS方案重塑行業(yè)標(biāo)準(zhǔn)

    自動(dòng)駕駛技術(shù)飛速發(fā)展的當(dāng)下,仿真測(cè)試的重要性愈發(fā)凸顯,而 自動(dòng)駕駛場(chǎng)景生成 作為仿真測(cè)試的核心環(huán)節(jié),其技術(shù)水平直接決定了測(cè)試的效率與可靠性
    的頭像 發(fā)表于 02-02 17:39 ?548次閱讀

    如何設(shè)計(jì)好自動(dòng)駕駛ODD?

    為確定自動(dòng)駕駛的可使用范圍,會(huì)給自動(dòng)駕駛設(shè)置一個(gè)運(yùn)行設(shè)計(jì)域(Operational Design Domain,ODD)。ODD的作用就是用來(lái)明確自動(dòng)駕駛在什么情況下能工作,在什么情況下不能工作,給車設(shè)定“工作范圍”。
    的頭像 發(fā)表于 01-24 09:27 ?1885次閱讀

    自動(dòng)駕駛中提到的“深度相機(jī)”是個(gè)啥?

    自動(dòng)駕駛的實(shí)現(xiàn)離不開(kāi)各類傳感器的支持,其中純視覺(jué)方案成為很多技術(shù)方案的選擇,但由于攝像頭無(wú)法感知到環(huán)境深度信息,因此有部分技術(shù)方案提到了“深度
    的頭像 發(fā)表于 12-13 13:35 ?2744次閱讀

    不同等級(jí)的自動(dòng)駕駛技術(shù)要求上有何不同?

    談到自動(dòng)駕駛,不可避免地會(huì)涉及到自動(dòng)駕駛分級(jí),美國(guó)汽車工程師學(xué)會(huì)(SAE)根據(jù)自動(dòng)駕駛系統(tǒng)與人類駕駛員參與
    的頭像 發(fā)表于 10-18 10:17 ?2928次閱讀

    自動(dòng)駕駛中Transformer大模型會(huì)取代深度學(xué)習(xí)嗎?

    持續(xù)討論。特別是在自動(dòng)駕駛領(lǐng)域,部分廠商開(kāi)始嘗試將多模態(tài)大模型(MLLM)引入到感知、規(guī)劃與決策系統(tǒng),引發(fā)了“傳統(tǒng)深度學(xué)習(xí)是否已過(guò)時(shí)”的激烈爭(zhēng)論。然而,從技術(shù)原理、算力成本、安全需求與實(shí)際落地路徑等維度來(lái)看,Transforme
    的頭像 發(fā)表于 08-13 09:15 ?4433次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>中Transformer大模型會(huì)取代<b class='flag-5'>深度</b>學(xué)習(xí)嗎?

    生成式 AI 重塑自動(dòng)駕駛仿真:4D 場(chǎng)景生成技術(shù)的突破與實(shí)踐

    生成式AI驅(qū)動(dòng)的4D場(chǎng)景技術(shù)正解決傳統(tǒng)方法效率低、覆蓋不足等痛點(diǎn),如何通過(guò)NeRF、3D高斯?jié)姙R等技術(shù)實(shí)現(xiàn)高保真動(dòng)態(tài)建模?高效生成極端天氣等長(zhǎng)尾場(chǎng)景?本文為您系統(tǒng)梳理AI驅(qū)動(dòng)的4D場(chǎng)景
    的頭像 發(fā)表于 08-06 11:20 ?5466次閱讀
    <b class='flag-5'>生成</b>式 AI 重塑<b class='flag-5'>自動(dòng)駕駛</b>仿真:4D 場(chǎng)景<b class='flag-5'>生成</b><b class='flag-5'>技術(shù)</b>的突破與實(shí)踐

    低速自動(dòng)駕駛與乘用車自動(dòng)駕駛技術(shù)要求上有何不同?

    [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛技術(shù)的發(fā)展正朝著多元化方向邁進(jìn),其中低速自動(dòng)駕駛小車(以下簡(jiǎn)稱“低速小車”)因其在物流配送、園區(qū)運(yùn)維、社區(qū)服務(wù)等場(chǎng)景中的獨(dú)特價(jià)值而受到廣泛關(guān)注,且現(xiàn)階段已經(jīng)深入
    的頭像 發(fā)表于 07-14 09:10 ?1337次閱讀
    低速<b class='flag-5'>自動(dòng)駕駛</b>與乘用車<b class='flag-5'>自動(dòng)駕駛</b>在<b class='flag-5'>技術(shù)</b>要求上有何不同?

    卡車、礦車的自動(dòng)駕駛和乘用車的自動(dòng)駕駛技術(shù)要求上有何不同?

    [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛技術(shù)的發(fā)展,讓組合輔助駕駛得到大量應(yīng)用,但現(xiàn)在對(duì)于自動(dòng)駕駛技術(shù)的宣傳,普遍是在乘用車領(lǐng)域,而對(duì)于卡車、
    的頭像 發(fā)表于 06-28 11:38 ?1907次閱讀
    卡車、礦車的<b class='flag-5'>自動(dòng)駕駛</b>和乘用車的<b class='flag-5'>自動(dòng)駕駛</b>在<b class='flag-5'>技術(shù)</b>要求上有何不同?

    光庭信息自動(dòng)駕駛試驗(yàn)車赴日

    今年以來(lái),中國(guó)自動(dòng)駕駛企業(yè)正借助創(chuàng)新技術(shù)和產(chǎn)品加速出海,競(jìng)逐全球市場(chǎng)新格局。近日,一輛自動(dòng)駕駛試驗(yàn)車從武漢陽(yáng)邏港啟程前往日本,正式開(kāi)啟光庭信息出海新征程。
    的頭像 發(fā)表于 06-18 16:33 ?1242次閱讀

    4K、多模態(tài)、長(zhǎng)視頻:AI視頻生成的下一個(gè)戰(zhàn)場(chǎng),誰(shuí)在領(lǐng)跑?

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎) 6月11日,豆包App上線視頻生成模型豆包Seedance 1.0 pro。這是字節(jié)跳動(dòng)最新視頻模型,支持文字與圖片輸入,可生成多鏡頭無(wú)縫切換的1080P高品質(zhì)
    的頭像 發(fā)表于 06-16 00:13 ?7623次閱讀

    自動(dòng)駕駛技術(shù)測(cè)試有哪些?

    [首發(fā)于智駕最前沿微信公眾號(hào)]之前和大家從安全性、可靠性、用戶體驗(yàn)以及商業(yè)利益保護(hù)等多個(gè)角度聊了為什么自動(dòng)駕駛技術(shù)在落地前一定要進(jìn)行測(cè)試,今天智駕最前沿就繼續(xù)帶大家聊一聊自動(dòng)駕駛測(cè)試到底有哪些方法
    的頭像 發(fā)表于 06-10 09:00 ?1226次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>技術(shù)</b>測(cè)試有哪些?

    自動(dòng)駕駛技術(shù)落地前為什么要先測(cè)試?

    [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛技術(shù)之所以被大家關(guān)注,不僅在于它看似能夠徹底改變?nèi)藗兊某鲂蟹绞?,更在于其背后所承載的“智能”與“安全”理念。與人類駕駛員開(kāi)車相比,自動(dòng)駕駛系統(tǒng)需要
    的頭像 發(fā)表于 06-09 09:42 ?924次閱讀
    铅山县| 孙吴县| 晋江市| 张家界市| 夏邑县| 陇西县| 成都市| 固安县| 九江市| 桦川县| 连江县| 确山县| 比如县| 十堰市| 韶关市| 平度市| 观塘区| 泾川县| 双峰县| 江西省| 河曲县| 焉耆| 石棉县| 岗巴县| 东乌珠穆沁旗| 昌江| 新蔡县| 施秉县| 永济市| 巴青县| 福贡县| 石城县| 奉新县| 桑植县| 平安县| 乐昌市| 长春市| 盐山县| 海阳市| 腾冲县| 临湘市|