日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

面向智能移動(dòng)平臺(tái)的語(yǔ)義定位與建圖

3D視覺工坊 ? 來(lái)源:深藍(lán)AI ? 2023-01-08 09:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、背景

1、智能移動(dòng)平臺(tái)的定義平臺(tái)包含兩大特征,第一個(gè)是能夠自主地對(duì)它周圍的環(huán)境進(jìn)行感知,基于感知信息自主運(yùn)行,實(shí)現(xiàn)特定的任務(wù),常見的移動(dòng)平臺(tái)是移動(dòng)機(jī)器人和無(wú)人車。 為了實(shí)現(xiàn)或構(gòu)建機(jī)器人或無(wú)人車,通常在算法方面有四大技術(shù)難點(diǎn),即感知、狀態(tài)估計(jì)、預(yù)測(cè)和執(zhí)行控制。我的博士論文關(guān)注前面兩點(diǎn):感知和狀態(tài)估計(jì),總結(jié)為讓無(wú)人車或機(jī)器人看見這個(gè)世界。

2、如何使用激光雷達(dá)傳感器對(duì)周圍環(huán)境感知通常來(lái)說(shuō)基于機(jī)載或車載的傳感器,圖 1 是實(shí)驗(yàn)室自己的感知采集平臺(tái),平臺(tái)上搭載了不同傳感器,包括激光雷達(dá)、相機(jī)和 GPS。對(duì)于成熟的產(chǎn)品,需要融合各種傳感器的不同模態(tài)信息,最后構(gòu)建一個(gè)非常魯棒和安全的感知系統(tǒng)。

74e23866-8ea5-11ed-bfe3-dac502259ad0.png

圖 1 感知采集平臺(tái) 我的博士課題僅僅使用激光雷達(dá)傳感器的數(shù)據(jù)作為算法輸入,動(dòng)機(jī)是測(cè)試使用單一傳感器的感知性能。如果把所有的基于單一傳感器的感知算法優(yōu)化到最好,結(jié)合在一起就可以得到更加魯棒、更加安全的感知系統(tǒng)。 64線激光雷達(dá)的數(shù)據(jù)如圖 2 所示,旋轉(zhuǎn)式的激光雷達(dá)實(shí)際是對(duì)環(huán)境進(jìn)行深度掃描。在數(shù)據(jù)中,每一行實(shí)際是每一束激光旋轉(zhuǎn) 360 度過(guò)程中采集的環(huán)境深度信息,每一列實(shí)際就是多線激光雷達(dá)在某一時(shí)刻采集的深度信息。

74ef5866-8ea5-11ed-bfe3-dac502259ad0.png

圖 2 64 線激光雷達(dá)數(shù)據(jù) 在給定激光雷達(dá)激光束的標(biāo)定參數(shù)以后,比如它的發(fā)射角和分辨率,也可以對(duì)每個(gè)距離采集信息的 3D 坐標(biāo)進(jìn)行解算,最后得到一個(gè) 3D 點(diǎn)云。我的博士論文就是使用這樣的傳感器的數(shù)據(jù)作為所有算法的輸入。

3、為什么語(yǔ)義信息于激光雷達(dá)感知非常重要語(yǔ)義信息實(shí)際上是人類對(duì)環(huán)境的更高級(jí)別的理解。圖 3 是原始點(diǎn)云信息和帶有語(yǔ)義的點(diǎn)云信息對(duì)比,人類可以對(duì)環(huán)境有所理解,經(jīng)過(guò)長(zhǎng)時(shí)間的學(xué)習(xí)訓(xùn)練,對(duì)于機(jī)器人來(lái)說(shuō)就是 3D 坐標(biāo),對(duì)于幾何信息很難對(duì)周圍環(huán)境進(jìn)行理解,語(yǔ)義信息標(biāo)注以后,無(wú)人車和機(jī)器人就能夠更好的對(duì)環(huán)境進(jìn)行理解,識(shí)別可通行區(qū)域的道路。我的博士論文就是想要利用語(yǔ)義信息使機(jī)器人的感知性能提升,實(shí)現(xiàn)機(jī)器人的感知。

74f8f498-8ea5-11ed-bfe3-dac502259ad0.png

圖 3 原始點(diǎn)云和語(yǔ)義信息點(diǎn)云對(duì)比

4、論文簡(jiǎn)介為了實(shí)現(xiàn)語(yǔ)義感知性能,論文主要是從三個(gè)方面進(jìn)行: (1)如何利用現(xiàn)有的多類別的語(yǔ)義分割結(jié)果去提升機(jī)器人的感知和狀態(tài)估計(jì)的性能,比如說(shuō)提升定位和建圖的性能; (2)對(duì)于不同的任務(wù),不同的語(yǔ)義類別實(shí)際上是有不同的影響。針對(duì)不同的任務(wù),可以提出更加刻意的語(yǔ)義信息來(lái)進(jìn)一步提高算法的性能; (3)對(duì)語(yǔ)義信息進(jìn)行簡(jiǎn)化后提出自動(dòng)生成的語(yǔ)義算法,減輕對(duì)于人工標(biāo)注的依賴。

二、使用多類別語(yǔ)義信息提高定位和建圖性能基于語(yǔ)義信息的同時(shí)定位和建圖(SLAM),SLAM 對(duì)于機(jī)器人自主導(dǎo)航非常重要,主要實(shí)現(xiàn)的是機(jī)器人在自主運(yùn)行中,對(duì)環(huán)境地圖進(jìn)行構(gòu)建,然后同時(shí)在所構(gòu)建的地圖環(huán)境中找到機(jī)器人當(dāng)前位置。這是所有上游任務(wù)或下游任務(wù)的基礎(chǔ),要實(shí)現(xiàn)導(dǎo)航和規(guī)劃,首先要知道環(huán)境長(zhǎng)什么樣子,知道當(dāng)前環(huán)境中的位置,才能夠?qū)崿F(xiàn)下游任務(wù),所以 SLAM 是機(jī)器人導(dǎo)航的基礎(chǔ)。在第一個(gè)例子里面,想要在 SLAM 的過(guò)程中加入這樣的多類別的語(yǔ)義信息,從而對(duì) SLAM 的精度進(jìn)行一個(gè)提升,如圖 4 所示。

7501dcca-8ea5-11ed-bfe3-dac502259ad0.png

圖 4 SLAM 過(guò)程增加多類別語(yǔ)義信息

1、為什么需要語(yǔ)義信息提升 SLAM 精度?當(dāng)前的車輛的無(wú)人車行駛環(huán)境,在一個(gè)非常擁堵的高速路入口,圖 5 左邊展示的是傳統(tǒng)的基于幾何信息的 SLAM 結(jié)果,紅色車輛代表的是位姿估計(jì)的真值,藍(lán)色車輛代表傳統(tǒng)的基于幾何信息 SLAM 的估計(jì)出來(lái)的位姿值。可以看到在這樣的一個(gè)具有挑戰(zhàn)的場(chǎng)景中,傳統(tǒng)的基于幾何信息的 SLAM 沒有辦法很好的對(duì)當(dāng)前車輛的位姿進(jìn)行估計(jì)的,甚至給出了一個(gè)完全相反的運(yùn)動(dòng)方向,這樣的算法在真實(shí)產(chǎn)品應(yīng)用中會(huì)帶來(lái)非常大的一個(gè)麻煩。

750d02d0-8ea5-11ed-bfe3-dac502259ad0.png

圖 5 基于幾何信息的 SLAM 但當(dāng)擁有語(yǔ)義信息后,提出了語(yǔ)義 SLAM,如圖 6 所示。可以更好的對(duì)車輛的位姿進(jìn)行估計(jì),最后可以看到估計(jì)出來(lái)的位姿的值和真值非常接近,同時(shí)也可以對(duì)環(huán)境的語(yǔ)義信息進(jìn)行描述。

7514603e-8ea5-11ed-bfe3-dac502259ad0.png

圖 6 語(yǔ)義 SLAM 結(jié)果

2、具體如何實(shí)現(xiàn)語(yǔ)義 SLAM 的呢?圖7是語(yǔ)義 SLAM 的實(shí)現(xiàn)框圖,總共包含五個(gè)部分,在第一個(gè)部分展示的是 Raw Scan 算法,僅僅使用激光雷達(dá)點(diǎn)云作為輸入,然后在第二個(gè)部分使用現(xiàn)有的語(yǔ)義分割結(jié)果,輸出是每一個(gè)點(diǎn)對(duì)應(yīng)的語(yǔ)義標(biāo)簽,這里采用的是提出的 RangeNet++方法,然后在第三個(gè)部分把語(yǔ)義信息和激光雷達(dá)的幾何信息結(jié)合作為定位建圖的輸入,在建圖部分使用動(dòng)態(tài)物體去除算法,圖 8 的左圖展示不做任何處理時(shí)把語(yǔ)義觀測(cè)疊加,可以看到由于當(dāng)前場(chǎng)景中有動(dòng)態(tài)的物體,會(huì)造成鬼影污染,污染會(huì)使地圖沒辦法用于下一步的定位和導(dǎo)航,提出的算法就是把當(dāng)?shù)挠^測(cè)和歷史累積的語(yǔ)義地圖進(jìn)行語(yǔ)義標(biāo)簽一致性的檢測(cè),如果當(dāng)前觀測(cè)里面的語(yǔ)義標(biāo)簽和地圖中的語(yǔ)義標(biāo)簽不一樣時(shí),就把這樣的語(yǔ)義標(biāo)簽當(dāng)做運(yùn)動(dòng)的物體,對(duì)它進(jìn)行去除,最后可以看到使用去除算法可以得到一個(gè)非常干凈的語(yǔ)義地圖。

75390416-8ea5-11ed-bfe3-dac502259ad0.png

圖 7 語(yǔ)義 SLAM 實(shí)現(xiàn)框圖

75413c1c-8ea5-11ed-bfe3-dac502259ad0.png

圖 8 語(yǔ)義動(dòng)態(tài)去除 基于語(yǔ)義地圖,進(jìn)一步提出了基于語(yǔ)義信息的位姿估計(jì)算法,叫做 Semantic ICP。ICP 就是把當(dāng)前觀測(cè)和語(yǔ)義地圖對(duì)齊,從而估計(jì)當(dāng)前車輛或傳感器的位姿,實(shí)現(xiàn)了累積定位。如圖 9 所示,可以看到當(dāng)前觀測(cè)里面有動(dòng)態(tài)物體,中間這幅圖展示的是清理之后的語(yǔ)義地圖,第三幅圖展示的是在位姿估計(jì)過(guò)程中的每一個(gè)匹配,當(dāng)前觀測(cè)和地圖的匹配之前的權(quán)值,顏色越深代表權(quán)值越低,可以清楚看到動(dòng)態(tài)物體的權(quán)值,降低了它的權(quán)值,通過(guò)操作可以降低動(dòng)態(tài)物體在位姿估計(jì)過(guò)程中對(duì)位姿估計(jì)帶來(lái)的負(fù)面結(jié)果,從而提升位姿估計(jì)精度。

754a05c2-8ea5-11ed-bfe3-dac502259ad0.png

圖 9 語(yǔ)義 ICP 圖 10 展示的是算法在線運(yùn)行的結(jié)果,可以看到語(yǔ)義 SLAM 可以實(shí)時(shí)的對(duì)環(huán)境的云地圖進(jìn)行構(gòu)建,同時(shí)也可以準(zhǔn)確的估計(jì)自身車的位姿,對(duì)動(dòng)態(tài)物體進(jìn)行去除,然后保留靜態(tài)的語(yǔ)義地圖。

754ff216-8ea5-11ed-bfe3-dac502259ad0.png

圖 10 算法在線運(yùn)行的結(jié)果 圖 11 是第一個(gè)示例,在第一個(gè)示例中利用多類別的語(yǔ)義信息對(duì) SLAM 的定位和建圖性能提升。SLAM 實(shí)質(zhì)上包含三個(gè)部分,定位、建圖和閉環(huán)檢測(cè),閉環(huán)檢測(cè)主要是機(jī)器人回到之前已經(jīng)歷過(guò)地方的時(shí)候,能不能判斷出這個(gè)地方是已經(jīng)歷過(guò)的,如果能判斷的話,可以加入閉環(huán)約束,通過(guò)約束消除長(zhǎng)期運(yùn)行的累積誤差,從而構(gòu)建出全局一致的地圖和更加精確的位姿估計(jì),所以閉環(huán)對(duì)于 SLAM 是非常重要的。傳統(tǒng)的基于幾何信息的閉環(huán)檢測(cè)算法在一些挑戰(zhàn)環(huán)境中無(wú)法正常工作,比如,當(dāng)一個(gè)車從反方向開回到之前經(jīng)歷過(guò)的十字路口時(shí),由于視角變換太大,所以無(wú)法識(shí)別十字路口是之前經(jīng)歷過(guò)的。

7559ed34-8ea5-11ed-bfe3-dac502259ad0.png

圖 11 第一個(gè)示例 針對(duì)這個(gè)問(wèn)題,在第二個(gè)示例中提出了利用深度學(xué)習(xí)和語(yǔ)義信息幫助機(jī)器人 SLAM 更好的找到閉環(huán),提高全局地圖構(gòu)建精度和位姿估計(jì)的精度。 第二個(gè)例子的算法流程圖如圖 12 所示,左邊所展示的就是算法把兩幀激光雷達(dá)當(dāng)做輸入,然后除了使用激光雷達(dá)傳統(tǒng)的幾何信息,比如深度、法向量信息以外,也使用了語(yǔ)義信息,通過(guò)語(yǔ)義信息對(duì)地圖點(diǎn)的描述性更強(qiáng),所以可以更好找到閉環(huán)。右邊是算法網(wǎng)絡(luò)的流程圖,是比較經(jīng)典的編碼器和解碼器結(jié)構(gòu),首先編碼器對(duì)兩幀激光雷達(dá)進(jìn)行提取,生成一個(gè)比較的特征,在第一個(gè)解碼器中對(duì)兩個(gè)激光雷達(dá)的加速度進(jìn)行估計(jì),可以更好的判斷當(dāng)前的觀測(cè)是不是已經(jīng)經(jīng)歷過(guò)的地方,如果已經(jīng)找到了一個(gè)閉環(huán),當(dāng)車輛從反方向駛?cè)霑r(shí),當(dāng)偏航角過(guò)大的時(shí)候,還是無(wú)法很好地閉環(huán),所以針對(duì)這個(gè)任務(wù)設(shè)計(jì)了一個(gè)偏航角估計(jì)的解碼器,解碼器可以估計(jì)出兩個(gè)激光雷達(dá)的相對(duì)偏航角,在找到閉環(huán)之后用偏航角估計(jì)可以更好的初始化位姿估計(jì),從而更好的實(shí)現(xiàn)閉環(huán)。

7563fe96-8ea5-11ed-bfe3-dac502259ad0.png

圖 12 第二個(gè)例子的算法流程圖 圖 13 展示的是算法在線運(yùn)行的結(jié)果,可以看到在經(jīng)過(guò)長(zhǎng)時(shí)間的運(yùn)行之后,右邊展示的是位姿估計(jì)的累積誤差,顏色越紅代表誤差越大。紅色點(diǎn)表示算法找到的閉環(huán),在閉環(huán)后可以對(duì)累積誤差進(jìn)行消除。當(dāng)機(jī)器人反方向駛?cè)氲臅r(shí)候,也能夠找到閉環(huán)。

7588e652-8ea5-11ed-bfe3-dac502259ad0.png

圖 13 算法在線運(yùn)行結(jié)果 圖 14 展示的是在加入的閉環(huán)檢測(cè)算法和沒有加入閉環(huán)檢測(cè)算法的定位和建圖精度的比較,可以看到方法 SLAM 可以得到一個(gè)更加精確的定位和建圖結(jié)果,相對(duì)于沒有使用閉環(huán)檢測(cè)的算法。

7591139a-8ea5-11ed-bfe3-dac502259ad0.png

圖 14 加入閉環(huán)檢測(cè)和沒有加入閉環(huán)檢測(cè)算法 SLAM 對(duì)比 小結(jié):第一部分實(shí)際上回答了要如何使用現(xiàn)有的語(yǔ)義信息多類別的從語(yǔ)義分割網(wǎng)絡(luò)里得到的點(diǎn)云信息來(lái)對(duì)感知任務(wù)進(jìn)行系統(tǒng)的提升,在第一個(gè)部分中以 SLAM 的閉環(huán)做了一個(gè)示例,在論文中也嘗試了對(duì)全局定位算法進(jìn)行深度學(xué)習(xí)的嘗試,但是由于時(shí)間關(guān)系,在我的答辯過(guò)程中,每部分只提供了一個(gè)或兩個(gè)示例。 在第一個(gè)問(wèn)題中主要回答的是利用語(yǔ)義信息提高感知性能,在進(jìn)行這個(gè)研究的過(guò)程中實(shí)際上也發(fā)現(xiàn)了對(duì)于定位和建圖而言,更加在意的是當(dāng)前的環(huán)境中這些物體是運(yùn)動(dòng)還是靜止的,所以實(shí)質(zhì)上對(duì)于特定的感知任務(wù),每一個(gè)類別或者不同的語(yǔ)義信息帶來(lái)的影響是不一樣的。那么在第二個(gè)部分里面,就想要回答對(duì)于特定的感知任務(wù)是不是能夠提出更加特意的語(yǔ)義信息從而進(jìn)一步提高感知任務(wù)的精度。

三、對(duì)于特定的感知任務(wù),提出更加特意的語(yǔ)義信息從而進(jìn)一步提高感知任務(wù)的精度同樣的以激光雷達(dá) SLAM 為基礎(chǔ),提出了動(dòng)態(tài)物體分割的算法,如圖 15 所示。和現(xiàn)有的語(yǔ)義分割不一樣的是,在動(dòng)態(tài)物體分割中不是要區(qū)分一個(gè)物體的具體類別,而是要區(qū)分是運(yùn)動(dòng)物體還是靜態(tài)物體,為了實(shí)現(xiàn)動(dòng)態(tài)物體分割,提出了一個(gè)新的基于深度學(xué)習(xí)的利用序列信息的算法。

75962f38-8ea5-11ed-bfe3-dac502259ad0.png

圖 15 基于深度學(xué)習(xí)方法的序列雷達(dá)數(shù)據(jù) 動(dòng)態(tài)物體分割的流程圖如圖 16 所示,可以看到使用的這個(gè)網(wǎng)絡(luò)結(jié)構(gòu)也是傳統(tǒng)的編碼器解碼器結(jié)構(gòu)。和傳統(tǒng)的語(yǔ)義分割不一樣的是,輸出不是多類別語(yǔ)義分割,而是更加特意的二值分割動(dòng)和不動(dòng)的結(jié)果。這樣的好處是把一個(gè)復(fù)雜的多類別的語(yǔ)義分割任務(wù)簡(jiǎn)化為二值的分類任務(wù),可以更容易的得到這樣一個(gè)結(jié)果,之后再對(duì)定位和建圖進(jìn)行提升。然后和多類別語(yǔ)義分割還有一個(gè)不同的就是,不使用單一的當(dāng)前觀測(cè)作為輸入,而使用一系列的連續(xù)時(shí)空的觀測(cè)作為網(wǎng)絡(luò)的輸入。為了更好的使用這樣的時(shí)空信息,提出了一個(gè)所謂的殘差圖像。接下來(lái)具體介紹怎么生成和使用殘差圖像的。

75b7e088-8ea5-11ed-bfe3-dac502259ad0.png

圖 16 動(dòng)態(tài)物體分割流程圖 如圖 17 所示,其中第一個(gè)圖展示的是當(dāng)前的觀測(cè),第二個(gè)圖展示的是當(dāng)前觀測(cè)中動(dòng)態(tài)物體的真值,下面的圖像都是提出的殘差圖像,j=1 代表利用過(guò)去的第一幀和當(dāng)前幀所比較得到的殘差圖像,以此類推。為了生成殘差圖像,首先把過(guò)去的觀測(cè)投影到當(dāng)前的坐標(biāo)系,對(duì)于每一個(gè)過(guò)去觀測(cè)中的點(diǎn) rij→0投影到當(dāng)前的坐標(biāo)系,和對(duì)應(yīng)的觀測(cè)進(jìn)行比較,從而生成殘差圖像。利用殘差圖像,這是一個(gè)非常直觀的使用已有的人類先驗(yàn)知識(shí)引導(dǎo)網(wǎng)絡(luò)如何識(shí)別動(dòng)態(tài)物體,可以清楚看到在哪個(gè)位置有動(dòng)態(tài)物體。利用這樣連續(xù)多幀的去檢測(cè)也是一個(gè)非常自然而言的想法,比如作為人類來(lái)說(shuō)看一張圖片沒有很好的判斷,如果看視頻的話能夠看到物體運(yùn)動(dòng)的性質(zhì)。將連續(xù)多幀的物體作為輸入可以更好的識(shí)別動(dòng)態(tài)物體。

75cb91c8-8ea5-11ed-bfe3-dac502259ad0.png

圖 17 殘差圖像 圖 18 展示的是算法在線運(yùn)行的結(jié)果,可以看到算法可以很好的對(duì)正在運(yùn)動(dòng)的車輛和行人進(jìn)行識(shí)別,也可以識(shí)別到靜態(tài)背景,可以在不同環(huán)境中使用。

75d423e2-8ea5-11ed-bfe3-dac502259ad0.png

圖 18 算法在線運(yùn)行的結(jié)果 接下來(lái)是更多的數(shù)值的一個(gè)比較,如表 1 所示。那么對(duì)三個(gè)不同算法的定位結(jié)果進(jìn)行對(duì)比,第一個(gè)只是用幾何信息,第二個(gè)使用多類別的語(yǔ)義信息來(lái)對(duì) SLAM 性能進(jìn)行增強(qiáng)的結(jié)果,第三個(gè)算法是使用剛才提出的動(dòng)態(tài)物體分割的結(jié)果。每個(gè)方法有兩個(gè)數(shù)字,前面是旋轉(zhuǎn)誤差,后面是平移誤差,可以看出更好的結(jié)果,比使用多類別語(yǔ)義信息更好的結(jié)果。

表 1 不同算法的定位結(jié)果對(duì)比

75ddf44e-8ea5-11ed-bfe3-dac502259ad0.png

圖 19 展示的是在使用動(dòng)態(tài)物體分割以后建圖的結(jié)果,上面是原始點(diǎn)云建圖結(jié)果,存在鬼影,下面是動(dòng)態(tài)物體分割后的更加干凈的環(huán)境地圖,可以更好的用于下游的任務(wù)。

75f74e26-8ea5-11ed-bfe3-dac502259ad0.png

圖 19 使用動(dòng)態(tài)物體分割后建圖的結(jié)果 小結(jié):對(duì)于特定的激光雷達(dá)的感知任務(wù),可以提出更加特意的語(yǔ)義信息。以 SLAM 為例,提出了動(dòng)態(tài)物體分割,通過(guò)這種方式,對(duì)需要的語(yǔ)義信息進(jìn)行簡(jiǎn)化,更加容易的得到語(yǔ)義信息,同時(shí)對(duì)相對(duì)應(yīng)的任務(wù)進(jìn)行性能提升。 簡(jiǎn)化語(yǔ)義信息后,非常大的好處就是可以找一些自動(dòng)生成語(yǔ)義信息的方法,減輕對(duì)于人類手工標(biāo)注的依賴。

四、特定語(yǔ)義任務(wù)自動(dòng)生成標(biāo)注自動(dòng)生成物體標(biāo)簽的算法,如圖 20 所示,拿一個(gè)序列的激光雷達(dá)點(diǎn)云作為算法輸入,首先使用傳統(tǒng)的方法進(jìn)行位姿估計(jì),通過(guò)一致性檢測(cè)對(duì)大概的動(dòng)態(tài)物體區(qū)域進(jìn)行標(biāo)注,然后對(duì)標(biāo)注的可能物體進(jìn)行實(shí)例的分割,最后對(duì)可能運(yùn)動(dòng)物體進(jìn)行跟蹤,生成動(dòng)靜的標(biāo)簽,根據(jù)速度或距離來(lái)確定標(biāo)簽。這里注意的是方法無(wú)法進(jìn)行在線測(cè)試,一步一步進(jìn)行,離線的生成標(biāo)簽好處在于中間幀不僅可以使用當(dāng)前和過(guò)去的信息,還可以使用未來(lái)的信息,使用時(shí)空信息對(duì)動(dòng)態(tài)物體進(jìn)行檢測(cè),生成標(biāo)簽,再對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,自動(dòng)訓(xùn)練得到網(wǎng)絡(luò),部署到在線任務(wù)中去。

760492b6-8ea5-11ed-bfe3-dac502259ad0.png

圖 20 自動(dòng)生成物體標(biāo)簽算法

761125ee-8ea5-11ed-bfe3-dac502259ad0.png

圖 21 自動(dòng)生成物體標(biāo)簽算法(續(xù)) 在不同的數(shù)據(jù)集上也可以進(jìn)行,如圖 22 所示,這是在美國(guó)和韓國(guó)采集的,算法都能夠達(dá)到很好的性能。

762de896-8ea5-11ed-bfe3-dac502259ad0.png

圖 22 數(shù)據(jù)集 表 2 展示的是算法使用自動(dòng)標(biāo)簽進(jìn)行訓(xùn)練和使用真值訓(xùn)練得到標(biāo)簽的結(jié)果,IOU 越大效果越好。

表 2 自動(dòng)標(biāo)簽和真值標(biāo)簽結(jié)果對(duì)比

7637c456-8ea5-11ed-bfe3-dac502259ad0.png

使用同樣的數(shù)據(jù)集,自動(dòng)生成標(biāo)簽當(dāng)然要比真實(shí)標(biāo)簽性能要差,但生成更多標(biāo)簽的時(shí)候能夠提升網(wǎng)絡(luò)的性能。 小結(jié):簡(jiǎn)化所需的語(yǔ)義信息后,可以提出自動(dòng)生成標(biāo)簽的方法去訓(xùn)練網(wǎng)絡(luò),減輕對(duì)人工標(biāo)注的網(wǎng)絡(luò),從而使深度學(xué)習(xí)方法可以泛化到不同環(huán)境中。

五、總結(jié)最后,對(duì)整個(gè)博士論文進(jìn)行一個(gè)總結(jié),它實(shí)際上就是回答了三方面的內(nèi)容,第一個(gè)方面就是如何使用現(xiàn)有的多類別語(yǔ)義信息提高激光雷達(dá)定位和建圖的精度,然后針對(duì)于特定的任務(wù),是不是可以提出更加特意的語(yǔ)義信息,從而對(duì)于語(yǔ)義信息進(jìn)行簡(jiǎn)化,因?yàn)樘匾饣院竽芴嵘阅埽谌齻€(gè)可以自動(dòng)生成標(biāo)簽降低對(duì)手工標(biāo)注的依賴。 博士期間的研究成果如圖 23 所示。

76543b36-8ea5-11ed-bfe3-dac502259ad0.png

圖 23 博士期間成果 代碼的公開如圖 24 所示。

765b054c-8ea5-11ed-bfe3-dac502259ad0.png

圖 24 代碼鏈接

問(wèn)題 QA:1.semantic ICP 是只區(qū)別了動(dòng)態(tài)物體還是靜態(tài)物體之后的 ICP 嗎? 除了動(dòng)態(tài)物體的權(quán)值有所降低以外,比如柵欄或其他地方的權(quán)值也有所調(diào)整,沒有特別針對(duì)靜態(tài)物體或動(dòng)態(tài)物體調(diào)整,不對(duì)動(dòng)靜進(jìn)行區(qū)分,只是單純的對(duì)每一個(gè)類別物體的語(yǔ)義一致性進(jìn)行檢測(cè)。 2.語(yǔ)義的視覺 SLAM 有哪些深挖的點(diǎn)?是否推薦多模態(tài)的語(yǔ)義 SLAM? 多模態(tài)當(dāng)然是未來(lái)發(fā)展的熱門方向,對(duì)于一個(gè)真正的產(chǎn)品落地肯定最后是多模態(tài)的結(jié)果,單一傳感器總有不適用的場(chǎng)景,對(duì)于視覺來(lái)說(shuō)黑夜和雨天影響很大,對(duì)于激光雷達(dá)來(lái)說(shuō)雨霧也有很大的影響,所以大家也會(huì)嘗試加入 IMU 和 GPS 以及毫米波雷達(dá)等等。對(duì)于視覺 SLAM 沒有做特別多的工作,現(xiàn)在的了解的話,和這里的語(yǔ)義不太一樣的定義。 3.激光語(yǔ)義 SLAM 和視覺語(yǔ)義 SLAM 的區(qū)別? 其實(shí)就是傳感器的區(qū)別,視覺 SLAM 的信息更加豐富一點(diǎn),因?yàn)橛型庥^的 RGB 信息,可以更好的實(shí)現(xiàn)語(yǔ)義分割,在室外的話,單目沒有深度信息,這是和激光雷達(dá)的區(qū)分。激光雷達(dá)沒有顏色信息,很難區(qū)分物體。視覺的視角更寬一點(diǎn)。 4.研究語(yǔ)義 SLAM 的過(guò)程中需要注意那些內(nèi)容? 按照思路順下來(lái),在答辯時(shí)能夠更加了解如何你是一步一步進(jìn)行研究的,大家可以參考順序。如何獲取更好的無(wú)監(jiān)督的語(yǔ)義信息是現(xiàn)在比較難的一個(gè)點(diǎn),還有一個(gè)是深度學(xué)習(xí)的瓶頸,它非常依賴于對(duì)語(yǔ)義信息的定義。得到的類別只是訓(xùn)練的類別,無(wú)法得到開放世界的類別。如何對(duì)不知道的類別進(jìn)行檢測(cè),這是一個(gè)非常的難點(diǎn)。 5.語(yǔ)義 SLAM 的工程化有什么建議? 在自動(dòng)駕駛公司用的比較多,和定義的語(yǔ)義不太一樣,在高精地圖中語(yǔ)義的信息使用非常重要。對(duì)于語(yǔ)義的定義是多種多樣的,在實(shí)際工程的應(yīng)用中,比如車道線的檢測(cè)已經(jīng)是非常好的了。工程化的難點(diǎn)是開放世界,對(duì)更多類別進(jìn)行識(shí)別,算例是難點(diǎn)。如何輕量化網(wǎng)絡(luò),還有就是泛化系統(tǒng)的問(wèn)題,都是城市場(chǎng)景的自動(dòng)駕駛,在沒有車道線的地方如何提取語(yǔ)義信息進(jìn)行自動(dòng)駕駛也是非常關(guān)注的。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2578

    文章

    55599

    瀏覽量

    794393
  • SLAM
    +關(guān)注

    關(guān)注

    24

    文章

    460

    瀏覽量

    33428
  • 激光雷達(dá)
    +關(guān)注

    關(guān)注

    982

    文章

    4562

    瀏覽量

    197224

原文標(biāo)題:面向智能移動(dòng)平臺(tái)的語(yǔ)義定位與建圖

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    為什么無(wú)智駕不使用SLAM建立局部語(yǔ)義地圖?

    個(gè)過(guò)程中,BEV、Occupancy(占用網(wǎng)絡(luò))和Transformer的組合成了主流,而曾經(jīng)在機(jī)器人領(lǐng)域立下汗馬功勞的SLAM方案,卻沒有在智駕領(lǐng)域大放異彩。為什么無(wú)智駕不使用SLAM建立局部語(yǔ)義地圖? ? 為什么傳統(tǒng)的幾何
    的頭像 發(fā)表于 04-29 08:55 ?277次閱讀
    為什么無(wú)<b class='flag-5'>圖</b>智駕不使用SLAM建立局部<b class='flag-5'>語(yǔ)義</b>地圖?

    UWB 定位原理與系統(tǒng)架構(gòu):基站 / 標(biāo)簽 / 平臺(tái)全解析

    在工業(yè)物聯(lián)網(wǎng)和智能制造領(lǐng)域,位置感知技術(shù)正成為繼數(shù)據(jù)采集、設(shè)備聯(lián)網(wǎng)之后的又一關(guān)鍵基礎(chǔ)設(shè)施。而在諸多無(wú)線定位技術(shù)中,UWB憑借其厘米級(jí)精度、強(qiáng)抗干擾能力和高可靠性,逐漸成為工業(yè)場(chǎng)景的首選方案。本文將從
    的頭像 發(fā)表于 04-27 17:21 ?461次閱讀

    2026年低代碼平臺(tái)市場(chǎng)綜合評(píng)測(cè):國(guó)內(nèi)10大低代碼平臺(tái)深度解析

    銀行核心系統(tǒng)、大型ERP等復(fù)雜項(xiàng)目。 專業(yè)場(chǎng)景:金融核心業(yè)務(wù)系統(tǒng)、政務(wù)一體化平臺(tái)、國(guó)企央企數(shù)字化轉(zhuǎn)型、信創(chuàng)工程落地。 3.泛微ebuilder(綜合評(píng)分:88.5) 核心定位:全站式智能化低代碼
    發(fā)表于 03-30 16:02

    Actian推出對(duì)話式分析解決方案,依托智能生成的語(yǔ)義基礎(chǔ),提供可信洞見

    HCLSoftware旗下的數(shù)據(jù)與人工智能部門Actian今日推出Actian AI Analyst(原名Wobby)。該對(duì)話式分析解決方案搭載Steward Agent,能夠智能生成并持續(xù)維護(hù)語(yǔ)義
    的頭像 發(fā)表于 03-14 11:38 ?795次閱讀

    ROS2 SLAM與導(dǎo)航實(shí)戰(zhàn)--基于米爾RK3576開發(fā)板

    ? 在ROS2生態(tài)中,SLAM(同時(shí)定位)與導(dǎo)航(Navigation)是機(jī)器人自主移動(dòng)的核心技術(shù)。SLAM Toolbox由Steve Macenski主導(dǎo)開發(fā),是基于成熟Ka
    發(fā)表于 03-12 17:55

    RK3576 + ROS2 SLAM與導(dǎo)航實(shí)戰(zhàn)

    前言文檔定位與目標(biāo)讀者本文檔面向具備一定ROS基礎(chǔ)、希望深入理解并在實(shí)際項(xiàng)目中部署ROS2Humble+SLAMToolbox+Nav2完整建與導(dǎo)航系統(tǒng)的機(jī)器人工程師。我們將從零開始,基于米爾
    的頭像 發(fā)表于 03-12 08:08 ?8980次閱讀
    RK3576 + ROS2 SLAM<b class='flag-5'>建</b><b class='flag-5'>圖</b>與導(dǎo)航實(shí)戰(zhàn)

    翱捷科技正式推出全新高性能4G八核智能SoC芯片平臺(tái)ASR8861

    在2026世界移動(dòng)通信大會(huì)(MWC Barcelona 2026)期間,翱捷科技正式推出全新高性能4G八核智能SoC芯片平臺(tái)ASR8861。該平臺(tái)以6nm制程、強(qiáng)勁八核CPU架構(gòu)以及2
    的頭像 發(fā)表于 03-03 17:39 ?1667次閱讀

    激光雷達(dá)助力泳池水下機(jī)器人+定位全覆蓋

    激光雷達(dá)助力泳池水下機(jī)器人+定位全覆蓋
    的頭像 發(fā)表于 02-25 14:24 ?373次閱讀
    激光雷達(dá)助力泳池水下機(jī)器人<b class='flag-5'>建</b><b class='flag-5'>圖</b>+<b class='flag-5'>定位</b>全覆蓋

    小藝開放平臺(tái)快速創(chuàng)建鴻蒙智能

    1.登錄小藝開放平臺(tái),進(jìn)入小藝智能平臺(tái)頁(yè)面,點(diǎn)擊立即體驗(yàn),進(jìn)入創(chuàng)建頁(yè)面。 2.點(diǎn)擊左上角【+創(chuàng)建智能體】按鈕,即可進(jìn)入智能體創(chuàng)建流程。 3
    發(fā)表于 01-19 11:00

    黑芝麻智能推出面向機(jī)器人產(chǎn)業(yè)的SesameX多維智能計(jì)算平臺(tái)

    11月20日,“多維進(jìn)化,智賦新生”2025年黑芝麻智能機(jī)器人平臺(tái)產(chǎn)品發(fā)布會(huì)在上海成功舉行,正式推出面向機(jī)器人產(chǎn)業(yè)的SesameX多維智能計(jì)算平臺(tái)
    的頭像 發(fā)表于 11-24 14:44 ?797次閱讀
    黑芝麻<b class='flag-5'>智能</b>推出<b class='flag-5'>面向</b>機(jī)器人產(chǎn)業(yè)的SesameX多維<b class='flag-5'>智能</b>計(jì)算<b class='flag-5'>平臺(tái)</b>

    華為發(fā)布面向移動(dòng)網(wǎng)絡(luò)的多智能體系統(tǒng)創(chuàng)新成果

    近日,華為無(wú)線MAE產(chǎn)品線總裁趙振龍?jiān)谥黝}發(fā)言《AgenticRAN,多智能體協(xié)同激發(fā)無(wú)線網(wǎng)絡(luò)數(shù)智化生產(chǎn)力》中正式向業(yè)界發(fā)布面向移動(dòng)網(wǎng)絡(luò)的多智能體系統(tǒng)(RAN Multi-Agent
    的頭像 發(fā)表于 10-09 16:44 ?2747次閱讀

    黑芝麻智能AI全棧機(jī)器人計(jì)算平臺(tái)榮膺國(guó)際大獎(jiǎng)

    黑芝麻智能AI全棧機(jī)器人計(jì)算平臺(tái)榮膺新加坡年度"GO! Technology Utilisation Winner",作為面向新一代機(jī)器人實(shí)時(shí)AI推理打造的全棧計(jì)算平臺(tái),該方案已成功部
    的頭像 發(fā)表于 08-07 17:35 ?2420次閱讀

    河南移動(dòng)攜手華為完成智能追焦單元部署

    近日,中國(guó)移動(dòng)河南公司(以下簡(jiǎn)稱“河南移動(dòng)”)通過(guò)智能優(yōu)化系統(tǒng)與智能硬件相結(jié)合,打造流量激發(fā)、智能運(yùn)維、質(zhì)差優(yōu)化等場(chǎng)景的移網(wǎng)體驗(yàn)示范區(qū),引領(lǐng)
    的頭像 發(fā)表于 06-23 16:43 ?1223次閱讀

    Arm 公司面向移動(dòng)端市場(chǎng)的 ?Arm Lumex? 深度解讀

    面向移動(dòng)端市場(chǎng)的 ? Arm Lumex ? 深度解讀 ? Arm Lumex ? 是 Arm 公司面向移動(dòng)設(shè)備市場(chǎng)推出的新一代計(jì)算平臺(tái),隸
    的頭像 發(fā)表于 05-29 09:54 ?4622次閱讀

    基于STM32 人群定位、調(diào)速智能風(fēng)扇設(shè)計(jì)(程序、設(shè)計(jì)報(bào)告、視頻演示)

    基于STM32 人群定位、調(diào)速智能風(fēng)扇設(shè)計(jì)(程序、設(shè)計(jì)報(bào)告、視頻演示),有需要的同學(xué)推薦下載!
    發(fā)表于 05-28 21:34
    陕西省| 泰州市| 台州市| 从江县| 改则县| 惠水县| 灵寿县| 平乐县| 海林市| 东丽区| 沙洋县| 察哈| 勃利县| 孝昌县| 平远县| 虹口区| 平原县| 新余市| 西乌珠穆沁旗| 淮安市| 无锡市| 屏东县| 甘德县| 黔江区| 将乐县| 凤山市| 英德市| 巴楚县| 洛阳市| 山丹县| 巨野县| 宜川县| 左权县| 会昌县| 昌邑市| 榆林市| 荣昌县| 罗甸县| 芜湖市| 板桥市| 临沂市|