日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么無圖智駕不使用SLAM建立局部語義地圖?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2026-04-29 08:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]智駕無圖的概念已經(jīng)在自動駕駛領(lǐng)域流傳頗深,過去幾年,自動駕駛高度依賴高精地圖,但現(xiàn)在更追求像人一樣開車,也就是在不依賴預(yù)設(shè)地圖的情況下,實時感知并理解周圍環(huán)境。

在這個過程中,BEV、Occupancy(占用網(wǎng)絡(luò))和Transformer的組合成了主流,而曾經(jīng)在機器人領(lǐng)域立下汗馬功勞的SLAM方案,卻沒有在智駕領(lǐng)域大放異彩。為什么無圖智駕不使用SLAM建立局部語義地圖?

wKgZPGnxVwyAGRj0AAAQo00DEvw150.jpg

為什么傳統(tǒng)的幾何建圖跟不上變化?

傳統(tǒng)的SLAM方案(即即時定位與地圖構(gòu)建)核心邏輯是基于幾何約束的。它依賴于如系統(tǒng)提取出路邊建筑的邊緣、交通標(biāo)志的轉(zhuǎn)角等特征點的匹配,然后通過復(fù)雜的數(shù)學(xué)公式計算這些點在三維空間中的坐標(biāo)。這種方案在處理靜態(tài)、剛性的環(huán)境時會非常精確,但在城市交通這種動態(tài)、非剛性的環(huán)境下,幾何邏輯就會遭遇嚴(yán)重的挑戰(zhàn)。

wKgZO2nxVwyAJKMcAACoEZjPA2A912.jpg

圖片源自:網(wǎng)絡(luò)

因為SLAM方案在構(gòu)建局部語義地圖時,本質(zhì)上是在做一種拼圖工作。它需要先識別出圖像里的車、人、路緣石,然后嘗試把這些帶語義標(biāo)簽的物體投影到地圖坐標(biāo)系里。一旦圖像中出現(xiàn)了遮擋,或者是車輛在顛簸中導(dǎo)致相機角度發(fā)生了微小的偏移,幾何投影就會產(chǎn)生錯位,導(dǎo)致地圖里的物體出現(xiàn)重影或位置漂移。更關(guān)鍵的是,這種方案對算力的消耗分布不均,隨著環(huán)境復(fù)雜度的提升,維護(hù)一個精細(xì)的局部特征地圖會占用大量的內(nèi)存和處理時間。

在此基礎(chǔ)上,語義斷層也是一個無法回避的問題。傳統(tǒng)的語義地圖方案要求系統(tǒng)必須先看懂物體,才能將其畫進(jìn)地圖。但在實際駕駛中,我們會遇到各種無法被歸類的東西,比如路邊垂下的樹枝、灑在地上的建筑垃圾,或者是形狀怪異的特種車輛。SLAM方案如果無法給這些物體貼上準(zhǔn)確的標(biāo)簽,它們在局部地圖里可能就是缺失的,這對自動駕駛的高安全要求來說是一個巨大的隱患。

wKgZPGnxVw2ADxukAAAR42n7O-I935.jpg

Transformer是如何重塑空間感的?

BEV方案之所以在自動駕駛領(lǐng)域崛起,核心在于它引入了Transformer這種能夠處理全局關(guān)聯(lián)的架構(gòu),其徹底改變了空間特征的轉(zhuǎn)化方式。在傳統(tǒng)的方案中,我們要把2D圖像轉(zhuǎn)為3D空間,需要依賴深度估計,也就是先猜每一個像素點離我有多遠(yuǎn),再把它投射出去。但猜深度本身就是一個極不穩(wěn)定的過程,容易受到光影、雨霧的干擾。

wKgZO2nxVw2AW6F0AABU8dkL-a4183.jpg

圖片源自:網(wǎng)絡(luò)

Transformer引入了主動詢問的機制。在BEV空間里,算法會先預(yù)設(shè)好一張空的鳥瞰圖畫布,畫布上的每一個位置(我們稱之為Query,即查詢量)都會主動去向所有的攝像頭畫面打聽,在你們的視野里,有沒有哪個像素的信息是屬于我這個地理位置的?這種機制不再強求系統(tǒng)去精準(zhǔn)計算深度,而是通過大規(guī)模數(shù)據(jù)的學(xué)習(xí),讓系統(tǒng)建立起一種類似于人類的空間感。它知道當(dāng)左側(cè)相機出現(xiàn)一個車頭,后側(cè)相機出現(xiàn)一個車尾時,它們在BEV畫布上應(yīng)該匯聚成同一個物理實體的特征。

這種方式的最大優(yōu)勢在于它能夠?qū)崿F(xiàn)特征級的融合,而不是結(jié)果級的拼接。過去我們是把每個相機算出的結(jié)果強行湊在一起,現(xiàn)在我們是在最底層的特征階段就把360度的信息融為一體。由于Transformer具有全局注意力機制,它甚至可以利用道路的整體輪廓來推斷被遮擋區(qū)域的情況。如當(dāng)一輛貨車擋住了側(cè)方視角時,系統(tǒng)可以結(jié)合前后的車道線走向,在BEV空間里腦補出貨車后方的道路結(jié)構(gòu),這種邏輯的連貫性是傳統(tǒng)SLAM方案難以企及的。

wKgZPGnxVw2AdZG9AAASG3BOmsQ448.jpg

占用網(wǎng)絡(luò)如何解決感知死角?

如果說BEV和Transformer聯(lián)手解決了視野重構(gòu)與空間還原的問題,讓車輛看清了世界長什么樣以及空間怎么分布,那么占用網(wǎng)絡(luò)存在的意義,就是通過判定空間是否被占據(jù),繞過了傳統(tǒng)識別方案中必須先給物體分類的要求,解決了因為系統(tǒng)叫不出物體名字而造成的感知漏洞。

在SLAM語義地圖里,如果系統(tǒng)識別不出一個物體是什么,它可能就會忽略這個物體的物理存在。而占用網(wǎng)絡(luò)將空間細(xì)分為一個個微小的體素塊,它的任務(wù)極其純粹,即判斷每一個小方塊是被占據(jù)了,還是空的。

wKgZO2nxVw6AV3lcAAE4H9lCoLQ599.jpg

圖片源自:網(wǎng)絡(luò)

這種基于幾何占用而非語義識別的邏輯,為智駕系統(tǒng)提供了一層物理保底。它把世界看作是一個充滿障礙物的物理空間,而不是一張貼滿標(biāo)簽的分類表。當(dāng)車輛行駛在路上,無論前方是一個倒下的路標(biāo)、一堆灑落的紙箱,還是一輛橫著的事故車,占用網(wǎng)絡(luò)都能實時反饋出那片空間是不可逾越的。它不需要知道那個東西叫什么,只需要知道那里的物理空間被占據(jù)了,從而引導(dǎo)車輛進(jìn)行避讓。

同時,這種方案還帶來了極高的時空連續(xù)性。通過將Transformer處理后的特征注入到占用網(wǎng)絡(luò)中,系統(tǒng)可以存儲過去幾個幀的信息,形成帶記憶的4D空間感知。即使某個障礙物在某一瞬間被其他車輛遮擋了,系統(tǒng)依然記得在那個體素塊里曾經(jīng)檢測到了物體,并能根據(jù)物體的運動趨勢預(yù)測它現(xiàn)在的位置。這種對物理世界的連續(xù)理解能力,讓無圖智駕方案在處理復(fù)雜路口和突發(fā)狀況時,表現(xiàn)得遠(yuǎn)比依賴靜態(tài)語義地圖的方案要從容和安全。

wKgZPGnxVw6AQuQsAAASAJELks8660.jpg

為什么這種組合成為了必然選擇?

BEV、Transformer和Occupancy的結(jié)合,實際上是將原本支離破碎的感知環(huán)節(jié)統(tǒng)一到了同一個坐標(biāo)系和同一種數(shù)學(xué)語言下。SLAM方案之所以沒有在智駕領(lǐng)域得到應(yīng)用,本質(zhì)上是因為它試圖在一個不斷變動的世界里建立一套永恒不變的坐標(biāo),這在復(fù)雜的城市環(huán)境中成本太高、容錯率太低。

wKgZO2nxVw-Afx3jAAadZZ1MXyI864.jpg

圖片源自:網(wǎng)絡(luò)

自動駕駛需要擁抱不確定性,通過利用Transformer的強大擬合能力去處理相機間的視差和遮擋,利用BEV視角提供統(tǒng)一的決策基礎(chǔ),再利用占用網(wǎng)絡(luò)補齊對未知物體的識別短板,可以讓自動駕駛實現(xiàn)老司機的駕駛能力。這種架構(gòu)不僅對傳感器的安裝位置、型號具有更強的兼容性,更重要的是,它極大簡化了感知與下游規(guī)控環(huán)節(jié)的對接流程。

當(dāng)規(guī)控系統(tǒng)拿到的不再是幾個飄忽不定的語義標(biāo)簽和一堆散亂的點云,而是一張高清、實時、且包含了物理占用信息的3D鳥瞰圖時,路徑規(guī)劃就會變得像玩賽車游戲一樣直觀。這種從底層邏輯上的簡化與重構(gòu),正是無圖智駕能夠快速落地、并表現(xiàn)出超越人類司機反應(yīng)潛力的根本原因,也是眾多車企敢于選擇無圖的原因。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SLAM
    +關(guān)注

    關(guān)注

    24

    文章

    460

    瀏覽量

    33426
  • 自動駕駛
    +關(guān)注

    關(guān)注

    795

    文章

    15011

    瀏覽量

    181691
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    為什么自動駕駛方案不再強調(diào)地圖了?

    [首發(fā)于智最前沿微信公眾號]不知道大家是否發(fā)現(xiàn),現(xiàn)在很多車企在宣傳自動駕駛方案時,很少會再強調(diào)或提及高精度地圖,甚至很少會再提地圖相關(guān)的內(nèi)容,為啥曾經(jīng)被自動駕駛行業(yè)高度依賴的技術(shù),現(xiàn)在卻越來越
    的頭像 發(fā)表于 03-31 08:57 ?379次閱讀
    為什么自動駕駛方案不再強調(diào)<b class='flag-5'>地圖</b>了?

    ROS2 SLAM與導(dǎo)航實戰(zhàn)--基于米爾RK3576開發(fā)板

    SLAM Toolbox的自主機器人系統(tǒng)構(gòu)建過程。 7.2 下一步研究方向 多機器人SLAM地圖合并 語義導(dǎo)航(目標(biāo)檢測+導(dǎo)航) 強化學(xué)習(xí)局部
    發(fā)表于 03-12 17:55

    面向視覺語言導(dǎo)航的任務(wù)驅(qū)動式地圖學(xué)習(xí)框架MapDream介紹

    在視覺語言導(dǎo)航(VLN)中,地圖長期作為獨立模塊構(gòu)建,并通過固定接口交由導(dǎo)航策略使用。無論是BEV網(wǎng)格、拓?fù)?b class='flag-5'>圖還是語義記憶模塊,這些表示大多脫離策略學(xué)習(xí)而設(shè)計。結(jié)果是,機器人即使掌握場景的信息,也仍可能繞行甚至偏離目標(biāo),因為
    的頭像 發(fā)表于 03-02 10:40 ?630次閱讀
    面向視覺語言導(dǎo)航的任務(wù)驅(qū)動式<b class='flag-5'>地圖</b>學(xué)習(xí)框架MapDream介紹

    SLAM如何為自動駕駛提供空間感知能力?

    ,并精準(zhǔn)地判斷自己與障礙物的距離。這種看似本能的空間感知能力,在工程學(xué)領(lǐng)域被具象化為同步定位與地圖構(gòu)建技術(shù),即我們常說的SLAM。在自動駕駛的發(fā)展進(jìn)程中,SLAM不僅是車輛在未知環(huán)境中“生存”的技能,更是其實現(xiàn)厘米級高
    的頭像 發(fā)表于 02-09 09:12 ?576次閱讀
    <b class='flag-5'>SLAM</b>如何為自動駕駛提供空間感知能力?

    自動駕駛中的“”真的不需要地圖嗎?

    [首發(fā)于智最前沿微信公眾號]在智能駕駛領(lǐng)域,最近一兩年討論熱度比較高的一個話題莫過于“去高精地圖”。曾幾何時,高精度地圖被視為自動駕駛的“拐杖”,仿佛沒有了那份精確到厘米級的靜態(tài)數(shù)據(jù)包,車輛就成了
    的頭像 發(fā)表于 01-16 09:01 ?1906次閱讀
    自動駕駛中的“<b class='flag-5'>無</b><b class='flag-5'>圖</b>”真的不需要<b class='flag-5'>地圖</b>嗎?

    什么是激光雷達(dá) 3D SLAM技術(shù)?

    (SimultaneousLocalizationandMapping)即時定位與建,通俗來講,就是讓智能設(shè)備在未知環(huán)境中同步完成自身位置測算與周邊環(huán)境地圖構(gòu)建。這兩個過程互為支撐,既是機器人自主
    的頭像 發(fā)表于 12-02 19:23 ?809次閱讀
    什么是激光雷達(dá) 3D <b class='flag-5'>SLAM</b>技術(shù)?

    從高精地圖到輕地圖,再到“”,誰才是真需求?

    [首發(fā)于智最前沿微信公眾號]如果將自動駕駛發(fā)展以時間軸拉開,地圖的應(yīng)用可以分為高精地圖、輕地圖,以及所謂的“
    的頭像 發(fā)表于 11-10 09:50 ?1076次閱讀
    從高精<b class='flag-5'>地圖</b>到輕<b class='flag-5'>地圖</b>,再到“<b class='flag-5'>無</b><b class='flag-5'>圖</b>”,誰才是真需求?

    自動駕駛中如何將稀疏地圖與視覺SLAM相結(jié)合?

    [首發(fā)于智最前沿微信公眾號]在自動駕駛場景中,稀疏地圖通常是由一系列關(guān)鍵幀和若干三維稀疏特征點構(gòu)成的地圖,每個特征點包含三維坐標(biāo)和描述外觀的描述子;而視覺SLAM是運行在車輛上的實時
    的頭像 發(fā)表于 10-28 09:07 ?822次閱讀
    自動駕駛中如何將稀疏<b class='flag-5'>地圖</b>與視覺<b class='flag-5'>SLAM</b>相結(jié)合?

    什么樣的地圖在自動駕駛中才能稱為“輕”?

    [首發(fā)于智最前沿微信公眾號]自動駕駛發(fā)展至今,“輕”的概念被越來越多技術(shù)方案所選擇。所謂“輕”,本質(zhì)上是把傳統(tǒng)高精地圖里那些對自動駕駛功能不是絕對必要的細(xì)節(jié)去掉,保留對車輛決策和
    的頭像 發(fā)表于 10-20 09:31 ?576次閱讀
    什么樣的<b class='flag-5'>地圖</b>在自動駕駛中才能稱為“輕<b class='flag-5'>圖</b>”?

    全新輕量級ViSTA-SLAM系統(tǒng)介紹

    無需相機內(nèi)參、極致輕量的前端(前端模型大小僅為同類35%),實時單目視覺SLAM,ViSTA-SLAM。與現(xiàn)有方法相比,ViSTA-SLAM不僅更輕、更快,在相機跟蹤和密集3D重建質(zhì)量方面也均表現(xiàn)出色。
    的頭像 發(fā)表于 09-22 15:53 ?1225次閱讀
    全新輕量級ViSTA-<b class='flag-5'>SLAM</b>系統(tǒng)介紹

    從“有”到“”再到“輕”,自動駕駛地圖選擇為何這么折騰?

    [首發(fā)于智最前沿微信公眾號]在手機導(dǎo)航還未出現(xiàn)的年代,很多人出行主要依靠紙質(zhì)地圖,有人希望地圖可以描述得很詳細(xì),這樣可以獲得更多的交通信息;而有人覺得靠眼睛看路牌,再問問路人會更加方便;還有一些人
    的頭像 發(fā)表于 09-11 10:05 ?747次閱讀
    從“有<b class='flag-5'>圖</b>”到“<b class='flag-5'>無</b><b class='flag-5'>圖</b>”再到“輕<b class='flag-5'>圖</b>”,自動駕駛<b class='flag-5'>地圖</b>選擇為何這么折騰?

    又一智供應(yīng)商要被收購?

    電子發(fā)燒友網(wǎng)綜合報道,近日有消息稱,四維新擬收購智公司鑒智機器人,目前交易進(jìn)度已經(jīng)進(jìn)入最后階段。四維新對此回應(yīng)表示請以官方信息為準(zhǔn), 鑒智機器人 則未對此作出回應(yīng)。 四維新 是
    發(fā)表于 08-26 07:30 ?5095次閱讀

    基于深度學(xué)習(xí)的增強版ORB-SLAM3詳解

    ORB-SLAM3雖是當(dāng)前最先進(jìn)的SLAM之一,但由于使用傳統(tǒng)的ORB(定向FAST和旋轉(zhuǎn)BRIEF)特征,在尺度、旋轉(zhuǎn)和光照發(fā)生顯著變化時可能會表現(xiàn)出局限性。
    的頭像 發(fā)表于 07-14 17:21 ?2038次閱讀
    基于深度學(xué)習(xí)的增強版ORB-<b class='flag-5'>SLAM</b>3詳解

    一種適用于動態(tài)環(huán)境的實時RGB-D SLAM系統(tǒng)

    了UP-SLAM,這是一種適用于動態(tài)環(huán)境的實時RGB-D SLAM系統(tǒng)。實驗結(jié)果表明,UP-SLAM在定位精度方面(高出59.8%)和渲染質(zhì)量方面(峰值信噪比高出4.57分貝)均優(yōu)于最先進(jìn)的方法,同時保持實時性能,并在動態(tài)環(huán)境中
    的頭像 發(fā)表于 07-04 15:14 ?1478次閱讀
    一種適用于動態(tài)環(huán)境的實時RGB-D <b class='flag-5'>SLAM</b>系統(tǒng)

    谷歌地圖GPS定位

    谷歌地圖GPS定位:精準(zhǔn)導(dǎo)航背后的技術(shù)解析 谷歌地圖作為全球最受歡迎的地圖服務(wù)之一,其精準(zhǔn)的GPS定位功能為用戶提供了極大便利。本文將深入探討谷歌地圖如何利用GPS技術(shù),實現(xiàn)高精度定位
    的頭像 發(fā)表于 05-29 16:54 ?1715次閱讀
    时尚| 静乐县| 巴东县| 吴川市| 浑源县| 军事| 个旧市| 罗田县| 班戈县| 资溪县| 望江县| 吉安市| 张家川| 广德县| 巴彦县| 卢龙县| 海原县| 怀安县| 靖宇县| 襄樊市| 麻阳| 中西区| 昌乐县| 莫力| 滦平县| 灵丘县| 克什克腾旗| 临漳县| 介休市| 彩票| 喀什市| 建平县| 香港| 堆龙德庆县| 五华县| 呼伦贝尔市| 庆城县| 宁都县| 宿州市| 堆龙德庆县| 宁津县|