日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

VLA是怎么讓自動(dòng)駕駛有駕駛邏輯的?

智駕最前沿 ? 來(lái)源:智駕最前沿 ? 2026-05-16 08:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號(hào)]目前的自動(dòng)駕駛技術(shù)正處于一個(gè)關(guān)鍵的十字路口,新技術(shù)層出不窮。雖然現(xiàn)有的視覺(jué)感知和規(guī)劃算法已經(jīng)能夠處理大部分常規(guī)路況,但在面對(duì)復(fù)雜的人類社交行為和從未見(jiàn)過(guò)的突發(fā)狀況時(shí),傳統(tǒng)系統(tǒng)依舊會(huì)表現(xiàn)得過(guò)于死板。為了解決這些難題,有技術(shù)方案嘗試將大語(yǔ)言模型的理解能力與自動(dòng)駕駛的控制邏輯結(jié)合起來(lái),這便誕生了VLA模型,即“視覺(jué)-語(yǔ)言-動(dòng)作”模型。

為什么自動(dòng)駕駛需要一顆懂語(yǔ)言的大腦?

在過(guò)去很長(zhǎng)一段時(shí)間里,自動(dòng)駕駛系統(tǒng)的邏輯更像是查字典。攝像頭和雷達(dá)捕捉到畫(huà)面,算法識(shí)別出障礙物,然后根據(jù)預(yù)設(shè)的代碼尋找對(duì)應(yīng)的操作。比如看到紅燈就停,看到前車減速就跟著減速。這種方式在規(guī)則明確的環(huán)境下表現(xiàn)優(yōu)異,可一旦進(jìn)入邊緣場(chǎng)景中,它就顯得捉襟見(jiàn)肘。當(dāng)路邊有個(gè)交警揮手讓繞行,或者遇到一輛逆行的自行車,傳統(tǒng)系統(tǒng)可能因?yàn)闆](méi)有匹配到完全一致的預(yù)設(shè)案例,而選擇原地停車甚至報(bào)錯(cuò)。

VLA模型的出現(xiàn)改變了這種單向的邏輯。它引入了語(yǔ)言作為思考的中介。這里的語(yǔ)言不僅僅是用來(lái)和乘客對(duì)話的,它更像是一種通用的邏輯框架。大語(yǔ)言模型在訓(xùn)練過(guò)程中吸收了整個(gè)人類文明積累的常識(shí)和推理能力,這使得它不僅能識(shí)別出交警,還能理解交警的手勢(shì)代表著一種指揮。這種對(duì)場(chǎng)景深度語(yǔ)義的理解,是單純的視覺(jué)算法很難具備的,它為自動(dòng)駕駛補(bǔ)齊了最重要的一塊短板,即對(duì)物理世界常識(shí)的掌握。

這種模型打破了感知與控制之間的壁壘。以往,車上的傳感器負(fù)責(zé)看,而駕駛算法負(fù)責(zé)開(kāi),兩者之間隔著復(fù)雜的參數(shù)轉(zhuǎn)換。但在VLA模型中,視覺(jué)信息被轉(zhuǎn)化成了一種模型能讀懂的特征向量,并與語(yǔ)言指令交織在一起。這意味著汽車在做出轉(zhuǎn)彎或剎車決定時(shí),不再僅是因?yàn)榭吹搅四承┫袼攸c(diǎn)的變化,而是因?yàn)樗斫饬水?dāng)前的交通邏輯。這種跨維度的融合,讓自動(dòng)駕駛系統(tǒng)從一個(gè)只會(huì)執(zhí)行指令的工具,進(jìn)化成了一個(gè)擁有基礎(chǔ)判斷力的智能體。

視覺(jué)、語(yǔ)言與動(dòng)作是如何實(shí)時(shí)互動(dòng)的?

要理解VLA的原理,可以把它想象成一個(gè)極速運(yùn)轉(zhuǎn)的翻譯機(jī)。它的輸入端非常豐富,包含了攝像頭采集的高清圖像、激光雷達(dá)生成的點(diǎn)云數(shù)據(jù),甚至是導(dǎo)航地圖里的路名和交規(guī)限制。這些原本形態(tài)各異的數(shù)據(jù),會(huì)被轉(zhuǎn)化為一種統(tǒng)一的數(shù)字語(yǔ)言,輸入到大模型的中心處理器中。與此同時(shí),人類的駕駛意圖也會(huì)作為一種引導(dǎo)信號(hào)加入其中,讓模型知道接下來(lái)的目標(biāo)是什么。

在這個(gè)中心處理器里,視覺(jué)數(shù)據(jù)和語(yǔ)言知識(shí)會(huì)進(jìn)行深度的對(duì)齊。模型會(huì)自動(dòng)在海量的記憶中搜索,在類似的畫(huà)面下,人類的規(guī)則和常識(shí)會(huì)怎么做?這種搜索并不是簡(jiǎn)單的匹配,而是一種基于概率和邏輯的推理。比如當(dāng)視覺(jué)系統(tǒng)發(fā)現(xiàn)前方路面有大量的積水,而導(dǎo)航顯示這里是低洼地段,語(yǔ)言模型中的常識(shí)就會(huì)提示水深可能導(dǎo)致熄火或高速通過(guò)會(huì)產(chǎn)生水滑等。于是,模型會(huì)產(chǎn)生一個(gè)對(duì)應(yīng)的動(dòng)作決策。

最關(guān)鍵的一步是動(dòng)作的輸出。VLA模型不會(huì)直接給出一個(gè)模糊的建議,而是會(huì)把推理的結(jié)果轉(zhuǎn)化成汽車能聽(tīng)懂的控制指令,比如具體的轉(zhuǎn)向角度、剎車力度或者加速百分比。為了讓這些指令更加精準(zhǔn),還會(huì)給模型喂入大量的專家駕駛數(shù)據(jù),讓它學(xué)習(xí)老司機(jī)在面對(duì)復(fù)雜情況時(shí)的處理習(xí)慣。通過(guò)這種方式,視覺(jué)的捕捉、語(yǔ)言的思考和動(dòng)作的執(zhí)行會(huì)被緊密地鎖在一個(gè)循環(huán)里,實(shí)現(xiàn)了真正意義上的端到端控制。

這種新技術(shù)能解決哪些駕駛難題?

VLA模型最大的優(yōu)勢(shì)在于能處理那些極其罕見(jiàn)的特例場(chǎng)景。在自動(dòng)駕駛領(lǐng)域,這些被稱為長(zhǎng)尾場(chǎng)景,比如路面突然掉落的異形貨物、正在追逐打鬧的小狗或者是正在施工且沒(méi)有標(biāo)準(zhǔn)標(biāo)識(shí)的臨時(shí)路段等都屬于這類場(chǎng)景。傳統(tǒng)的系統(tǒng)很難覆蓋所有的突發(fā)情況,而VLA則可以憑借其強(qiáng)大的泛化能力,利用已有的常識(shí)進(jìn)行推斷。即使它從來(lái)沒(méi)見(jiàn)過(guò)掉落的浴缸,它也能通過(guò)視覺(jué)識(shí)別出這是一個(gè)不可逾越的固體,并結(jié)合安全邏輯選擇最穩(wěn)妥的繞行路徑。

除了處理突發(fā)狀況,VLA還賦予了汽車更強(qiáng)的人機(jī)交互和解釋能力?,F(xiàn)在的端到端自動(dòng)駕駛像個(gè)黑盒,乘客不知道它為什么突然急剎,也不知道它為什么要換道。但基于VLA系統(tǒng)的車輛可以實(shí)時(shí)將駕駛邏輯轉(zhuǎn)化為自然的語(yǔ)言。它能告訴乘客前方路口有行人視線盲區(qū),我正在減速觀察,或者左側(cè)車輛變道意圖明顯,我選擇了避讓。這種透明度不僅能緩解乘客的焦慮,也讓整個(gè)駕駛過(guò)程變得更加符合人類的社交習(xí)慣。

此外,這種模型還支持更加復(fù)雜的語(yǔ)音指令。你不需要再通過(guò)固定的菜單去設(shè)置導(dǎo)航,甚至可以給它一些模糊的指令,比如在不違規(guī)的前提下盡量開(kāi)得快一點(diǎn)或者找一個(gè)風(fēng)景好且方便靠邊停的地方。VLA能夠理解這些充滿主觀色彩的詞匯,并將其轉(zhuǎn)化為具體的駕駛行為。它能根據(jù)路況的復(fù)雜程度和道路的限速信息,在安全和效率之間找到一個(gè)平衡點(diǎn)。這種對(duì)復(fù)雜意圖的精準(zhǔn)執(zhí)行,是傳統(tǒng)算法難以企及的。

走向大規(guī)模應(yīng)用還需要跨越哪些門檻?

雖然VLA前景廣闊,但要把這種龐大的模型塞進(jìn)量產(chǎn)車?yán)?,依然面臨著巨大的挑戰(zhàn)。計(jì)算效率的問(wèn)題是不可避免的,大模型需要海量的算力支持,而車載芯片的資源是有限的。如果模型處理一幀畫(huà)面的時(shí)間太長(zhǎng),就會(huì)導(dǎo)致駕駛指令的延遲,這在高速行駛中是非常危險(xiǎn)的。因此,如何對(duì)VLA模型進(jìn)行瘦身和加速,在不犧牲智能的前提下提高運(yùn)行速度,是目前行業(yè)攻關(guān)的核心方向。

還有就是安全性的邊界問(wèn)題,大語(yǔ)言模型有時(shí)會(huì)產(chǎn)生幻覺(jué),即說(shuō)出一些邏輯不通或者脫離現(xiàn)實(shí)的話。如果這種現(xiàn)象發(fā)生在駕駛控制上,后果將不堪設(shè)想。因此,在VLA模型的輸出端,必須加上一套堅(jiān)固的安全護(hù)欄。這套護(hù)欄通常由基礎(chǔ)的物理定律和嚴(yán)苛的交通規(guī)則組成,無(wú)論大模型的決策多么智能,只要觸碰了安全紅線,系統(tǒng)就會(huì)強(qiáng)行介入并進(jìn)行修正。

數(shù)據(jù)的質(zhì)量和多樣性也決定了VLA模型的天花板。要讓汽車真正像人一樣思考,就需要給它喂入更高質(zhì)量的、帶有詳細(xì)語(yǔ)言標(biāo)注的駕駛數(shù)據(jù)。這不僅要包括汽車跑出來(lái)的軌跡,還要包括人類在開(kāi)車時(shí)當(dāng)下的心理活動(dòng)和判斷邏輯。隨著數(shù)據(jù)規(guī)模的不斷擴(kuò)大和訓(xùn)練方法的持續(xù)演進(jìn),VLA模型將會(huì)變得越來(lái)越成熟。它不再只是一個(gè)輔助工具,而是會(huì)逐漸演變成一個(gè)真正理解物理世界、能夠獨(dú)立應(yīng)對(duì)復(fù)雜環(huán)境的數(shù)字化老司機(jī),徹底改變我們的出行方式。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3856

    瀏覽量

    52310
  • Vla
    Vla
    +關(guān)注

    關(guān)注

    0

    文章

    25

    瀏覽量

    5920
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    795

    文章

    15044

    瀏覽量

    181909
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何構(gòu)建適合自動(dòng)駕駛的世界模型?

    提出的。那世界模型是自動(dòng)駕駛落地的正解嗎? 什么是世界模型? 世界模型對(duì)于自動(dòng)駕駛汽車來(lái)說(shuō),更像是給汽車大腦里繪制一張地圖,可以將環(huán)境的現(xiàn)狀和未來(lái)可能的演變都表示出來(lái),自動(dòng)駕駛系統(tǒng)不
    的頭像 發(fā)表于 02-18 08:14 ?1.1w次閱讀
    如何構(gòu)建適合<b class='flag-5'>自動(dòng)駕駛</b>的世界模型?

    已有VLM,自動(dòng)駕駛為什么還要探索VLA?

    [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛技術(shù)正處于發(fā)展的轉(zhuǎn)折點(diǎn)。過(guò)去十幾年間,行業(yè)長(zhǎng)期依賴模塊化的技術(shù)路徑,即將駕駛任務(wù)拆解為感知、預(yù)測(cè)、規(guī)劃和控制四個(gè)獨(dú)立環(huán)節(jié)。這種結(jié)構(gòu)雖然清晰,但在面對(duì)突發(fā)狀況
    的頭像 發(fā)表于 02-03 09:04 ?429次閱讀
    已有VLM,<b class='flag-5'>自動(dòng)駕駛</b>為什么還要探索<b class='flag-5'>VLA</b>?

    Transformer如何自動(dòng)駕駛大模型獲得思考能力?

    在談及自動(dòng)駕駛時(shí),Transformer一直是非常關(guān)鍵的技術(shù),為何Transformer在自動(dòng)駕駛行業(yè)一直被提及?
    的頭像 發(fā)表于 02-01 09:15 ?4458次閱讀

    如何設(shè)計(jì)好自動(dòng)駕駛ODD?

    為確定自動(dòng)駕駛的可使用范圍,會(huì)給自動(dòng)駕駛設(shè)置一個(gè)運(yùn)行設(shè)計(jì)域(Operational Design Domain,ODD)。ODD的作用就是用來(lái)明確自動(dòng)駕駛在什么情況下能工作,在什么情況下不能工作,給車設(shè)定“工作范圍”。
    的頭像 發(fā)表于 01-24 09:27 ?1870次閱讀

    純視覺(jué)自動(dòng)駕駛的優(yōu)勢(shì)和劣勢(shì)哪些?

    [首發(fā)于智駕最前沿微信公眾號(hào)]最近有很多小伙伴在后臺(tái)詢問(wèn)純視覺(jué)自動(dòng)駕駛的優(yōu)劣,純視覺(jué)自動(dòng)駕駛以其低成本、高冗余的技術(shù)路徑,正成為自動(dòng)駕駛現(xiàn)階段主要的一個(gè)發(fā)展方向。但它由于在多個(gè)場(chǎng)景下的感知能力不如
    的頭像 發(fā)表于 01-18 09:50 ?2419次閱讀
    純視覺(jué)<b class='flag-5'>自動(dòng)駕駛</b>的優(yōu)勢(shì)和劣勢(shì)<b class='flag-5'>有</b>哪些?

    VLA與世界模型什么不同?

    [首發(fā)于智駕最前沿微信公眾號(hào)]當(dāng)前自動(dòng)駕駛行業(yè),各車企的技術(shù)路徑普遍選擇了單車智能方向。而在實(shí)際落地過(guò)程中,不同企業(yè)選擇了差異化的技術(shù)實(shí)現(xiàn)方式,部分車企側(cè)重于視覺(jué)—語(yǔ)言—?jiǎng)幼髂P停╒ision
    的頭像 發(fā)表于 12-17 09:13 ?960次閱讀
    <b class='flag-5'>VLA</b>與世界模型<b class='flag-5'>有</b>什么不同?

    VLA能解決自動(dòng)駕駛中的哪些問(wèn)題?

    [首發(fā)于智駕最前沿微信公眾號(hào)]很多從事自動(dòng)駕駛的小伙伴應(yīng)該對(duì)VLA這個(gè)概念已經(jīng)非常熟悉了。VLA即“Visual-Language-Action”(視覺(jué)—語(yǔ)言—?jiǎng)幼鳎┠P停暮诵氖菍⒁曈X(jué)信息
    的頭像 發(fā)表于 11-25 08:53 ?677次閱讀
    <b class='flag-5'>VLA</b>能解決<b class='flag-5'>自動(dòng)駕駛</b>中的哪些問(wèn)題?

    VLA和世界模型,誰(shuí)才是自動(dòng)駕駛的最優(yōu)解?

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)發(fā)展,其實(shí)現(xiàn)路徑也呈現(xiàn)出兩種趨勢(shì),一邊是以理想、小鵬、小米為代表的VLA(視覺(jué)—語(yǔ)言—行動(dòng))模型路線;另一邊則是以華為、蔚來(lái)為主導(dǎo)的世界模型(World
    的頭像 發(fā)表于 11-05 08:55 ?981次閱讀
    <b class='flag-5'>VLA</b>和世界模型,誰(shuí)才是<b class='flag-5'>自動(dòng)駕駛</b>的最優(yōu)解?

    不同等級(jí)的自動(dòng)駕駛技術(shù)要求上有何不同?

    談到自動(dòng)駕駛,不可避免地會(huì)涉及到自動(dòng)駕駛分級(jí),美國(guó)汽車工程師學(xué)會(huì)(SAE)根據(jù)自動(dòng)駕駛系統(tǒng)與人類駕駛員參與駕駛行為程度的不同,將
    的頭像 發(fā)表于 10-18 10:17 ?2917次閱讀

    自動(dòng)駕駛上常提的VLA與世界模型什么區(qū)別?

    自動(dòng)駕駛中常提的VLA,全稱是Vision-Language-Action,直譯就是“視覺(jué)-語(yǔ)言-動(dòng)作”。VLA的目標(biāo)是把相機(jī)或傳感器看到的畫(huà)面、能理解和處理自然語(yǔ)言的大模型能力,和最終控制車輛
    的頭像 發(fā)表于 10-18 10:15 ?1473次閱讀

    自動(dòng)駕駛仿真測(cè)試什么具體要求?

    、動(dòng)力響應(yīng)和操控穩(wěn)定性,自動(dòng)駕駛系統(tǒng)的復(fù)雜性主要體現(xiàn)在感知、決策與控制等軟件層面,其運(yùn)行行為高度依賴于交通環(huán)境、傳感器輸入和系統(tǒng)邏輯。這也就意味著,傳統(tǒng)的物理測(cè)試方法已經(jīng)難以全面覆蓋自動(dòng)駕駛系統(tǒng)所面臨的所有
    的頭像 發(fā)表于 10-15 09:14 ?895次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>仿真測(cè)試<b class='flag-5'>有</b>什么具體要求?

    卡車、礦車的自動(dòng)駕駛和乘用車的自動(dòng)駕駛在技術(shù)要求上有何不同?

    [首發(fā)于智駕最前沿微信公眾號(hào)]自動(dòng)駕駛技術(shù)的發(fā)展,組合輔助駕駛得到大量應(yīng)用,但現(xiàn)在對(duì)于自動(dòng)駕駛技術(shù)的宣傳,普遍是在乘用車領(lǐng)域,而對(duì)于卡車、礦車的
    的頭像 發(fā)表于 06-28 11:38 ?1897次閱讀
    卡車、礦車的<b class='flag-5'>自動(dòng)駕駛</b>和乘用車的<b class='flag-5'>自動(dòng)駕駛</b>在技術(shù)要求上有何不同?

    自動(dòng)駕駛汽車接管邏輯如何設(shè)置更為合理?

    交通環(huán)境并隨時(shí)接管的工作。但就是這一簡(jiǎn)單需求,車企在自動(dòng)駕駛系統(tǒng)與人類駕駛員的接管邊界并未給出明確的界定。很多實(shí)際案例表明,在系統(tǒng)無(wú)法處理復(fù)雜路況時(shí),會(huì)突然彈出“請(qǐng)立即接管”的提示,而駕駛
    的頭像 發(fā)表于 06-26 08:56 ?1017次閱讀

    自動(dòng)駕駛技術(shù)測(cè)試哪些?

    [首發(fā)于智駕最前沿微信公眾號(hào)]之前和大家從安全性、可靠性、用戶體驗(yàn)以及商業(yè)利益保護(hù)等多個(gè)角度聊了為什么自動(dòng)駕駛技術(shù)在落地前一定要進(jìn)行測(cè)試,今天智駕最前沿就繼續(xù)帶大家聊一聊自動(dòng)駕駛測(cè)試到底哪些方法
    的頭像 發(fā)表于 06-10 09:00 ?1220次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>技術(shù)測(cè)試<b class='flag-5'>有</b>哪些?

    自動(dòng)駕駛安全基石:ODD

    電子發(fā)燒友網(wǎng)綜合報(bào)道 自動(dòng)駕駛ODD(Operational Design Domain)即設(shè)計(jì)運(yùn)行域,是指自動(dòng)駕駛系統(tǒng)被設(shè)計(jì)為安全、有效運(yùn)行的具體條件范圍。它定義了自動(dòng)駕駛汽車在哪些環(huán)境、場(chǎng)景
    的頭像 發(fā)表于 05-19 03:52 ?7144次閱讀
    南阳市| 平安县| 庄河市| 新河县| 遵义市| 丹巴县| 黔江区| 莆田市| 延吉市| 四平市| 平山县| 同心县| 永寿县| 团风县| 邵武市| 隆化县| 琼结县| 沐川县| 福清市| 泾阳县| 龙口市| 普兰县| 溧阳市| 逊克县| 永平县| 昂仁县| 保山市| 静海县| 阿克| 北辰区| 通化县| 乐陵市| 枣强县| 平遥县| 柞水县| 陆川县| 阿荣旗| 岑溪市| 和林格尔县| 日土县| 双鸭山市|