[首發(fā)于智駕最前沿微信公眾號]2026年4月底,特斯拉開始向北美用戶推送FSD V14.3。這個版本在技術(shù)層面做了很多改動,其將車輛控制環(huán)節(jié)最后的30多萬行手寫C++代碼全部移除,改由神經(jīng)網(wǎng)絡(luò)直接輸出駕駛指令。與此配套的還有編譯器重寫、模型規(guī)模大幅提升,以及時空記憶能力首次落地等。今天就詳細(xì)和大家聊一聊特斯拉的FSD V14.3。

圖片源自:網(wǎng)絡(luò)

端到端的最后一塊拼圖,是怎么做到的?
其實從V12開始,特斯拉就將感知和路徑規(guī)劃這兩個環(huán)節(jié)交給了神經(jīng)網(wǎng)絡(luò),也就是系統(tǒng)看到畫面后判斷周圍有什么和應(yīng)該往哪走這兩步不再依賴于人手寫的規(guī)則。但在最后一步,也就是車輛控制(把規(guī)劃結(jié)果轉(zhuǎn)化成具體的方向盤轉(zhuǎn)角、油門深度和剎車力度)仍然依賴一套傳統(tǒng)的控制邏輯。這套邏輯對應(yīng)著超過30萬行C++代碼,由工程師逐條編寫和維護(hù)。
用代碼來控制車輛其實一直存在一個問題,那就是無論規(guī)則寫得多詳盡,總有讓系統(tǒng)發(fā)懵的場景。比如黃燈快結(jié)束時該加速通過還是提前停下?停車場里面對好幾個空位該選哪一個?這些人類駕駛員憑直覺就能處理的情況,落到規(guī)則系統(tǒng)里,就會變成生硬的取舍。代碼只能覆蓋工程師提前想好的那部分場景,但脫離規(guī)則之外的部分就成了系統(tǒng)的能力盲區(qū)。

圖片源自:網(wǎng)絡(luò)
這次V14.3的更新,其實最大的改變就是做了一件事,用AI神經(jīng)網(wǎng)絡(luò)直接接手智能駕駛的整個環(huán)節(jié)。系統(tǒng)從車載攝像頭接收圖像,到最終的方向盤和踏板指令,中間不再經(jīng)過任何手寫規(guī)則的約束,這也是我們經(jīng)常聽到的全域一段式端到端架構(gòu)。在這個架構(gòu)下,不再需要單獨定義感知、規(guī)劃、控制這些模塊,整個流程用一個神經(jīng)網(wǎng)絡(luò)完成。
讓AI神經(jīng)網(wǎng)絡(luò)接手智能駕駛有什么好處呢?對于自動駕駛系統(tǒng)來說,其不再需要判斷如果紅燈則停車這類規(guī)則條目,而是可以從海量人類駕駛數(shù)據(jù)中學(xué)習(xí)該怎么做。學(xué)習(xí)的數(shù)據(jù)里就包含了各種復(fù)雜場景下的應(yīng)對方式,模型的任務(wù)就是把這些東西內(nèi)化成自己的經(jīng)驗。這樣做也意味著系統(tǒng)的能力上限不再取決于多少工程師花了多少時間寫了多少條規(guī)則,而是取決于訓(xùn)練數(shù)據(jù)的豐富程度和模型本身能不能吃得下這些數(shù)據(jù)。
為此,特斯拉把神經(jīng)網(wǎng)絡(luò)的參數(shù)量提升到了此前版本的約10倍。更大的模型能記住如異形交叉口、復(fù)合信號燈、復(fù)雜的施工區(qū)布局、非標(biāo)準(zhǔn)化的交通標(biāo)志等更多樣的路況模式,這些之前因容量受限無法充分學(xué)習(xí)的邊緣案例,現(xiàn)在有了被模型吸收的條件,這也是為什么V14.3在一些罕見場景下的表現(xiàn)會明顯好轉(zhuǎn)的原因。

編譯器也重寫了,反應(yīng)時間縮短了20%
除了模型架構(gòu)本身,特斯拉在V14.3里還動了一個不太容易被注意到的環(huán)節(jié),那就是編譯器,編譯器的作用是把神經(jīng)網(wǎng)絡(luò)的計算邏輯翻譯成硬件能執(zhí)行的指令。自動駕駛模型的計算圖極其復(fù)雜,傳統(tǒng)編譯器在翻譯過程中會產(chǎn)生冗余的計算步驟,導(dǎo)致實際執(zhí)行時多跑了很多不必要的操作。

圖片源自:網(wǎng)絡(luò)
這次特斯拉基于MLIR(多層中間表示)框架從零重寫了編譯器和運(yùn)行環(huán)境。MLIR的好處是可以在較高的抽象層次上保留計算圖的結(jié)構(gòu)信息,更容易識別出哪些運(yùn)算可以合并、哪些數(shù)據(jù)可以被復(fù)用,然后生成更精簡的硬件指令序列。這樣的設(shè)計可以讓攝像頭捕捉到畫面到車輛執(zhí)行加速或轉(zhuǎn)向動作的時間延遲比之前縮短20%。
這20%對一個以120公里每小時行駛的車輛來說,相當(dāng)于在感知到危險之后,制動介入的距離會變短。在高速場景下,快一點和慢一點之間的差別有時候就是非常關(guān)鍵的。

模型能記住3到5秒之前發(fā)生的事了
除了上面說的這些,V14.3還第一次給FSD模型加入了明確的時空記憶能力,時長大約3到5秒。在此之前,F(xiàn)SD的決策更偏重于基于當(dāng)前幀畫面做反應(yīng),雖然之前的版本也通過算法間接捕捉了一些時序信息,但沒有一個明確的記憶機(jī)制。這樣做的結(jié)果就是系統(tǒng)偶爾會表現(xiàn)得像忘了上一秒發(fā)生過什么似得,譬如一輛車剛變道切到前面,系統(tǒng)反應(yīng)慢了半拍,或者跟車過程中忽然來一腳不必要的剎車等行為就容易出現(xiàn)。
3到5秒的記憶意味著模型現(xiàn)在能記住短時間內(nèi)前車的加減速動態(tài)、剛剛錯過的那個路牌上的限速數(shù)字、或者路口那一側(cè)行人的移動速度變化。這些信息會參與后續(xù)的軌跡規(guī)劃和車速調(diào)整,讓駕駛動作更具連貫性,基于此,車輛不再是逐幀反應(yīng),而是有了一個連續(xù)的時間感知。
這一能力對大模型來說是非常重要的,參數(shù)量上來了,模型本身就有足夠的容量去維持一個短期的記憶狀態(tài),不需要外掛什么額外的模塊。特斯拉要做的就是在訓(xùn)練過程中讓模型學(xué)會將剛才發(fā)生了什么和現(xiàn)在應(yīng)該做什么這兩件事關(guān)聯(lián)起來。

強(qiáng)化訓(xùn)練翻倍,專挑難的路況學(xué)
對于大模型的訓(xùn)練,特斯拉也明顯加大了對長尾場景的投入,在V14.3的訓(xùn)練數(shù)據(jù)集里,特斯拉有意識地從全球車隊中采集了如復(fù)合信號燈路口、彎道上的黃燈、施工區(qū)不規(guī)則的錐桶擺放、小動物突然穿行、讓行標(biāo)志被遮擋的街角路口等等大量罕見和復(fù)雜的駕駛案例。這些場景在日常行駛中占比很小,但處理得當(dāng)與否直接決定了用戶對系統(tǒng)的信任度。
特斯拉采用的方式是在訓(xùn)練過程中主動提高這些困難樣本的權(quán)重,而不是讓模型在大量常規(guī)路況中淹掉它們。這種針對性的強(qiáng)化訓(xùn)練讓V14.3在相對罕見的場景下表現(xiàn)出了和常規(guī)路況接近的處理水準(zhǔn)。也正因為如此,它的加減速曲線、停車標(biāo)識前的響應(yīng)方式以及停車場內(nèi)的泊車選擇,都變得更果斷、更像一個熟練的駕駛員。

圖片源自:網(wǎng)絡(luò)
這里提到的強(qiáng)化訓(xùn)練,并不是替換掉先前的人類駕駛數(shù)據(jù)監(jiān)督學(xué)習(xí)訓(xùn)練,而是在此基礎(chǔ)上使用難度更高、更稀少的數(shù)據(jù)進(jìn)一步精調(diào)模型。基礎(chǔ)訓(xùn)練仍然依賴海量人類駕駛視頻,讓模型學(xué)會正常該怎么做,而強(qiáng)化樣本的作用是讓模型在不太正常的情況下也別慌,知道該怎么處理。

視覺感知也變強(qiáng)了,還能聽見急救車?
在整個端到端的框架下,感知能力的提升也是系統(tǒng)整體變好的一部分,V14.3還升級了視覺編碼器,也就是神經(jīng)網(wǎng)絡(luò)里負(fù)責(zé)從原始圖像中提取信息的那一部分。新的編碼器在低光照、夜間、隧道等光線不足的場景下能提取出更豐富的畫面信息。
同時,它對3D空間結(jié)構(gòu)的理解也有顯著提升,能更準(zhǔn)確地判斷物體在三維空間中的位置和形狀。這意味著一些如從人行道伸出來的樹枝、路邊斜放著的自行車等外形不規(guī)則的障礙物,現(xiàn)在能被更精確地識別。

圖片源自:網(wǎng)絡(luò)
在有些介紹中,還提到了V14.3一個非常有意思的功能,那就是音頻感知能力。特斯拉給系統(tǒng)加入了對緊急車輛的識別能力,車輛不再只能看到閃燈的緊急車輛,也能聽到鳴笛聲,并據(jù)此做出調(diào)整。當(dāng)識別到緊急車輛后,系統(tǒng)會放慢車速、留出通行空間,必要時還會發(fā)出提示。這是感知從純視覺走向多模態(tài)的一個信號。

泊車不再是猶豫不決的狀態(tài)
對于車主來說,V14.3提升最明顯的就是泊車功能,有些車主反饋,之前版本的FSD在停車場里的表現(xiàn)并不是特別好,明明面前好幾個空位,它卻不知道該停哪一個,反復(fù)切換候選車位,機(jī)動動作也很猶豫,而V14.3在這點上有了明顯改變。系統(tǒng)現(xiàn)在會在導(dǎo)航地圖上用P圖標(biāo)提前標(biāo)注出它打算停的位置,進(jìn)到車位附近后對目標(biāo)的選擇和泊入動作都果斷了不少,這也說明規(guī)劃模塊在當(dāng)前版本中對停車場這類場景的理解更深了,不再是一個大概知道要停車但不確定停哪的模糊狀態(tài)。

圖片源自:網(wǎng)絡(luò)
除了泊車之外,V14.3在十字路口的表現(xiàn)也更流暢,面對復(fù)合信號燈(主燈和輔燈同時存在、或者直行燈和轉(zhuǎn)彎燈交替變綠)的時候,V14.3的通行判斷更接近人類。它不會在黃燈前出現(xiàn)猶豫不定的加速與剎車切換,也不會在綠燈亮起時遲緩半秒才起步。對于車道保持功能,彎道行駛的居中穩(wěn)定性也明顯改善,對相鄰車道的侵入更少,過彎速度也控制得更加平滑。

V14.3后續(xù)會做些什么?
特斯拉在V14.3的更新說明里還提前說了幾件后續(xù)要做的事,其中用戶期待已久的坑洼路面避讓功能被正式寫進(jìn)了路線圖。目前看到的技術(shù)路線上,系統(tǒng)會先通過視覺檢測路面的不平整情況,然后把它納入路徑規(guī)劃的考量范圍。更遠(yuǎn)的計劃是結(jié)合車輛懸架傳感器的信息來進(jìn)一步校驗路面狀態(tài),讓避讓的時機(jī)和幅度都更加準(zhǔn)確。
另外,針對搭載HW3硬件的車型,特斯拉計劃在6月底推送一個輕量版本,即FSD V14 Lite。這個版本是對完整版V14.3的模型做蒸餾壓縮,保留核心的駕駛能力,但在模型規(guī)模和細(xì)節(jié)表現(xiàn)上會有取舍。需要說明的是,由于V14.3完整版本身的計算負(fù)載遠(yuǎn)超HW3設(shè)計時的算力上限,輕量版并不是把完整版裁減一下就能直接適配的。它需要單獨做一輪面向HW3的架構(gòu)調(diào)整和專項訓(xùn)練,才能在這種老舊硬件上穩(wěn)定跑起來。這對老車主來說其實是非常有利的,但壓縮之后的實際表現(xiàn)是否還能保持V14.3的核心體驗,還得等上線后看實際反饋。
需要說明的是,對于真正去掉監(jiān)督版這三個字的FSD,也就是車輛可以完全自主行駛、不需要駕駛員時刻關(guān)注的版本,特斯拉在V14.3的更新里沒有給出具體時間。從技術(shù)趨勢看,V14.3的架構(gòu)已經(jīng)具備了支撐更高階自動駕駛的底層能力,但目前,V14.3仍然是一個L2級系統(tǒng),方向盤后面的人依然是責(zé)任主體。
審核編輯 黃宇
-
特斯拉
+關(guān)注
關(guān)注
66文章
6426瀏覽量
131549 -
AI
+關(guān)注
關(guān)注
91文章
41866瀏覽量
302987
發(fā)布評論請先 登錄
特斯拉AI芯片戰(zhàn)略升級,“史詩級”芯片接棒Dojo
2500 TOPS!特斯拉HW5智駕算力怪獸突擊,國產(chǎn)VLA火速進(jìn)化
直播預(yù)告|玄鐵 x Canonical:從本地推理到 AI 工廠,基于 RISC-V 的 AI 基礎(chǔ)設(shè)施創(chuàng)新路徑探討
特斯拉牽手豆包大模型:智能汽車AI交互革命的里程碑
特斯拉將接入豆包+DeepSeek,語音助手7年來首次大升級!#特斯拉#豆包大模型#中國本土AI#晶揚(yáng)電子
特斯拉AI5芯片流片成功:自動駕駛與人形機(jī)器人迎來算力革命
MediaTek創(chuàng)新技術(shù)讓AI真正走進(jìn)生活
嵌入式AI開發(fā)必看:杜絕幻覺,才是工業(yè)級IDE的核心底氣
還在手動拼接 AI 代碼?你的 IDE 早就該升級了
AI端側(cè)部署開發(fā)(SC171開發(fā)套件V2-FAS)
AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版
重磅合作!Quintauris 聯(lián)手 SiFive,加速 RISC-V 在嵌入式與 AI 領(lǐng)域落地
一文讀懂特斯拉自動駕駛FSD從輔助到端到端的演進(jìn)
特斯拉FSD V14.3,讓AI直接開車?
評論