2026年3月,小鵬發(fā)布了自動駕駛世界模型(X-World)的技術(shù)報告,揭示了小鵬世界模型X-World的構(gòu)建與使用,并展示了這一技術(shù)在小鵬汽車自動駕駛中的實際使用價值。
近日,小鵬集團世界模型技術(shù)再突破,發(fā)布了X-Cache技術(shù)報告。X-Cache 是面向少步自回歸世界模型的跨段塊級緩存。世界模型生成未來畫面時,X-Cache 能在基本不犧牲畫質(zhì)的前提下,復(fù)用相鄰兩段畫面、同一去噪步驟的中間結(jié)果,大約減少七成的重復(fù)計算,對世界模型的去噪主干(DiT,Diffusion Transformer)實現(xiàn)最高約 2.7 倍的推理加速。
X-Cache“偷懶”但靠譜
利用物理世界連續(xù)性,實現(xiàn)跨畫面分塊復(fù)用
隨著自動駕駛進入模型驅(qū)動階段,對現(xiàn)實世界的高還原度仿真成為自動駕駛模型不斷進化的核心支撐?;谧曰貧w視頻擴散的世界模型,雖具備高保真、多視角視頻的生成能力,但其推理成本與延遲仍是制約實時交互與大規(guī)模部署的瓶頸。小鵬使用更少的步驟來打磨出最接近現(xiàn)實世界的畫面(少步蒸餾技術(shù)),如果用傳統(tǒng)的加速方法,即,在每一次去噪步數(shù)之間識別是否相似、能否跳過,也是無法解決推理慢的問題。
X-Cache的核心思路來自于物理事實:自動駕駛行車的畫面是連續(xù)的、順滑變化的。車在行駛過程中,上一幀的道路、路邊樹木、遠處建筑和下一幀幾乎沒有變化;于是,X-Cache把視頻按時間切成一段段連續(xù)的「畫面段」,然后比較相鄰兩段片段在去噪網(wǎng)絡(luò)內(nèi)部同一層、同一去噪步上的中間特征相似度。若變化不大,就直接復(fù)用上一段算出來的中間結(jié)果,跳過整層計算。這就是X-Cache的跨塊緩存邏輯。
簡單來說,X-Cache不依賴“步數(shù)”維度(在少步蒸餾模型中已無冗余可挖),而是沿著“連續(xù)生成的畫面段”這一新維度進行優(yōu)化。

X-Cache總體架構(gòu)示意圖
為了保障跨塊復(fù)用的準確性,X-Cache會生成一個“指紋”:除了結(jié)合畫面結(jié)構(gòu),也會結(jié)合駕駛動作(如:猛打方向盤)來判斷現(xiàn)在的路況和剛才的路況像不像,更聰明的進行復(fù)用;同時,X-Cache也具備“保命機制”,在車輛轉(zhuǎn)彎、變道、紅綠燈切換等場景突變的關(guān)鍵時刻(KV更新幀),強制要求全量計算,防止錯誤累積導(dǎo)致的畫面崩損。
由此,X-Cache在不犧牲生成質(zhì)量的前提下顯著提升世界模型的推理效率,為高并發(fā)、高頻調(diào)用場景中的應(yīng)用提供了解法。
X-Cache是聰明、即插即用的小工具
推動世界模型無損加速
X-Cache 是一段無需訓(xùn)練的控制邏輯,緩存內(nèi)容隨生成實時刷新,相比模型本身的參數(shù)量,開銷可控。
不同于停留在實驗驗證階段的方案,X-Cache這個聰明的小工具已在小鵬自動駕駛世界模型X-World中成功得到應(yīng)用,并在城市、高速等多類復(fù)雜場景中穩(wěn)定運行。通過跨分塊計算復(fù)用,實現(xiàn)極高的計算利用率與推理加速,并通過多重機制保障生成質(zhì)量與系統(tǒng)穩(wěn)定性,具備面向規(guī)模化應(yīng)用的工程可靠性。
X-Cache 可達到 71% 塊跳過率 ,以及 2.6 ~2.7倍實測推理加速,且畫面質(zhì)量幾乎無損
X-World 作為面向物理世界的仿真引擎,構(gòu)建起可推演、可交互的虛擬環(huán)境,成為模型訓(xùn)練與持續(xù)進化的核心基礎(chǔ)設(shè)施。在此基礎(chǔ)上,X-Cache進一步解決規(guī)?;抡孢\行中的效率與成本問題,使高質(zhì)量仿真具備“跑得動、跑得快、成本可控”的工程化能力。依托這一體系支撐,小鵬第二代VLA的能力上限得以顯著提升。
總結(jié)來說:
第二代VLA負責感知與決策,是用戶可直接感知的能力輸出端
X-World承擔虛實映射與場景推演,是系統(tǒng)進化的核心支撐
X-Cache提供高效推理能力,是支撐大規(guī)模仿真運行的加速引擎
通過這一體系,小鵬實現(xiàn)從數(shù)據(jù)采集、模型訓(xùn)練、仿真驗證到持續(xù)迭代的閉環(huán)能力,推動自動駕駛從單點能力優(yōu)化,走向模型驅(qū)動的全鏈路閉環(huán)迭代。
算力基建新突破
賦能規(guī)?;涞嘏c生態(tài)拓展
從X-World的亮相到X-Cache的開發(fā),小鵬在短時間內(nèi)完成了從“構(gòu)建高質(zhì)量仿真世界”到“高效利用仿真世界”的跨越。這不僅是一次推理加速,更是讓低成本、高并發(fā)的閉環(huán)仿真成為可拓展、常態(tài)化運營的能力。
X-Cache 證明,在物理AI時代,競爭焦點不僅是芯片的峰值算力,更應(yīng)該探索如何借助物理世界的先驗知識,最大化每一份算力的價值,讓每一次計算都用于探索“未知”。
值得一提的是,X-Cache面向少步自回歸交互式仿真,也能直接拓展至同類具身智能與世界模型,滿足自動駕駛閉環(huán)測試、在線強化學習、低算力芯片部署等工業(yè)級需求,為具身智能、機器人仿真乃至更廣泛的物理世界交互,提供了一套可復(fù)用的算力范式與生態(tài)基石。
上周,何小鵬在北京車展提到,第二代VLA自向用戶推送以來,全系Ultra車主提車第一周每天開啟NGP的比例高達98.52%,一段完整行程100%NGP駕駛行程數(shù)量環(huán)比增長115.9%,使用智駕已成為廣大車主的日常出行習慣。小鵬第二代VLA將逐步覆蓋全系Ultra、Ultra SE車型,并計劃于今年內(nèi)向MAX車主推送蒸餾版第二代VLA,讓更多用戶體驗到技術(shù)領(lǐng)先、體驗領(lǐng)先的智能輔助駕駛技術(shù)。
未來,小鵬集團將持續(xù)探索自動駕駛領(lǐng)域更多技術(shù)突破,讓小鵬智駕在數(shù)字世界練得更強、現(xiàn)實世界開得更穩(wěn)。
-
模型
+關(guān)注
關(guān)注
1文章
3846瀏覽量
52295 -
自動駕駛
+關(guān)注
關(guān)注
795文章
15026瀏覽量
181786 -
小鵬汽車
+關(guān)注
關(guān)注
4文章
652瀏覽量
16852
原文標題:小鵬發(fā)布「世界模型加速器」X-Cache,無需訓(xùn)練、即插即用,推理速度提升2.7倍
文章出處:【微信號:XPENGMOTORS,微信公眾號:小鵬汽車】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
小鵬發(fā)布 X-World 世界模型:已全面應(yīng)用第二代VLA
小馬智行發(fā)布PonyWorld世界模型2.0
如何使用 powerquad 加速器中的一些功能以及 CMSIS 原始實現(xiàn)中的一些功能?
利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)
邊緣計算中的AI加速器類型與應(yīng)用
一些神經(jīng)網(wǎng)絡(luò)加速器的設(shè)計優(yōu)化方案
航裕電源以大電流技術(shù)為國內(nèi)外超導(dǎo)加速器項目提供優(yōu)質(zhì)方案
小鵬汽車新總部正式亮燈
英特爾Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持
高壓放大器在粒子加速器研究中的應(yīng)用
粒子加速器?——?科技前沿的核心裝置
NVIDIA GTC巴黎亮點:全新Cosmos Predict-2世界基礎(chǔ)模型與CARLA集成加速智能汽車訓(xùn)練
基于雙向塊浮點量化的大語言模型高效加速器設(shè)計
小鵬汽車發(fā)布世界模型加速器X-Cache
評論