<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      ColaVLA:自動駕駛大模型,不一定非要把「思考過程」寫成文字

      0
      分享至



      過去兩年,自動駕駛和大模型的結合越來越熱。一個很自然的方向是:既然視覺語言模型已經具備很強的場景理解和推理能力,那能不能讓它像人類司機一樣,先理解環境、再做判斷、最后輸出軌跡?

      這條路線聽起來很合理,但真正落到自動駕駛上,很快就會遇到一個問題:很多方法雖然引入了大模型,卻仍然把「推理」做成了文本鏈式推理。也就是說,模型要先生成中間解釋,再把這些解釋一步步轉成動作或軌跡。這樣做的優點是看起來 「更會思考」,但代價也非常明顯:文本是離散 token,而軌跡是連續控制;文本推理還依賴自回歸解碼,速度慢、鏈路長,不太適合實時駕駛。

      來自清華大學與香港中文大學 MMLab 的研究團隊提出了全新的隱空間推理與層次化軌跡規劃的 VLA 框架 --ColaVLA,論文已經被 CVPR2026 主會接收。



      • 論文標題:ColaVLA: Leveraging Cognitive Latent Reasoning for Hierarchical Parallel Trajectory Planning in Autonomous Driving
      • 論文鏈接: https://arxiv.org/abs/2512.22939
      • 代碼鏈接: https://github.com/pqh22/ColaVLA

      這篇論文給出的答案很直接:自動駕駛中的推理,不一定要寫成文字。

      與其讓模型「邊說邊想」,不如讓它在統一潛空間里完成推理,再把結果直接交給動作規劃器。這樣既能保留 VLM 的語義先驗和知識能力,又能繞開顯式文本生成帶來的延遲和表示錯位。

      整篇論文最重要的貢獻,其實可以概括成兩句話:第一,把推理從文本空間搬到潛空間;第二,把軌跡生成從串行過程改成分層并行過程。



      一、核心思路:先「想清楚」,再「開出來」

      ColaVLA 的整體框架由兩個核心部分組成:

      • Cognitive Latent Reasoner:負責完成高層駕駛認知
      • Hierarchical Parallel Planner:負責把高層策略展開成連續軌跡

      作者的目標不是簡單把一個大模型接到規劃器前面,而是重新定義「推理」和「動作」之間的接口,讓二者真正對齊。

      先看前半部分,也就是潛空間推理器。作者把它設計成一個很像人類司機的四步過程:

      • Understand
      • Recognize
      • Rethink
      • Decide

      這四步看上去很直觀,但真正巧妙的地方在于,它們都不是通過自然語言完成的,而是在統一潛空間中隱式完成。

      第一步 Understand,是先整體看懂場景。模型會把多視角視覺信息、固定駕駛提示和 ego 車狀態一起送入共享 VLM,先建立一個全局場景理解,而不是一上來就直接回歸軌跡。

      第二步 Recognize,是從大量視覺信息里篩出真正和當前駕駛動作相關的關鍵實體。這里論文設計了一個 ego-adaptive router,根據當前自車狀態動態選擇最重要的視覺 token,保留的通常是車道、鄰近車輛、行人、交通燈這些安全關鍵線索,而不是無差別地處理整張圖。

      第三步 Rethink,則是在壓縮后的關鍵信息上再做一次 “復核式推理”,并借助一組可學習的 meta-query 來表示不同高層駕駛策略。

      最后一步 Decide,輸出的也不是一句解釋文本,而是一組面向動作生成的高層駕駛先驗。這樣一來,模型就不再需要把推理結果先翻譯成自然語言,再從語言翻譯回動作空間,而是直接完成從認知到策略的內部閉合。



      二、真正落到動作層面,它的規劃器為什么更合理?

      很多自動駕駛方法的問題,不只是上游推理方式不合適,下游軌跡生成方式也未必真正符合駕駛動作的結構。有些方法一次性直接回歸整條軌跡,雖然簡單,但缺少層次;有些方法依賴復雜生成過程,雖然表達能力強,但效率和部署穩定性不一定理想。

      ColaVLA 這里的思路很清晰:駕駛軌跡本來就是分層的,所以生成過程也應該分層。

      論文提出的Hierarchical Parallel Planner有三個關鍵詞:

      • 先粗后細
      • 保持因果
      • 并行解碼

      它不是把未來軌跡當作一個扁平輸出,而是先確定粗粒度意圖,再逐步補足中間細節。這更像真實駕駛員的決策方式:先想清楚「往哪去」,再決定「具體怎么走」。

      同時,作者還設計了一個 causality-preserving 的注意力機制,保證不同尺度之間的信息流是從粗到細、逐層細化的,而不是相互泄漏。這樣一來,多尺度結構就不只是形式上的分解,而是真正具有因果約束的軌跡生成過程。

      更重要的是,這個 planner 可以在單次前向傳播中并行完成多尺度、多模式軌跡解碼,不用再像文本 CoT 那樣一步一步串行生成。



      三、實驗結果說明了什么?

      從結果上看,ColaVLA 最打動人的地方,不只是「指標更高」,而是它同時兼顧了精度、安全和效率。

      1. Open-loop:不只是預測更準,而且更安全

      在 nuScenes 的開環評測中,ColaVLA 在動作類方法里取得了最優綜合表現,平均 L2 誤差為0.30 m,平均碰撞率為0.23%。相比強基線 SOLVE-E2E,L2 進一步下降,碰撞率也明顯降低。

      這說明它輸出的軌跡并不只是數值上更接近真值,而是在安全性層面也更優。



      2. Closed-loop:真正體現方法價值的部分

      在更關鍵的閉環評測 NeuroNCAP 中,ColaVLA 的平均得分達到3.48,平均碰撞率降到36.8%,明顯優于多種前序方法。

      論文特別指出,相比依賴文本推理、并使用額外數據的 ImpromptuVLA,ColaVLA 在不顯式生成文本思維鏈的情況下,依然取得了更好的閉環表現。

      這個結果很有說服力,因為它說明:對自動駕駛來說,更長、更復雜的文字推理鏈,并不一定能帶來更好的真實駕駛行為;真正關鍵的,還是內部決策表征是否適合動作生成,以及規劃器是否具有合理的因果結構。



      3. 推理效率:它把「落地可能性」往前推了一步

      效率上,ColaVLA 也給出了非常亮眼的結果。在扎實的工程優化后,它的在 H200 上的端到端推理延遲為228 ms/frame,而對比的文本式方法整體快了5 倍到 10 倍左右。

      這意味著,把推理從文本搬到潛空間,并不只是概念上更優雅,而是真的換來了實打實的速度收益。對于強調閉環和實時性的自動駕駛來說,這一點尤其關鍵。

      四、消融實驗最值得記住的幾點

      這篇論文的消融實驗也比較完整,但最值得記住的其實只有四點。

      第一,潛空間推理本身確實有效。只要加入 latent reasoning,模型的軌跡誤差就會下降;再加入 rethink 階段,效果還會進一步提升。這說明「先抓關鍵、再做復核」的認知鏈條不是敘事包裝,而是真正有助于決策質量。

      第二,分層并行規劃器本身也很重要。即便把 reasoning 模塊去掉,作者的 planner 在閉環上依然明顯優于普通 MLP 頭和 diffusion 頭,說明它確實更符合真實駕駛動作的生成邏輯。

      第三,關鍵 token 不是越多越好,而是平衡最好最重要。保留太少會丟信息,保留太多又會引入冗余,論文最終選擇了一個在表達能力和效率之間更均衡的配置。

      第四,最優的軌跡生成方式不是一次性回歸整條軌跡,而是先確定關鍵點,再逐層補齊中間細節,這和駕駛動作本身的因果結構是對得上的。

      五、這篇論文真正有價值的地方是什么?

      如果只把 ColaVLA 看成「又一個自動駕駛模型」,其實低估了它。

      我覺得這篇工作的更大意義在于,它提出了一個非常明確的判斷:

      自動駕駛中的推理,不一定需要顯式寫成文字。

      過去很多工作默認認為,大模型的優勢來自「會解釋」「會說話」「能輸出思維鏈」。但 ColaVLA 給出的答案是:在自動駕駛這種連續控制任務里,更重要的也許不是「讓模型把思考說出來」,而是「讓模型在內部真正想清楚,并用更適合動作生成的方式表達出來」。

      從這個角度看,它代表的是一種很值得重視的范式變化:

      • 從text reasoning轉向latent reasoning
      • 從sequential decoding轉向parallel decoding
      • 從「展示推理過程」轉向「兼顧安全、效率和閉環表現」

      論文最后的結論也很清楚:把推理從文本遷移到潛空間,為自動駕駛中的知識驅動決策提供了一條更可擴展、也更現實的路徑。

      六、總結

      如果要用一句話總結 ColaVLA,我會這樣說:

      它不是讓自動駕駛大模型「更會說」,而是讓它「更會在內部想清楚,再更快地開出來」。

      這篇論文最核心的貢獻,不只是提出了一個新模塊,也不只是刷新了幾項指標,而是它證明了下面幾件事:

      1. 自動駕駛里的推理,可以不依賴顯式文本思維鏈;
      2. 潛空間推理同樣可以保留高層駕駛決策能力;
      3. 分層并行、因果一致的規劃器,更適合真實駕駛動作生成;
      4. 當推理形式和動作生成真正對齊時,系統才能同時獲得更好的安全性、效率和閉環表現。

      對于后續自動駕駛大模型的發展來說,這篇工作很可能代表著一個很值得繼續深入的方向:

      不是把大模型硬塞進自動駕駛,而是重新設計一種真正適合自動駕駛的大模型推理方式。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      驚人的母子定律:原來母親的樣子,直接決定了孩子的一生

      驚人的母子定律:原來母親的樣子,直接決定了孩子的一生

      一口娛樂
      2026-05-11 15:33:57
      賣掉格力換來的416億,被他們“敗”光了!

      賣掉格力換來的416億,被他們“敗”光了!

      犀利強哥
      2026-05-11 08:30:22
      涉嫌受賄271萬余元,謝小強認罪認罰!

      涉嫌受賄271萬余元,謝小強認罪認罰!

      蓬勃新聞
      2026-05-12 22:43:35
      中央第四生態環境保護督察組向廣東省交辦第三批群眾舉報件

      中央第四生態環境保護督察組向廣東省交辦第三批群眾舉報件

      新快報新聞
      2026-05-12 22:24:14
      大陸不同意臺灣參加世衛大會,綠營急了,綠營官員還想到大陸參會

      大陸不同意臺灣參加世衛大會,綠營急了,綠營官員還想到大陸參會

      DS北風
      2026-05-12 17:10:07
      赴京吃國宴前,特朗普打破慣例,對華提出一要求,中方給足他面子

      赴京吃國宴前,特朗普打破慣例,對華提出一要求,中方給足他面子

      二大爺觀世界
      2026-05-12 09:55:12
      卡拉格:切爾西絕對會不惜一切代價把熱刺送到英冠

      卡拉格:切爾西絕對會不惜一切代價把熱刺送到英冠

      懂球帝
      2026-05-12 12:20:06
      印度首富一家集體露面:太太戴1億九寶項鏈,62歲比兩個兒媳都美

      印度首富一家集體露面:太太戴1億九寶項鏈,62歲比兩個兒媳都美

      照見古今
      2026-05-12 15:50:13
      中交三公局董事長被帶走調查

      中交三公局董事長被帶走調查

      地產微資訊
      2026-05-12 14:09:05
      人生贏家!前中超外援成沙特聯賽過人王:在中國沙特凈賺7個億

      人生贏家!前中超外援成沙特聯賽過人王:在中國沙特凈賺7個億

      邱澤云
      2026-05-12 17:19:25
      徐帆澄清離婚僅7個月,馮小剛近況曝光,曾與養女徐朵貼臉惹爭議

      徐帆澄清離婚僅7個月,馮小剛近況曝光,曾與養女徐朵貼臉惹爭議

      黎兜兜
      2026-05-11 21:20:14
      至暗時刻!本田在華月銷僅2.26萬輛

      至暗時刻!本田在華月銷僅2.26萬輛

      新浪財經
      2026-05-12 03:42:26
      不再是120/80,“新血壓標準”已公布,別再自己嚇自己!

      不再是120/80,“新血壓標準”已公布,別再自己嚇自己!

      芹姐說生活
      2026-04-14 23:27:03
      姜至鵬被撤銷隊長!指著球迷大罵,新鵬城致歉:不接受不當行為

      姜至鵬被撤銷隊長!指著球迷大罵,新鵬城致歉:不接受不當行為

      奧拜爾
      2026-05-12 18:53:57
      日本大型電機制造企業尼得科公司被曝大規模造假

      日本大型電機制造企業尼得科公司被曝大規模造假

      澎湃新聞
      2026-05-12 21:33:09
      經濟復蘇的三個標志

      經濟復蘇的三個標志

      生命可以承受之輕
      2026-05-11 09:05:02
      比亞迪固態電池正式首發,純電續航1218km,電車市場要變天了!

      比亞迪固態電池正式首發,純電續航1218km,電車市場要變天了!

      沙雕小琳琳
      2026-05-12 03:23:16
      "就業難我是不承認的,主要是年輕人不肯吃苦",教授出馬一個頂倆

      "就業難我是不承認的,主要是年輕人不肯吃苦",教授出馬一個頂倆

      走讀新生
      2026-05-12 02:01:01
      美總統出訪為何連排泄物都要打包帶回?

      美總統出訪為何連排泄物都要打包帶回?

      觀星賞月
      2026-05-12 02:38:46
      輸北京隊15分!揪出3個“廢柴”,坑慘了廣東隊

      輸北京隊15分!揪出3個“廢柴”,坑慘了廣東隊

      體育哲人
      2026-05-12 23:34:54
      2026-05-13 00:08:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12979文章數 142648關注度
      往期回顧 全部

      科技要聞

      宇樹發布載人變形機甲,定價390萬元起

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

      體育要聞

      騎士終于玩明白了?

      娛樂要聞

      白鹿風波升級!掉粉20萬評論區淪陷

      財經要聞

      利潤再腰斬 京東干外賣后就沒過過好日子

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      手機
      數碼
      親子
      房產
      健康

      手機要聞

      小米18工程機曝光:2nm芯、雙揚、大X軸馬達,終不用妥協了

      數碼要聞

      2000W電源來了!AI工作站供電新選擇

      親子要聞

      dhea什么時候吃最好時間?卵巢早衰做試管成功率高嗎?

      房產要聞

      穗八條引爆樓市!萬博寶藏紅盤,五一勁銷出圈

      干細胞能讓人“返老還童”嗎

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产永久免费高清在线| 国产又黄又湿又色又刺激| 国产裸体xxxx视频| 亚洲精品国产一二三区| 老头老太性髙潮| 免费三级网站| 国产av天堂亚洲国产av麻豆| 2020无码天天喷水天天爽| 大陆极品少妇内射aaaaa| 美日韩精品一区三区二区| 亚洲精品之国产av| 国产a网站| 亚洲激情+五月| 精品无码av一区二区三区| 久久国产伦子伦精品| 欧美交a欧美精品喷水| 少妇性l交大片久久免费| 无码一区二区三区久久精品| 精品一区二区亚洲国产| 国产精品深夜福利免费观看| 漯河市| 欧美有码在线| 99网友自拍视频在线| 国产I熟女l国产.熟女视频| 无码高潮爽到爆的喷水视频app| 免费**毛片在线播放| 中国自由XXX色视频| 97无码视频在线看视频| 男人的天堂av社区在线| 少妇被鸭子服务的全过程| 国产成人91| 免费无码又爽又刺激高潮的视频网站| 亚洲区欧美区中文字幕久久| 国产日韩在线亚洲色视频| 久久99国产精品一区二区| 中日韩高清无专码区2021| 色诱久久| 97色成人综合网站| 看国产黄大片在线观看| 久久婷婷五月综合97色直播| 少妇无码|