網易首頁 > 網易號 > 正文申請入駐

物理AI重塑汽車從感知世界到讀懂世界

2026-05-12 18:33:42　來源: 車質網

北京舉報

分享至

2026年北京車展落下帷幕，當盤點這場全球汽車行業(yè)的年度盛會時，發(fā)現曾經占據頭條的激光雷達數量、芯片算力比拼、續(xù)航里程競賽已經悄然退居二線，一個全新的概念——“物理AI”，成為了幾乎所有頭部車企和智駕方案商共同的關鍵詞。

從華為、Momenta、輕舟智航發(fā)布的新一代智駕系統(tǒng)，到蔚來、小鵬、理想等車企的技術路線更新，再到特斯拉神經網絡世界模擬器的持續(xù)迭代，整個行業(yè)正在經歷一場從“數字AI”到“物理AI”的升級，物理AI也正在成為汽車產業(yè)的共識。

從“自動駕駛”到“物理AI”共識的達成

如果我們把2025年之前視作汽車智能化的上半場——傳感器數量堆疊、算力競賽、端到端架構的百花齊放——那么從2026年開始，一個更“高級”概念正在覆蓋并替代“自動駕駛”這個詞本身。物理AI，簡單來說，是讓機器理解重力、慣性、因果關系等物理規(guī)律，從而真正參與到真實世界的運行之中。

這種轉向的標志性事件是，全球汽車與科技巨頭的行動方向正在高度收束。4月北京國際車展期間，Momenta宣布R7強化學習世界模型實現量產首發(fā)，CEO曹旭東公開表示：“物理AI的核心在于對世界基礎物理規(guī)律的深度認知。”同一時間，小馬智行聯合創(chuàng)始人兼CTO樓天城發(fā)布了世界模型2.0，強調這套系統(tǒng)“并非簡單的仿真環(huán)境生成工具，而是一套完整的強化學習訓練體系”，其核心突破在于“賦予了AI自我診斷與定向進化的能力”。兩個幾乎同期的發(fā)布，指向同一個方向：自動駕駛正從“看見世界”跨入“理解世界”的新階段。

來自國際市場的信號同樣明確。2025年10月的計算機視覺頂級會議ICCV上，特斯拉自動駕駛副總裁Ashok Elluswamy公開了特斯拉FSD的技術路線，明確將端到端AI與基于神經網絡的“世界模擬器”作為主要技術基石。

這個模擬器能夠生成連續(xù)、多視角的駕駛場景，讓AI在一天內學習相當于人類500年的駕駛經驗，大幅降低對真實路測的依賴。值得注意的是，同年6月，Meta發(fā)布了開源世界模型V-JEPA 2，這項擁有12億參數、經100萬小時視頻訓練的技術，明確對標機器人和自動駕駛領域。Meta首席AI科學家楊立昆將這一方向定義為構建“能夠理解現實世界運作邏輯、并能進行推理和規(guī)劃的人工智能系統(tǒng)”，并認為“這直接指向了自動駕駛、智能交通管理、乃至下一代機器人車輛的核心”。

全球巨頭一致的步伐絕非偶然，當自動駕駛從輔助功能走向自主決策，僅僅依靠感知和模仿已遠遠不夠。傳統(tǒng)方案依賴人類標注數據訓練模型“學習別人怎么開”，但道路場景的復雜性可謂是無限的，單靠數據標注完全是天方夜譚。物理AI的解決方案是：讓AI在無數次虛擬推演中可以自主探索“如果我是這個場景中的一員，我該怎么開”——它有能力預測每個動作的物理后果，從而在從未見過的環(huán)境中做出安全的決策。

世界模型與強化學習，雙重引擎推動升級

如果說物理AI的發(fā)展路線已經清晰，那么世界模型和強化學習就是達成這一目標所必需的兩大技術引擎。業(yè)界廣泛認同的判斷是，“世界模型與強化學習的結合，正推動自動駕駛行業(yè)從單純追求‘自動駕駛’功能，向著更深遠地改造物理世界的目標前進”。這個判斷隨著各家的落地提速而越來越具有現實分量。

傳統(tǒng)智駕系統(tǒng)的核心瓶頸在于，它們本質上是基于“識別-匹配-執(zhí)行”的邏輯運行的。系統(tǒng)通過傳感器感知環(huán)境，然后將感知到的信息與數據庫中已有的場景進行匹配，最后執(zhí)行預設的操作。這種模式在處理常見場景時表現尚可，但一旦遇到數據庫中沒有的長尾場景，就很容易出現失誤。輕舟智航CEO于騫表示：“數字世界的AI比如AlphaGo已經無敵了，但物理世界的AI比如自動駕駛還不如人類司機。因為物理世界充滿了不確定性，簡單的背題是永遠背不完的，總會有新題產生。”

世界模型的核心價值在于補齊系統(tǒng)對物理場景的“理解”與“預測”能力。通俗地說，世界模型的作用不是在事故發(fā)生時再讓AI做出反應，而是先在數字空間里把所有場景都推演過一遍。這正是人類駕駛員積累經驗的方式——一個十年駕齡的老司機之所以危險預判能力遠超新手，不僅因為他見過的場景更多，更因為他的大腦中早已形成了對物理世界運行規(guī)律的隱性認知。

在國內，各家在世界模型方面的布局已從概念走向落地。Momenta在R7強化學習世界模型的架構中采用了一種三層設計——先通過海量真實數據預訓練將物理規(guī)律“壓縮”進模型，然后將世界模型用于閉環(huán)仿真，最后在前兩者的基礎上進行強化學習。華為乾崑智駕ADS 5則在云端世界引擎層面走得更加激進——其擴散生成模型能夠在虛擬空間中生成的高密度極限場景，是真實路測的1000倍。更值得關注的是，華為首次在世界模型中引入“多智能體博弈”機制，從而將交通參與者之間互相試探、博弈的動態(tài)關系納入訓練體系。這意味著系統(tǒng)不僅能理解自身的運動，還能預測其他車輛、行人的行為邏輯——這是自動駕駛向“人類級駕駛智慧”邁出的關鍵一步。

強化學習承擔的角色，是人類駕駛行為從“模仿”到“超越”的跳板。過去幾年，行業(yè)主流的技術路線是行為克隆——收集人類駕駛數據，讓AI模仿人類的操作。這種方式的瓶頸顯而易見：AI只能模仿它見過的東西，面對長尾場景無法舉一反三，更遑論超越人類。而強化學習則通過一套獎勵與懲罰機制，讓AI在虛擬世界中反復試錯，最終摸索出一套最優(yōu)策略。正如Momenta CEO曹旭東所言，強化學習讓智能駕駛從“看見世界”升級為“理解世界”。

這種從模仿到強化的轉變正在改變行業(yè)的技術競爭格局。理想、小鵬、蔚來等多家車企和供應商已經在2025至2026年間先后將VLA模型和世界模型推上車端。2025年8月，理想、小鵬、元戎啟行在兩周內先后宣布VLA大模型上車，VLA被業(yè)內視為端到端方案的“智能增強版”——其名稱中的V代表視覺感知，A代表動作執(zhí)行，而中間的L則代表大語言模型，功能是用語言數據訓練模型進行隱式邏輯推理。進入2026年后，智能駕駛的敘事邏輯由此發(fā)生了微妙變化——當行業(yè)還在圍繞“端到端”的數據閉環(huán)與場景覆蓋率進行軍備競賽時，新的引領者已將討論引向物理世界規(guī)律預訓練的維度。

從市場基本面來看，中商產業(yè)研究院數據顯示，2025年中國汽車產銷超過3400萬輛，自動駕駛市場規(guī)模同比增長18.1%，預計2026年滲透率將超過40%。按照其預測，2026年中國自動駕駛市場規(guī)模將達到5293億元。L2+級方案年均復合增長率高達33.7%，而Robotaxi市場的年復合增速更是達到74%。

政策端的推進同樣為技術落地掃清了道路。2025年12月，工信部正式公布我國首批L3級有條件自動駕駛車型準入許可，兩款車型在北京、重慶指定區(qū)域開啟上路試點，標志著中國L3級自動駕駛從測試階段邁入商業(yè)化應用的關鍵一步。隨后，2026年3月落地的L3責任認定國標明確：自動駕駛激活狀態(tài)下的事故由車企承擔，并強制配備“黑匣子”數據記錄系統(tǒng)。責任邊界的清晰化，意味著L3級自動駕駛的商業(yè)化在法律層面獲得了可操作性。

簡單來說，物理AI之所以能夠迅速成為行業(yè)共識，根本原因在于它觸及了一個基本命題：真正的自動駕駛，不可能建立在無窮列舉場景的窮舉法之上，只能依靠對物理世界運行規(guī)律的理解和推演。當然，從藍圖到現實之間仍然有著不容回避的挑戰(zhàn)。物理AI需要海量真實物理數據、高算力芯片、多傳感器融合以及大規(guī)模模型訓練與推理，單車硬件加軟件成本遠超傳統(tǒng)智能輔助駕駛，向售價15萬元以下主流車型的下探仍有難度。

與此同時，系統(tǒng)越復雜、穩(wěn)定性越差——這恰恰也是從輔助到自主的必經陣痛。而物理AI具備自主決策能力所帶來的安全與合規(guī)風險，同樣需要監(jiān)管與企業(yè)共同構建可驗證、可追責的技術與制度框架。但當AI不再只是“看”這個世界，而是開始在數字空間里理解重力、慣性和因果聯系，人類距離那個“車比自己開得更好”的未來，確實又近了一步。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.