2026年北京車展落下帷幕,當盤點這場全球汽車行業(yè)的年度盛會時,發(fā)現曾經占據頭條的激光雷達數量、芯片算力比拼、續(xù)航里程競賽已經悄然退居二線,一個全新的概念——“物理AI”,成為了幾乎所有頭部車企和智駕方案商共同的關鍵詞。
![]()
從華為、Momenta、輕舟智航發(fā)布的新一代智駕系統(tǒng),到蔚來、小鵬、理想等車企的技術路線更新,再到特斯拉神經網絡世界模擬器的持續(xù)迭代,整個行業(yè)正在經歷一場從“數字AI”到“物理AI”的升級,物理AI也正在成為汽車產業(yè)的共識。
從“自動駕駛”到“物理AI”共識的達成
如果我們把2025年之前視作汽車智能化的上半場——傳感器數量堆疊、算力競賽、端到端架構的百花齊放——那么從2026年開始,一個更“高級”概念正在覆蓋并替代“自動駕駛”這個詞本身。物理AI,簡單來說,是讓機器理解重力、慣性、因果關系等物理規(guī)律,從而真正參與到真實世界的運行之中。
這種轉向的標志性事件是,全球汽車與科技巨頭的行動方向正在高度收束。4月北京國際車展期間,Momenta宣布R7強化學習世界模型實現量產首發(fā),CEO曹旭東公開表示:“物理AI的核心在于對世界基礎物理規(guī)律的深度認知。”同一時間,小馬智行聯合創(chuàng)始人兼CTO樓天城發(fā)布了世界模型2.0,強調這套系統(tǒng)“并非簡單的仿真環(huán)境生成工具,而是一套完整的強化學習訓練體系”,其核心突破在于“賦予了AI自我診斷與定向進化的能力”。兩個幾乎同期的發(fā)布,指向同一個方向:自動駕駛正從“看見世界”跨入“理解世界”的新階段。
![]()
來自國際市場的信號同樣明確。2025年10月的計算機視覺頂級會議ICCV上,特斯拉自動駕駛副總裁Ashok Elluswamy公開了特斯拉FSD的技術路線,明確將端到端AI與基于神經網絡的“世界模擬器”作為主要技術基石。
這個模擬器能夠生成連續(xù)、多視角的駕駛場景,讓AI在一天內學習相當于人類500年的駕駛經驗,大幅降低對真實路測的依賴。值得注意的是,同年6月,Meta發(fā)布了開源世界模型V-JEPA 2,這項擁有12億參數、經100萬小時視頻訓練的技術,明確對標機器人和自動駕駛領域。Meta首席AI科學家楊立昆將這一方向定義為構建“能夠理解現實世界運作邏輯、并能進行推理和規(guī)劃的人工智能系統(tǒng)”,并認為“這直接指向了自動駕駛、智能交通管理、乃至下一代機器人車輛的核心”。
全球巨頭一致的步伐絕非偶然,當自動駕駛從輔助功能走向自主決策,僅僅依靠感知和模仿已遠遠不夠。傳統(tǒng)方案依賴人類標注數據訓練模型“學習別人怎么開”,但道路場景的復雜性可謂是無限的,單靠數據標注完全是天方夜譚。物理AI的解決方案是:讓AI在無數次虛擬推演中可以自主探索“如果我是這個場景中的一員,我該怎么開”——它有能力預測每個動作的物理后果,從而在從未見過的環(huán)境中做出安全的決策。
世界模型與強化學習,雙重引擎推動升級
如果說物理AI的發(fā)展路線已經清晰,那么世界模型和強化學習就是達成這一目標所必需的兩大技術引擎。業(yè)界廣泛認同的判斷是,“世界模型與強化學習的結合,正推動自動駕駛行業(yè)從單純追求‘自動駕駛’功能,向著更深遠地改造物理世界的目標前進”。這個判斷隨著各家的落地提速而越來越具有現實分量。
傳統(tǒng)智駕系統(tǒng)的核心瓶頸在于,它們本質上是基于“識別-匹配-執(zhí)行”的邏輯運行的。系統(tǒng)通過傳感器感知環(huán)境,然后將感知到的信息與數據庫中已有的場景進行匹配,最后執(zhí)行預設的操作。這種模式在處理常見場景時表現尚可,但一旦遇到數據庫中沒有的長尾場景,就很容易出現失誤。輕舟智航CEO于騫表示:“數字世界的AI比如AlphaGo已經無敵了,但物理世界的AI比如自動駕駛還不如人類司機。因為物理世界充滿了不確定性,簡單的背題是永遠背不完的,總會有新題產生。”
![]()
世界模型的核心價值在于補齊系統(tǒng)對物理場景的“理解”與“預測”能力。通俗地說,世界模型的作用不是在事故發(fā)生時再讓AI做出反應,而是先在數字空間里把所有場景都推演過一遍。這正是人類駕駛員積累經驗的方式——一個十年駕齡的老司機之所以危險預判能力遠超新手,不僅因為他見過的場景更多,更因為他的大腦中早已形成了對物理世界運行規(guī)律的隱性認知。
在國內,各家在世界模型方面的布局已從概念走向落地。Momenta在R7強化學習世界模型的架構中采用了一種三層設計——先通過海量真實數據預訓練將物理規(guī)律“壓縮”進模型,然后將世界模型用于閉環(huán)仿真,最后在前兩者的基礎上進行強化學習。華為乾崑智駕ADS 5則在云端世界引擎層面走得更加激進——其擴散生成模型能夠在虛擬空間中生成的高密度極限場景,是真實路測的1000倍。更值得關注的是,華為首次在世界模型中引入“多智能體博弈”機制,從而將交通參與者之間互相試探、博弈的動態(tài)關系納入訓練體系。這意味著系統(tǒng)不僅能理解自身的運動,還能預測其他車輛、行人的行為邏輯——這是自動駕駛向“人類級駕駛智慧”邁出的關鍵一步。
強化學習承擔的角色,是人類駕駛行為從“模仿”到“超越”的跳板。過去幾年,行業(yè)主流的技術路線是行為克隆——收集人類駕駛數據,讓AI模仿人類的操作。這種方式的瓶頸顯而易見:AI只能模仿它見過的東西,面對長尾場景無法舉一反三,更遑論超越人類。而強化學習則通過一套獎勵與懲罰機制,讓AI在虛擬世界中反復試錯,最終摸索出一套最優(yōu)策略。正如Momenta CEO曹旭東所言,強化學習讓智能駕駛從“看見世界”升級為“理解世界”。
這種從模仿到強化的轉變正在改變行業(yè)的技術競爭格局。理想、小鵬、蔚來等多家車企和供應商已經在2025至2026年間先后將VLA模型和世界模型推上車端。2025年8月,理想、小鵬、元戎啟行在兩周內先后宣布VLA大模型上車,VLA被業(yè)內視為端到端方案的“智能增強版”——其名稱中的V代表視覺感知,A代表動作執(zhí)行,而中間的L則代表大語言模型,功能是用語言數據訓練模型進行隱式邏輯推理。進入2026年后,智能駕駛的敘事邏輯由此發(fā)生了微妙變化——當行業(yè)還在圍繞“端到端”的數據閉環(huán)與場景覆蓋率進行軍備競賽時,新的引領者已將討論引向物理世界規(guī)律預訓練的維度。
![]()
從市場基本面來看,中商產業(yè)研究院數據顯示,2025年中國汽車產銷超過3400萬輛,自動駕駛市場規(guī)模同比增長18.1%,預計2026年滲透率將超過40%。按照其預測,2026年中國自動駕駛市場規(guī)模將達到5293億元。L2+級方案年均復合增長率高達33.7%,而Robotaxi市場的年復合增速更是達到74%。
政策端的推進同樣為技術落地掃清了道路。2025年12月,工信部正式公布我國首批L3級有條件自動駕駛車型準入許可,兩款車型在北京、重慶指定區(qū)域開啟上路試點,標志著中國L3級自動駕駛從測試階段邁入商業(yè)化應用的關鍵一步。隨后,2026年3月落地的L3責任認定國標明確:自動駕駛激活狀態(tài)下的事故由車企承擔,并強制配備“黑匣子”數據記錄系統(tǒng)。責任邊界的清晰化,意味著L3級自動駕駛的商業(yè)化在法律層面獲得了可操作性。
簡單來說,物理AI之所以能夠迅速成為行業(yè)共識,根本原因在于它觸及了一個基本命題:真正的自動駕駛,不可能建立在無窮列舉場景的窮舉法之上,只能依靠對物理世界運行規(guī)律的理解和推演。當然,從藍圖到現實之間仍然有著不容回避的挑戰(zhàn)。物理AI需要海量真實物理數據、高算力芯片、多傳感器融合以及大規(guī)模模型訓練與推理,單車硬件加軟件成本遠超傳統(tǒng)智能輔助駕駛,向售價15萬元以下主流車型的下探仍有難度。
與此同時,系統(tǒng)越復雜、穩(wěn)定性越差——這恰恰也是從輔助到自主的必經陣痛。而物理AI具備自主決策能力所帶來的安全與合規(guī)風險,同樣需要監(jiān)管與企業(yè)共同構建可驗證、可追責的技術與制度框架。但當AI不再只是“看”這個世界,而是開始在數字空間里理解重力、慣性和因果聯系,人類距離那個“車比自己開得更好”的未來,確實又近了一步。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.