![]()
撰文 | 青竹 編輯|周長賢
物理AI成了智駕圈最新最統一的「信仰」。
截至目前,野心勃勃、有名有姓的幾家,都跟物理AI綁定。差異只在細節和話術。
特斯拉的World Model探索,華為WEWA2.0賦能乾崑ADS 5.0,小鵬第二代VLA已加入X-World,Momenta的世界模型三層次,卓馭的物理基座大模型……都在以不同節奏向這一方向收斂。
范式名稱各異,話術各有側重,但底層邏輯一致:讓AI真正理解物理世界和規律,而非僅靠數據擬合。
“范式都差不多,差別無非是誰真的在做,誰做得好。”一位智駕負責人表示,未來可能交替領先,但也不過2-3個月身位的差別,可是跑下去,總會有人掉隊。
作為風格務實的智駕方案商,同樣是世界模型+強化學習,輕舟智航有些獨特的思考,值得大家共讀。
例如:
物理AI不能簡單復制LLMs的成功范式。單純堆資源解決不了。
物理AI還需要2-3個大技術突破,世界模型或是其一。
自動駕駛數據的勻質性,被大多數討論忽略。
世界模型在車端和云端同時存在,不是簡單的蒸餾關系。
語言不會被拋棄,將來需要更高層級的語言長/深度思考。
L4運營的關鍵指標:一個人能看多少車。
![]()
2026北京車展上,輕舟物理AI模型發布之后,輕舟智航聯合創始人、董事長兼CEO于騫和輕舟智航CTO李棟接受了群訪,以下為QA精編:
問題:物理AI的發展程度?
于騫:物理AI的大范圍普及,我覺得可能還有兩到三個比較大的技術突破要完成,現在還做不到。不是單純靠技術突破,也不是單純靠堆資源就能解決。
自動駕駛是物理AI最大規模、最快能夠落地的場景。首先數據不成問題,工程化、產品的形態已經比較完整,已經有很多基礎。
問題:兩到三個技術突破是?
于騫:其一很有可能就是世界模型。世界模型加強化學習就可以使物理AI應用非常大地提升。
問題:世界模型范式有何不同?
于騫:大語言模型有很多的數據,幾乎涵蓋人類知識的總結,輸入以后預測下一個Token,是整個最底層的問題表述,當然也有加強化學習。
但物理世界模型,首先要求對物理世界有很強的感知,要理解世界,同時還要能夠理解世界未來怎么變化,然后指導行動,幾件事在一起,不是單點。
不是單純堆資源就能壟斷。
問題:數據處理有何不同?
李棟:語言模型的數據比較勻質,基本上所有的文字都可以轉化成Token。
視覺模型最新的探索,包含機器人的本體數據。像自動駕駛,有非常多本體駕駛數據,非常友好。
但在更廣的領域,本體數據非常稀缺,而且差異化非常大,不同的機器人數據不一樣,自由度不一樣。
還有視頻類的數據,類似YouTube,要用起來都非常挑戰,也是現在比較前沿的研究。
問題:智能駕駛有數據優勢?
李棟:自動駕駛有天然優勢,數據是比較勻質的,量非常大。訓練世界模型,一方面能補充稀缺數據,另一方面,對世界的判斷和理解能力,有通用性。未來去操作有更多自由度的機器人,做特定或通用的事情,有非常廣闊的空間。
問題:智能駕駛的世界模型處于什么階段?
李棟:在自動駕駛領域,處于應用階段,已經做Demo接近量產。包括車上的世界模型,還有云端世界模型,都已經用于生產各種數據做模型訓練。
但在一些高自由度、高復雜度的環境,世界模型還在偏研究階段,很難直接生成比較復雜操作,簡單動作可以,特定動作可以,泛化的動作比較難。
問題:智駕物理AI階段,VLA的作用是?
于騫:VLA可以更好地應用于端側,能更好用到語言和人類的經驗,但并不根本,和世界模型并不矛盾。
問題:VLA能力未來會被拋棄嗎?
李棟:即使模型特別厲害,總得和它交流,交流就涉及到語言。
而且語言模型有個特點,隨著思考加深,能得到更好的通用能力,所以有額外算力的話,語言可以讓整個模型的效果更好。
在應用中,即使在物理世界,語言雖不是最核心的模塊,但不能拋棄。語言的思考能力比較獨特,會給整個系統加分,在一些特殊場景需要這種思考能力。
將來,如果模型對物理世界特別理解,知道物體材質、運動規律、物理體驗之后,可能會發現需要更高層級的語言長/深度思考,更多的需求會出來。
問題:大家的世界模型一樣嗎?
于騫:世界模型,其實有很多不同的理解,會有很多種流派,包括楊立昆和李飛飛都在不斷探索。在學術領域還沒有收斂,更別提在技術、工程落地方面,但是發展很快,我們要以開放的態度看待。
我們是比較務實的一家公司,不是什么新就用什么,我們非常非常克制。
問題:世界模型可以帶智能駕駛走向終局嗎?
于騫:我覺得應該是的,是很重要的技術方向,需要有很大很大突破。但是不是唯一的路,不是做完就完了,還有很多其他的工作要做。
問題:乘風Max這款產品引入了世界模型加強化學習,主要在云端?
于騫:當然車端布置,因為我們不可能在云端跑這種模型,所有安全性的東西必須在車端。
我們的世界模型,把端側、云端一起考慮。并不是簡單的蒸餾關系,模型學到的是物理世界大的分布。我們希望端側學到的是整體分布本身,而不是某個局部。
問題:L2、L3和L4的關系?
于騫:L3肯定有價值,但如果使用范圍非常小,只能在北京四環某一段路上開,那價值不夠。目前邊界/限制范圍太多了。
不管是L2、L4,底層技術高度一致,都是要把車開得更好,只是產品形態不同,L4有L4的產品邏輯,L2有L2的產品邏輯,并不是說靠堆人來解決的。
李棟:底層技術能力越強,擴展新應用邊際成本越低。就什么車都能開,什么場景都能解決,我們也在Robovan上看到這一點。
L4減去L2,就是安全運營,我們關注模型到底能支撐什么運營成本?成本邊際效益是不是足夠低?
問題:L4商業化的關鍵點?
李棟:模型的能力增強,L4的應用范圍、運營效率就會越來越高。,比如說一個人可以看1,000輛車,L4就能非常好運營,這個指標非常關鍵。
今年我們會達到千臺到萬臺車,達到大幾千臺車這樣的運營水平,因為如果水平太差的話,沒法運營起來。
問題:L4車型有什么區別?
于騫:我們的Robotaxi車從外觀上看,根本看不出來這是Robotaxi,就像普通車一樣。
底層的核心能力都是一樣的,算法同源,只是產品形態不一樣。算力更大,實際上是更強大腦,范式是一樣,只是模型能力大一些。
L4要加各種各樣的安全冗余、硬件冗余、傳感器冗余,硬件一定是能量產的,如果不能量產,我們肯定不要。
問題:關于標配和國產化?
于騫:今年一兩百TOPS算力算主流了,明年相信500TOPS算力開始標配。未來幾年所有的車都會智能化,包括油車。
我們不斷革自己的命,500+TOPS算力方案,目標是奔著一兩千TOPS算力的體驗,就是越級的體驗,這就是差異化,是給客戶、消費者帶來的真實價值。
(以上文字經過不改語意的精編)
—THE END—
出行百人會 | AutocarMax
追蹤出行與智能產業鏈進化,關注新產品、新科技、商業邏輯與人物,影響有影響力的人。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.