![]()
撰文 | 青竹 編輯|周長賢
智駕第一梯隊的時間刻度,早已沒有年,只有月。
過去幾個月,他們形成了一個非常整齊的共識:物理AI和世界模型。
這與通用智能的范式思考一致。
去年,Yann LeCun炮轟大語言模型:讀了30萬億token,理解不了一個掉落的杯子,連貓都不如。嘴挺毒。
他直擊LLMs的理解軟肋:預測token,不等于預測世界。
于是,言行一致的LeCun離開Meta,創立 AMI,押注世界模型與物理AI。臨走還貢獻了另一金句,說LLMs已經 “sucking the air out of the room(房間里的空氣已經被LLMs吸干)”。
LeCun不獨行。堅定押注物理AI的李飛飛,今年再次強調:大語言模型無法通往AGI。
一個更徹底的論證,來自token概率學的既得利益者OpenAI 。
3月他們“安樂死”了 Sora ,把釋放的“空氣”轉投“世界模擬”。
回到最卷的智駕產業圈,“物理AI”這個詞匯,已經迅速下沉到產品。
截至2026年車展月,野心勃勃、有名有姓的幾家,都跟物理AI綁定。差異只在細節和話術。
華為的WEWA2.0已經賦能乾崑ADS 5.0,小鵬第二代VLA已加入X-World,切換組織,也切換了智駕負責人……總之在2026年的北京車展,每個館必提世界模型。
“范式都差不多,差別無非是誰真的在做,誰做得好。”一位智駕負責人表示,未來可能交替領先,但也不過2-3個月身位的差別,可是跑下去,總會有人掉隊。
有共識是一種利弊參半的狀態,沒有路線的浪費,意味著競速(參數丨圖片)更焦灼,只能拼能力、拼投入。
![]()
于是,我們看到:4月24日,在北京車展,卓馭科技正式推出面向移動物理 AI 的原生多模態基礎模型,主題定為“智能一切移動”。
雖然技術范式跟其他頭部一致,但這家落地能力很強的公司,在商業模式上,展示了不同思考,做出了新花樣。
新范式:能力涌現,超強泛化,但更殘酷
“主要是反應的效率和能力,非常快,非常流暢。”卓馭一位負責人形容新范式帶給他的驚喜。“曾經根本做不到的,一下就做到了。”
這再次驗證,智能駕駛每一次范式提高,都意味著上限突破。更快、更順滑、更人味兒。
過去,從VLM到VLA,都要先把視覺(V)識別、理解為語言(L),底層推理依然是LLMs的語言token生成式。
所以,不少媒體把物理AI和世界模型的優勢,簡化理解為砍掉了L,從視覺V直接到動作A,所以效率更高。
表象接近如此。還有更本質的區別,以卓馭的多模態基礎模型為例:
1、多模態感知
不只是視覺,包含所有的傳感器和所有形式的數據,語言也在其中。
2、物理AI推理
真正識別和理解移動物理場景,沒有信息損失,基于理解的邏輯推理,而不是語言模型的概率擬合。
3、通用基座
可以理解為一種升維,不止學會開車和認路,而是理解移動和物理世界。
正是基于推理本質的遷移,讓卓馭可以在泛化上大作文章。
過去通用基礎能力不足,代價是,每一次跨地域、跨車型、跨垂類部署,都會帶來效率損失和成本。嚴重依靠在后期打補丁。
而物理基座的強泛化能力,則會帶來商業邏輯的變遷。
![]()
泛化的第一層:跨場景
傳統方案要跑通某個城市,必須單獨“開城”,花大量人力去適配當地的紅綠燈形態、車道線樣式、特殊交通標識,最終勉強做到80分。
而原生多模態基礎模型依托預訓練升維增強,即可實現的Zero-shot零知識遷移,對新城市新場景“開箱即用”。
無需逐城適配,無需大量本地數據喂養。
泛化的第二層:跨垂類
卓馭的一個關鍵差異,在于將同一個基礎模型賦能乘用車、商用重卡、客車、無人物流車。縮短后期驗證周期。
卓馭CEO沈劭劼曾經舉例,家用車和一臺重卡的電架構、轉向響應、制動距離、轉彎半徑完全不同;通勤車在擁堵中走走停停,與重卡不能急剎車的開車模式也不同。靠后期,意味著巨大工作量。
![]()
但基座模型學會的是世界的底層運行規則,“給一個移動體,在三維空間中找到安全的運動軌跡”。而不是某種車型的行為模式。
卓馭的后發Robotaxi,也是這套泛化能力的獲利者,有可能后來居上,省去地圖開城和踩坑。
泛化的第三層:跨國家
卓馭將其定位為智駕出海的技術底座。這為中國智駕出海,提供了“一套模型打天下”的支撐。
從北京的胡同,到曼谷/河內的摩托車洪流,到巴黎紅綠燈復雜的環島,用同一套模型能夠以低泛化成本完成部署。
就像沈劭劼吐槽的,“在國外弄 30 個人采一年數據重新訓練一遍,當然能解決,但這是有代價的。全球各個國家都來一遍?這個成本有點受不了。”
但要想做到開箱95分,不只是從語言到物理的范式轉移,還有「大模型」的終難幸免,
「大模型」階段的商業重寫
從規則和地圖時代的小模型,到端到端的中模型,智能駕駛終于還是卷入了大模型時代。
“中模型本身并不能自動泛化到完全沒覆蓋過的場景。”
“原生多模態大模型的核心理念在于,首先,模型足夠大,大到數據足夠多的情況下,能具備涌現能力。”
與沈劭劼這句話類似的表達,何小鵬說,智駕未來會有一個iPhone 4時刻。
![]()
一方面,大模型是多模態、多垂類、多場景的命題式需求;另一方面,也是頭部不想被卷死的必然選擇。
中國智駕如果想跟手握xAI、特斯拉、Optimus的馬斯克同桌競技,還有其他選擇嗎?
所以,華為在不斷地下蛋「界」和「境」;小鵬汽車必須做具身和飛行汽車。
卓馭把盤子做大的方式:跨垂類+出海+移動一切。今年內,原生多模態基礎模型將推送至乘用車與商用重卡,并作為卓馭智能駕駛出海的基礎模型。
卓馭的實踐證明,同一套高悟性端到端4.0模型和激目2.0系統,可以同時在乘用車和商用重卡上復用,并且即將在宇通客車上量產。
這種復用能力帶來的商業價值是巨大的,重構了智能移動能力的邊際成本曲線,用盡量多的復用,來攤薄基座大模型的固定成本。
![]()
卓馭在乘用車領域已經累計量產超過五十款車型,定點車型達到三位數,覆蓋油車與電車、自主與合資品牌。與中國TOP6重卡品牌、宇通客車以及多家乘用車客戶建立了合作關系。
一套模型吃透全場景,從口號變成了可計算的商業優勢。
值得關注的差異化是,更加多樣性、多模態、多場景的數據效應。
重卡的高速長途場景、客車的固定路線場景、無人物流車的末端配送場景,這些異構數據會源源不斷匯入預訓練模型,進一步提升模型對物理世界的理解深度。
而從「移動一切」的角度,卓馭科技的后裝車載無人機作為“空中載體”,未來完全有可能成為基礎模型的延伸,讓物理AI能力覆蓋“從陸地到天空”。
屆時,無人機實時回傳的航拍視覺,與掃描路面的3D模型,也可以與車載感知系統融合閉環。
結語
物理基座大模型賦能「移動的一切」的商業邏輯,對應著卓馭科技的宏大愿景:“成為物理 AI 時代的重要基礎設施。”
站在物理AI的十字路,面對智能新基建的時代機遇,未來也許就像沈劭劼所說:存活下來的智駕公司,最終都將轉型為移動物理AI公司。
他說,“這并不是一個戰略判斷,而是一個生存判斷。”
—THE END—
出行百人會 | AutocarMax
追蹤出行與智能產業鏈進化,關注新產品、新科技、商業邏輯與人物,影響有影響力的人。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.