日前
廣州智駕企業小馬智行
正式發布其在物理AI領域的
最新技術成果——
PonyWorld世界模型2.0
![]()
小馬智行 圖源:廣州科技創新
消息一出,再次勾起了人們
對物理AI的關注
它到底是什么?
和我們常說的AI有什么區別?
除了小馬智行
廣州又有哪些企業
對其進行了布局?
今天,跟你聊個明白
![]()
什么是物理AI
大多數時候,我們談論的AI,無論是能寫詩作畫的ChatGPT,還是去年風靡全網的DeepSeek,都是大語言模型,其核心是“從文本中學習世界的知識”,它通過學習互聯網上海量的文本數據,學會了語言的規律、人類的知識,能生成流暢的文字、回答各種問題、完成文本類的任務。然而,它的所有知識,都來自于人類社會數千年的歷史經驗,它對現實世界的重力、摩擦力與空間感一無所知。
如果將它們植入一個機械智能體,它能跟你上聊天文下聊地理,情緒價值拉滿,但如果讓它為你煎一個雞蛋,對不起,超出能力范圍了。
而物理AI(Physical AI),則是能沖破數字桎梏,與現實進行交互的大模型。目前,它的主流技術路徑有兩個:
1??VLA——看得懂,做得出
VLA全稱Vision-Language-Action Model(視覺—語言—動作模型),核心功能是接收圖像/視頻、自然語言指令,直接輸出智能體(如機器人)可執行的動作序列,實現“感知—理解—執行”。
2??世界模型——先預判,再決策
世界模型是智能體構建的內部預測系統,核心是基于歷史環境狀態與動作輸入,預判環境未來的演化趨勢,進而幫助智能體優化決策路徑。其本質是復刻生物對世界的預判本能,融合神經網絡、強化學習等技術,構建對物理世界的動態表征。
![]()
物理AI的廣州探索
不難看出
物理AI與智能駕駛、具身智能
簡直就是天作之合
小馬智行
本次發布的
PonyWorld世界模型2.0
正是該公司在物理AI領域
的最新技術成果
小馬智行搭建的世界模型,可以理解為建在云端的“虛擬駕校”,AI在“虛擬駕校”中反復開車、預設各種突發狀況,訓練駕駛能力。
![]()
小馬智行搭建的世界模型 圖源:廣州科技創新
與1.0相比,2.0實現了超級進化:
自我診斷能力:
AI知道自己“哪里不行”
PonyWorld2.0結合小馬智行車端模型的Intention(意圖)語義層,實現了對每一次駕駛決策的自動化回溯與歸因分析。系統能夠自動區分問題根源,并將診斷結果精準反饋至模型訓練流程。
定向進化能力:
從“廣撒網”到“精準補短板”
基于自我診斷結果,PonyWorld2.0能夠自動識別世界模型精度不足的具體場景,并主動生成定向數據采集任務。例如,系統可自動推送指令:“請于特定時段在指定路口重點采集逆光條件下非機動車與行人混行場景數據。”研發與測試團隊由此圍繞世界模型的“精度需求”高效協作,實現AI引導下的定向數據采集與模型迭代。
訓練效率躍升:
專練“難題”,跳過“送分題”
PonyWorld2.0可根據車端模型的薄弱環節,在世界模型中自動生成針對性訓練場景,大幅減少無效訓練數據的存儲與計算開銷,顯著提升每一輪迭代的效率和效果。
而廣州的另一家
自動駕駛科技公司
文遠知行
也采取了相似的技術路徑
今年1月,文遠知行發布自研通用仿真模型——WeRide GENESIS,構建起物理AI與生成AI之間的融合橋梁。
仿真模型在數字世界中高精度還原真實世界的駕駛環境,讓自動駕駛車輛在虛擬城市中“直接上路”。通過仿真的方式,AI司機能夠經歷海量多樣的道路、天氣與交通場景,練習應對緊急情況或罕見事件的能力。
![]()
WeRide GENESIS可根據實景自動生成對應點云數據,從而創建仿真世界 圖源:廣州科技創新
值得一提的是,針對真實反映客觀世界中復雜且難以預測的交互行為,WeRide GENESIS內建了“AI主體”模塊,致力于為每一位交通參與者構建智能行為模型,使其能夠模擬從日常駕駛到高風險行為的全譜系反應。
例如,它可以模擬在路口猶豫不決最終又突然加速搶行的駕駛員,或者在車縫中穿梭的外賣騎手。這種對客體不確定性交互的模擬,對自動駕駛系統提升在實際復雜交通流中應變能力極為重要。
WeRide GENESIS同樣具備“AI診斷”功能。它能夠自動捕捉急剎車造成乘客舒適度降低、遇到復雜路況識別感知延遲或預測偏差等不理想的駕駛行為,分析其根本原因并提供可執行的改進方案。
說到擁抱物理AI
廣州還有一家標桿企業——
小鵬集團
近日,小鵬集團發布《2025年環境、社會及管治報告》。《報告》中明確,集團將于2026年實現Robotaxi、人形機器人、飛行汽車三大物理AI應用的量產。這三大應用,其核心大模型都是小鵬的VLA2.0。
如果說傳統智駕系統是“按腳本開車”,小鵬VLA2.0則實現了“像人一樣思考開車”,其摒棄傳統的規則驅動模式,以物理AI大模型理解路況,實現從“特征匹配”到“物理邏輯推理”的跨越。
這種技術架構帶來的直觀改變,是智駕系統終于能應對現實中的突發狀況。
例如,導航未及時更新施工導致封路的狀態時,系統14秒內自主推理多條路徑的可行性并選擇最優解;
路邊車輛車門微開時,提前捕捉意圖并預留避讓空間,實現從容繞行;
夜間及雨雪環境下,攝像頭感知力超人眼,模型決策幾乎不受影響,可輕松避讓深色衣物行人和小動物。
此外,無地圖支持下,系統也能通過理解物理環境自主規劃路徑,即便在鄉村土路、無導航園區等人車混行場景,也能平穩通行。
![]()
小鵬VLA 2.0能識別到路邊車輛突然打開車門并預留避讓空間。 圖源:廣州科技創新
小鵬的另一款拳頭產品人形機器人IRON,通過搭載物理AI大模型,融合了視覺、語言與行動能力,使其能夠執行對話、行走和復雜交互等任務。目前,小鵬已與寶鋼達成合作,計劃今年入駐鋼鐵廠負責高溫管道巡檢,替代人類進入危險作業區。
![]()
人形機器人IRON 圖源:廣州科技創新
![]()
廣州為物理AI應用落地
筑牢生態底座
2026年,被科技界視為“物理AI元年”。以小馬智行、文遠知行、小鵬集團為代表的廣州科技企業站在了時代的風口。
物理AI的核心價值,在于打破了“數字AI”與“現實世界”的壁壘——它不再是停留在屏幕里的算法,而是能走進工廠、道路、社區,真正解決實際問題的“實干家”。
對于廣州而言,這些企業所取得的突破,不僅彰顯了城市在智能網聯汽車、機器人等前沿領域的技術積淀,更勾勒出物理AI落地的清晰路徑,讓“AI+實體經濟”不再是空談。
除了頭部企業的引領,廣州的產業生態也在為物理AI的發展保駕護航——廣州擁有完整的產業鏈布局,從芯片、傳感器等核心零部件,到整車制造、場景測試,再到算法研發、數據服務,已形成了閉環式產業生態。
同時,廣州持續出臺系列政策支持前沿技術創新,設立智能網聯汽車與自動駕駛產業專項資金,搭建測試驗證平臺,為企業提供場景試點、人才扶持等全方位保障,讓物理AI技術有了“落地生根”的土壤。
相信在不久的將來
我們就能看到自動駕駛汽車
穿梭在城市的每一條街道
人形機器人為我們提供家庭服務
飛行汽車解決出行擁堵
而這一切
都離不開今天廣州
在物理AI領域的每一步深耕
參考來源
廣州科技創新《物理AI是什么?廣州企業正在訓練另一種“大腦”》
https://mp.weixin.qq.com/s/TO2Umw6wCDcE47XijX2kDQ
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.