![]()
機器之心編輯部
過去十年,AI 卡的是算力;未來十年,物理 AI 卡的是數據。而數據的前提,是仿真。
沒有可規模化的仿真世界,就沒有可規模化的機器人數據;沒有統一的仿真標準,就不會有真正的物理 AI 生態。
仿真,正在成為物理 AI 時代的 CUDA。
CUDA 曾經把 GPU 計算變成 AI 時代的統一底座。今天,仿真正成為物理 AI 時代新的標準層。
物理 AI 的核心瓶頸已經變了
回望過去的技術演進,每個階段都有自己的關鍵瓶頸。
大語言模型時代,這個瓶頸是算力。不論是閉源的 GPT、Claude,還是開源的 Llama、Qwen、DeepSeek,這條賽道的核心命題始終只有一個:如何用更多算力、在更大數據集上跑通 Scaling Law。算力的天花板在哪里,模型能力的邊界就在哪里。
支撐這一輪浪潮的底層基礎設施,正是以 CUDA 為代表的統一計算標準。CUDA 把 GPU 從圖形計算工具變成 AI 時代的通用計算底座,也讓大模型訓練第一次擁有了可規模化調用的計算基礎設施。誰掌握算力入口,誰就擁有時代紅利。
但進入物理 AI 時代,核心瓶頸正在從 “算力” 轉向 “數據”。
過去的大模型,本質上是用互聯網語料學習人類世界;而物理 AI,需要學習真實物理世界。語言模型學習的是文字之間的關系,機器人學習的則是力如何傳遞、接觸如何發生、動作如何實現、世界如何反饋。
這意味著,物理 AI 所需要的數據,不再是互聯網中天然存在的信息,而是必須在 “可交互、可執行、可驗證” 的物理環境中被系統性生成。
![]()
數據的困境,來自機器人學習方式的根本差異。斯坦福教授李飛飛曾在談及機器人智能與傳統機器學習的差異時指出:“把數據帶入機器人訓練,遠比收集圖片困難得多。” 機器人模型要學會抓取、搬運、操作、行走,需要的不是靜態圖像,而是大量覆蓋真實物理交互的高質量行動數據。
這類數據無法像網頁文本一樣從互聯網爬取,也無法通過簡單擴大算力憑空生成。自動駕駛尚有 “影子模式”:幾百萬輛量產車每天在真實道路上行駛,司機的每一個操作都可以成為天然監督信號;機器人并沒有這樣的基礎設施
也正因如此,李飛飛進一步提出,可以用大量仿真數據訓練機器人 “大腦”,再用更少量的真實數據彌合通往現實世界的差距。換句話說,機器人數據不是現成存在的互聯網語料,而必須在可交互、可執行、可驗證的環境中被系統性生產出來;沒有成熟的仿真體系,就沒有規模化的訓練數據,也就沒有具身智能的持續迭代。
除了數據數量,數據質量同樣關鍵。過去談論數據質量,往往聯想到成功完成任務的樣本;但物理 AI 更需要理解失敗—— 物體為什么滑落,動作為什么失穩,接觸為什么偏離預期。只有不斷暴露問題、糾錯反饋,模型才可能從數據中真正獲得學習信號。
因此,數據背后還有一個同等重要卻更隱蔽的瓶頸:評測
大模型時代的評測相對成熟:訓練損失是可靠的優化信號,標準化基準(MMLU、HumanEval 等)能直接反映模型能力進展。但在物理 AI 領域,這套邏輯失效了。訓練損失的下降與實驗室 Demo 的成功,已難以全面反映模型在真實環境中的綜合能力;今天跑通的動作,換一個燈光、換一個物體表面,可能就失效了。
問題的核心在于:機器人的訓練與評測,本質上都需要在符合真實物理規則的環境中反復執行。但真實世界不可無限重置、不可大規模并行,也難以系統性構造失敗場景。沒有統一、可復現、可并行、可量化的評測體系,數據就很難有效指導訓練,模型也無法知道自己在哪里失敗,更無法定向補充數據、提升能力。
因此,仿真不再是輔助工具,而是物理 AI 數據生產與能力評測的前提條件。誰能構建更大、更快、更真實的仿真世界,誰就同時打開了數據生產和能力評測兩道門,也就掌握了通往通用具身智能的鑰匙。
仿真
國際巨頭爭搶的物理 AI 戰略高地
如果說上述判斷還停留在理論層面,那么過去十幾年國際巨頭的一系列動作早已用真金白銀做出了表態。他們通過收購、開源、孵化、自研,不遺余力地要把仿真能力嵌入到自己的機器人技術棧與生態標準中。
NVIDIA 早在 2008 年就收購了當時最主流的物理引擎PhysX,并深度綁定自家 GPU 硬件,將其逐步從游戲物理工具演進為 Omniverse 中的高精度仿真內核,成為 Isaac Sim 等機器人平臺的核心物理基礎設施。
Google DeepMind 在 2021 年收購了MuJoCo—— 此前它已是機器人和強化學習圈的標配工具,成為論文、基準測試、開源代碼的默認選項。由此,Google 順理成章地拿到了整個機器人學術界的工具鏈主導權。
Drake孵化自 MIT CSAIL,后被 Toyota Research Institute(TRI)接管,成為高可信動力學仿真的可擴展底座;Bullet 則隨著創始人的入職而與 Google 生態實現深度綁定。
Disney Research 則走了一條自研路線:孵化出專攻閉鏈機構與極端工況運動求解的仿真引擎Kamino,專攻非標準構型下如何穩定站立和運動,從而解決商業化機器人落地的高頻痛點。
這些舉措并非偶然,而是全球頂級機構在仿真賽道上有意識的戰略卡位。過去行業以為,仿真只是一個工程工具;但今天全球巨頭真正爭奪的,已經不是 “誰的引擎更快”,而是誰能定義世界如何被建模、物理如何被表達、數據如何被生成、能力如何被評測、機器人如何被訓練。
因為誰定義仿真,誰就定義了機器如何理解現實世界。這已經不是工具之爭,而是世界定義權之爭。
問題也隨之出現:這些求解器長期分散在不同體系中,物理表達、資產標準、訓練接口和評測流程彼此割裂。物理 AI 需要的,不是更多單點工具,而是一個能把這些能力整合進同一架構的中樞引擎。
Newton
全球物理 AI 基礎設施第一次走向統一
![]()
Newton應運而生。
這不是一次普通的開源發布,而是全球物理 AI 基礎設施第一次開始走向統一。過去十幾年,GPU 并行計算、高精度接觸動力學、復雜機構求解、強化學習仿真、工業級機器人驗證,始終分散在不同體系中。Newton 第一次嘗試把這些能力放進同一個開放架構中。
它想統一的是物理 AI 的底層世界模型。
2025 年 9 月,NVIDIA、Google DeepMind 與 Disney Research 聯合開源物理仿真引擎 Newton Beta 版。它不是某一家公司的單點開源嘗試,而是三家全球頂級機構投入數百名工程師與研究員、歷時近兩年持續開發,將各自最強的仿真能力放進同一個開放架構中的結果。
NVIDIA 貢獻的是 GPU 原生加速、Warp 框架與 Isaac 生態。過去十幾年,NVIDIA 持續推動 GPU 從圖形計算走向通用計算,再走向 AI 訓練與物理仿真。到了 Newton,這套能力被進一步延伸到機器人學習場景:高并行、可擴展,并可與現代 AI 訓練基礎設施深度結合。
Google DeepMind 帶來的是 MuJoCo 在機器人學習與高精度接觸動力學上的長期積累。MuJoCo 曾是機器人強化學習和控制研究中最重要的仿真工具之一,而 Newton 將這一套高精度動力學能力遷移到 GPU 原生框架中,使其能夠支撐更大規模的并行訓練和評測。
Disney Research 則將 Kamino 等仿真能力納入其中。與標準機器人形態不同,Disney 長期面對的是閉鏈機構、復雜結構、非標準構型與極端工況下的運動控制問題,這使其在復雜機構穩定求解上形成了獨特積累。Newton 將這一路線吸收進統一架構,使機器人仿真不再局限于傳統剛體系統,而是進一步覆蓋復雜機構、柔性材料與多物理交互。
也就是說,Newton 實現了GPU 并行計算、高精度接觸動力學、復雜機構求解與機器人學習生態第一次在同一個開源架構中實現系統性匯合
模塊化架構、GPU 原生加速、自動微分能力與跨生態協作機制,使 Newton 不只是一個物理引擎,更像是面向物理 AI 訓練、評測與部署的統一仿真底座
這些特質,使Newton 從誕生之初就站在了物理 AI 基礎設施的關鍵位置
值得關注的是,在這個由全球頂級機構共同構成的物理 AI 仿真基礎設施版圖中,中國公司第一次出現在核心坐標上
中國公司第一次
進入全球物理 AI 標準定義層
![]()
今年三月,光輪智能正式受邀作為核心指導委員加入開源 GPU 加速物理引擎 Newton,在關鍵具身仿真技術方向上發揮主導作用,并與 NVIDIA、Google DeepMind、Disney Research, 共同引領推動下一代開源物理 AI 仿真標準。
同時加入的還有 Toyota Research Institute (豐田研究院),所帶來的高可信動力學仿真的可擴展軟件底座 Drake,進一步拓展了 Newton 的技術能力。
第一次,中國公司以核心共建者身份進入全球物理 AI 仿真基礎設施標準的定義層:過去二十年,操作系統生態由 Microsoft 與 Apple 定義,移動生態由 Apple 與 Google 定義,AI 訓練框架與計算標準由 NVIDIA 與 Google 等巨頭主導。而今天,物理 AI 的仿真標準終于開始有了中國公司的核心參與。
光輪加入 Newton TSC,是憑借全棧自研的 “求解—測量—生成” 三位一體技術平臺
- 首先,依托自研求解器與物理測量體系,主導 Newton 引擎核心能力的持續演進,包括求解器的物理驗證與系統性標定、接觸建模與多物理場能力優化,以及仿真結果與真實世界一致性的持續提升。
- 其次,圍繞SimReady 體系,推動仿真資產在物理屬性規范、數據格式、接口標準、驗證流程與評測體系等方面的進一步統一,完善下一代仿真世界標準。
- 第三,依托物理測量工廠與資產生成體系,持續提升規模化 SimReady 世界供給能力,構建高保真、可復用的仿真資產與場景庫,為全球開發者提供可直接使用的仿真資源。
求解、測量、生成三者合在一起,構成從物理建模、引擎驗證到工程落地的完整閉環,這使 Newton 不僅能算,而且可驗證、可復用、可規模化進入真實工業流程。
![]()
也正因此,光輪成為 Newton TSC 核心共建格局中唯一一家中國公司。這標志著其在物理 AI 底層技術領域的能力與影響力,獲得了國際生態的正式認可。
事實上,光輪在國際開源生態中的布局遠不止于 Newton。
此前,光輪智能已聯合 NVIDIA 開源發布Isaac Lab-Arena機器人策略評測基準框架,推動具身大模型評測走向可復現、可擴展、可規模化;自研LeIsaac仿真平臺被 Hugging Face 官方文檔收錄,成為全球開發者進入具身仿真的標準工程框架;聯手 World Labs,用RoboFinals解決世界模型評測難題;聯合通義千問,通過RoboFinals共建可復現、可診斷的工業級評測閉環,推動具身智能評測從學術 benchmark 走向工業級基礎設施。
從底層物理引擎,到開發者平臺,再到評測框架與工業級閉環,光輪智能參與的并不是一個個孤立項目,而是一條清晰的生態路徑:底層物理引擎負責 “世界如何運行”,仿真平臺負責 “開發者如何使用”,評測框架負責 “模型如何被衡量”,工業級評測閉環則負責 “能力如何持續迭代”。
這條生態路徑的價值已經在市場中得到驗證。今天,光輪智能已成為全球物理 AI 仿真與數據基礎設施的重要提供方,服務全球全部前五的世界模型團隊;國際主流具身智能團隊中,超過 80% 的仿真資產與合成數據來自光輪
在這條路徑上,光輪智能的角色發生變化:它不只是為頭部模型團隊提供仿真資產與合成數據,更是在引領構建物理 AI 時代的開源基礎設施、開發者平臺與評測標準
中國公司第一次以核心技術共建者的身份,進入全球物理 AI 仿真基礎設施標準形成的關鍵位置。
![]()
全球物理 AI 仿真 Top 5 專家天團
再看 Newton TSC 的人員構成,可謂高手云集。
![]()
- Miles Macklin Ph.D.(NVIDIA)NVIDIA 仿真技術高級工程總監,Warp 框架的聯合創造者。如果說 Newton 的速度優勢有一個技術源頭,就是 Macklin 和他的團隊十幾年來在 GPU 并行物理仿真上的積累。
- Yuval Tassa Ph.D.(Google DeepMind)機器人仿真團隊負責人,MuJoCo 聯合創始人。他解決了 MuJoCo-Warp 的融合問題,讓 MuJoCo 的物理精度在 GPU 上重生。Tassa 代表的是機器人學界最核心的一條高精度仿真路徑。
- 謝晨 Ph.D.(光輪智能)光輪智能創始人兼 CEO,曾任 NVIDIA 及 Cruise 自動駕駛仿真負責人,長期推動仿真與合成數據在自動駕駛和物理 AI 中的產業化落地。國際首創將生成式 AI 融入仿真,主導確立光輪“求解—測量—生成”三位一體全棧自研仿真技術路線。
- Moritz B?cher Ph.D.(Disney Research)Disney Research 負責人。Disney 的主題樂園可能是全球對娛樂機器人要求最苛刻的環境,Kamino 求解器就是在他手下誕生的。
- Michael Sherman Ph.D.(TRI)是機器人仿真基礎設施領域的老兵。作為 TRI 機器人仿真的核心負責人之一,其職業軌跡橫跨 SD/FAST、Simbody、OpenSim、Drake 等多代關鍵仿真平臺。
和這四位全球仿真領域的核心奠基者相比,謝晨博士的獨特之處在于:他不是從單一求解器、單一學術體系或單點工程模塊中走來,而是在自動駕駛與物理 AI 兩代產業浪潮中,持續主導仿真基礎設施的工程化、規模化與系統化落地
他先后在 Cruise 和 NVIDIA 主導自動駕駛仿真體系建設,在 L4 自動駕駛一線驗證了仿真與合成數據對算法迭代的價值,也在全球仿真基礎設施從自動駕駛時代走向物理 AI 時代的承擔了關鍵角色。
在這一過程中,謝晨博士形成了區別于傳統仿真專家的系統性視角:仿真不是一個求解器、一套工具鏈,或一個用于測試的虛擬環境,而是一套貫穿數據生成、模型訓練、能力評測與真實部署的完整教育系統。
自動駕駛時代,仿真主要服務于視覺感知、場景回放與回歸測試;進入機器人與物理 AI 階段,仿真還必須解決接觸、力傳遞、材料形變、動作失敗等真實物理交互問題,并支撐模型在可復現、可規模化的環境中持續學習
2023 年,光輪智能的創立正是要把這一判斷系統化為可落地、可交付、可規模化的全棧仿真基礎設施。光輪所構建的不是單點仿真工具,而是以求解、測量、生成、訓練、評測與部署為核心的完整閉環,繼續引領仿真從 “輔助驗證工具” 走向物理 AI 的核心生產系統。
因此,他加入 Newton TSC,不只是個人入選,而是中國力量首次以核心構建者身份進入全球物理 AI 基礎設施的核心坐標
仿真是物理 AI 時代的 CUDA
過去十年卡算力,未來十年卡數據。而數據的前提,是仿真。
2006 年,NVIDIA 發布 CUDA。在那之前,GPU 仍主要被視為圖形計算工具,普通開發者想調用其并行計算能力,門檻極高。CUDA 把 GPU 的計算能力抽象成一套標準接口,讓開發者可以規模化調用。
CUDA 成功的關鍵,在于它在關鍵窗口期同時完成了三件事:建立統一底層標準,讓碎片化算力可以被統一調用;構建 cuDNN 等一整套工具鏈,把底層算力翻譯成開發者能直接調用的生產力;開放生態,讓這套標準形成跨場景、跨開發者、跨模型訓練流程的普適性。
今天,物理 AI 正處在相似的歷史節點。大模型時代,CUDA 定義的是 “如何調用計算”;物理 AI 時代,仿真要定義的是 “如何生成世界”,因為機器人需要的是更多可交互、可執行、可評測、可遷移的物理世界。因此,仿真正從工具層上升為標準層:它需要定義機器人的訓練場景、世界的表征邏輯、數據生產與結果評測方式……
歷史上,每一次基礎設施標準窗口期關閉之后,后來者都很難再獲得定義權。PC 時代,操作系統生態由 Microsoft 與 Apple 定義;移動時代,應用生態由 Apple 和 Google 定義;大模型時代,訓練框架與計算標準由 CUDA 定義。
而今天,物理 AI 的仿真層,正處于規則尚未凝固的窗口期。誰能定義世界如何被表達,數據如何被生成,能力如何被評測,機器人如何被訓練,誰就有機會定義物理 AI 的未來。
窗口不會永遠打開。
而這一次,中國公司第一次站上了書寫規則的位置。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.