人工智能的底層邏輯正從大語言模型的“語言理解”轉(zhuǎn)向世界模型的“預(yù)測世界”。在這一躍遷中,物理數(shù)據(jù)的質(zhì)量與采集能力成為發(fā)展核心。作為解決世界模型與具身智能“數(shù)據(jù)燃料”問題的關(guān)鍵,具身數(shù)據(jù)采集正開啟下一代數(shù)據(jù)基建浪潮。
國泰海通最新報(bào)告指出,具身智能發(fā)展的最大障礙已不再是算法,而是數(shù)據(jù)缺口。其對數(shù)據(jù)的需求量呈指數(shù)級膨脹,遠(yuǎn)超傳統(tǒng)AI模型。在這一背景下,能夠率先填補(bǔ)數(shù)據(jù)缺口的數(shù)據(jù)供應(yīng)商與基礎(chǔ)設(shè)施商,將作為物理AI時(shí)代的“賣鏟人”,占據(jù)產(chǎn)業(yè)鏈核心價(jià)值節(jié)點(diǎn),有望享受顯著的估值溢價(jià)。
技術(shù)路線上,真實(shí)數(shù)據(jù)、仿真/合成數(shù)據(jù)、視頻數(shù)據(jù)各有利弊:純真實(shí)數(shù)據(jù)成本過高,純仿真數(shù)據(jù)存在“Sim2Real”(仿真到現(xiàn)實(shí))鴻溝。未來主流路徑逐漸清晰:仿真/視頻數(shù)據(jù)用于大規(guī)模預(yù)訓(xùn)練 + 真實(shí)數(shù)據(jù)用于微調(diào)與強(qiáng)化學(xué)習(xí)。
隨著主流技術(shù)路線日漸清晰,資本正加速涌入數(shù)據(jù)采集工具鏈(動捕、遙操作)、視頻數(shù)據(jù)升維平臺及仿真訓(xùn)練場——這些數(shù)據(jù)采集基礎(chǔ)設(shè)施,正成為機(jī)器人產(chǎn)業(yè)真正的風(fēng)口與“鏟子”生意。
范式轉(zhuǎn)移:世界模型重塑AI基石,數(shù)據(jù)需求膨脹至EB級
AI正從“數(shù)據(jù)相關(guān)性”驅(qū)動轉(zhuǎn)向“物理因果性”驅(qū)動,2025年已成為世界模型應(yīng)用落地的元年。具身智能對數(shù)據(jù)的需求量及復(fù)雜度正呈指數(shù)級爆發(fā)。
傳統(tǒng)神經(jīng)網(wǎng)絡(luò)與大語言模型本質(zhì)上依賴模式識別與概率關(guān)聯(lián),而“世界模型”的核心在于內(nèi)建物理規(guī)律(如重力、慣性),并具備預(yù)測時(shí)空演化的能力。自2025年起,該領(lǐng)域迎來集中突破:Meta的V-JEPA 2、谷歌的Genie、OpenAI的Sora以及World Labs的RTFM相繼問世。
![]()
世界模型將賦能游戲、自動駕駛與具身智能三大核心場景。其中,具身智能的爆發(fā)對數(shù)據(jù)提出了前所未有的苛刻要求。與大語言模型及自動駕駛(PB級數(shù)據(jù)量、以文本或視覺為主)不同,具身智能需適應(yīng)形態(tài)各異的硬件平臺,數(shù)據(jù)需求高達(dá)EB級,且極度強(qiáng)調(diào)物理交互(力覺、觸覺、關(guān)節(jié)反饋)。目前行業(yè)仍處早期階段,預(yù)訓(xùn)練數(shù)據(jù)極度緊缺,“數(shù)據(jù)孤島”與異構(gòu)數(shù)據(jù)融合難題已成為制約產(chǎn)業(yè)爆發(fā)的核心瓶頸。
![]()
![]()
三大主流數(shù)據(jù)采集方案利弊共存,視頻數(shù)據(jù)成為業(yè)內(nèi)關(guān)注新焦點(diǎn)
構(gòu)建高效的數(shù)據(jù)閉環(huán),是具身智能能力躍升的核心。當(dāng)前,資本與技術(shù)主要圍繞三大數(shù)據(jù)采集方案展開:
真實(shí)數(shù)據(jù)(高保真但極度昂貴):通過遙操作、穿戴式動捕等方式直接采集。優(yōu)勢在于不存在Sim2Real差距;致命短板是成本高、擴(kuò)展性差,難以覆蓋長尾邊緣場景。
![]()
合成/仿真數(shù)據(jù)(高性價(jià)比但存在遷移鴻溝):利用物理引擎在虛擬環(huán)境中生成。成本極低且自帶完美標(biāo)簽,但面臨顯著的“Sim2Real Gap”(動力學(xué)、感知、控制等差異),導(dǎo)致模型在真實(shí)環(huán)境中性能衰減。
![]()
視頻數(shù)據(jù)(來源廣但直接應(yīng)用難):業(yè)內(nèi)新興焦點(diǎn),通過升維技術(shù)利用海量互聯(lián)網(wǎng)視頻。成本低、規(guī)模大,但缺乏物理交互屬性(如重力、摩擦力),噪聲大且缺少精確的三維標(biāo)注。
![]()
產(chǎn)業(yè)演進(jìn)趨勢:Generalist AI的GEN-0模型(≥7B參數(shù))已證明,在海量真實(shí)交互數(shù)據(jù)下,模型性能呈冪律增長。在真實(shí)數(shù)據(jù)成本被徹底打下來之前,“仿真/視頻數(shù)據(jù)預(yù)訓(xùn)練 + 真實(shí)數(shù)據(jù)微調(diào)/強(qiáng)化學(xué)習(xí)”的虛實(shí)結(jié)合方案將是絕對主流。
與此同時(shí),底層數(shù)據(jù)基建正在國家力量與開源生態(tài)的推動下加速成型:上海落地了全國首個(gè)具身智能領(lǐng)域國家級標(biāo)準(zhǔn)化試點(diǎn)(“1+N”模式訓(xùn)練場),北京建立了首個(gè)基于真實(shí)場景的數(shù)據(jù)訓(xùn)練基地。谷歌、星海圖、傅利葉、智元等紛紛發(fā)布開源數(shù)據(jù)集,中國信通院則牽頭制定了國內(nèi)首個(gè)具身智能數(shù)據(jù)集質(zhì)量評價(jià)標(biāo)準(zhǔn)。
![]()
機(jī)器人本體廠商的“數(shù)據(jù)站隊(duì)”與戰(zhàn)略分化
正是由于真實(shí)數(shù)據(jù)成本高、仿真數(shù)據(jù)存在遷移鴻溝、視頻數(shù)據(jù)噪聲大,國內(nèi)外主流機(jī)器人本體廠商在數(shù)據(jù)路線上出現(xiàn)了明顯分化。這一分化,反過來為數(shù)據(jù)采集基建的方向提供了最直接的產(chǎn)業(yè)驗(yàn)證。
真實(shí)數(shù)據(jù)優(yōu)先派:認(rèn)為只有真實(shí)交互才能跨越Sim2Real鴻溝。智元機(jī)器人在大模型訓(xùn)練階段100%使用真機(jī)真實(shí)數(shù)據(jù),仿真僅用于工程迭代;自變量機(jī)器人在復(fù)雜物理交互場景中完全不使用仿真數(shù)據(jù);1X Technologies同樣將“大規(guī)模真實(shí)世界數(shù)據(jù)”作為核心壁壘。
![]()
![]()
合成與仿真數(shù)據(jù)優(yōu)先派:押注成本與規(guī)模。銀河通用采用99%的合成數(shù)據(jù)配以1%的真實(shí)數(shù)據(jù)進(jìn)行訓(xùn)練,試圖以極低成本逼近真實(shí)分布。
![]()
視頻數(shù)據(jù)戰(zhàn)略高地:特斯拉、Figure AI等巨頭正加速布局,核心邏輯在于互聯(lián)網(wǎng)視頻規(guī)模遠(yuǎn)超任何單一機(jī)器人平臺能采集的真實(shí)數(shù)據(jù)。特斯拉Optimus已放棄早期動捕與遙操作,轉(zhuǎn)向深挖互聯(lián)網(wǎng)視頻;千尋智能Spirit v1的70%預(yù)訓(xùn)練來自互聯(lián)網(wǎng)視頻;Figure AI啟動Project Go-Big,探索人類視頻到機(jī)器人的零樣本遷移;星動紀(jì)元、逐際動力則分別采用“視頻預(yù)訓(xùn)練+真機(jī)微調(diào)”及多源數(shù)據(jù)組合策略。
![]()
![]()
這三條路線的并存恰恰說明:當(dāng)前尚無單一數(shù)據(jù)來源能獨(dú)立解決具身智能的數(shù)據(jù)瓶頸。無論最終哪條路線收斂,數(shù)據(jù)采集工具鏈、仿真平臺與視頻升維技術(shù)——即物理AI時(shí)代的“賣鏟人”——都將是確定性受益的方向。
數(shù)據(jù)“賣鏟人”全景圖
隨著具身智能對數(shù)據(jù)的需求量級與復(fù)雜度指數(shù)級上升,能夠有效解決數(shù)據(jù)獲取成本與效率問題的供應(yīng)商,正迎來一輪估值重估。這一重估覆蓋四個(gè)關(guān)鍵方向:視頻數(shù)據(jù)轉(zhuǎn)化、仿真平臺、多模態(tài)硬件采集,以及綜合數(shù)據(jù)服務(wù)。
視頻數(shù)據(jù)轉(zhuǎn)化方向:核心突破在于將海量互聯(lián)網(wǎng)視頻低成本轉(zhuǎn)化為機(jī)器人可用的訓(xùn)練數(shù)據(jù),部分方案已能將綜合采集成本降至行業(yè)平均水平的千分之五以下。
仿真平臺方向:全鏈路合成數(shù)據(jù)體系以極低成本生成帶完美標(biāo)注的大規(guī)模虛擬數(shù)據(jù),并逐步縮小Sim2Real差距。
真實(shí)數(shù)據(jù)采集硬件方向:光慣融合手套、電子皮膚等傳感器結(jié)合高質(zhì)量開源數(shù)據(jù)集,正在構(gòu)建高保真底座。
真實(shí)數(shù)據(jù)生態(tài)與遙操作方向:大規(guī)模自建采集場景與高精度遙操作設(shè)備,已成為主流微調(diào)數(shù)據(jù)的重要來源。
在二級市場視角下,綜合性數(shù)據(jù)服務(wù)商通過多元方案(遙操作、動捕、合成數(shù)據(jù))建設(shè)具身智能數(shù)據(jù)訓(xùn)練場與工程化平臺;仿真平臺公司則通過收購整合打通虛實(shí)數(shù)據(jù)壁壘,提供全生命周期物理AI解決方案。
整體來看,無論是視頻轉(zhuǎn)化、仿真生成、硬件采集還是綜合服務(wù),能夠顯著提升數(shù)據(jù)“可獲得性”與“成本效率”的供應(yīng)商,正在從產(chǎn)業(yè)邊緣走向估值中樞。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.