![]()
本報(chinatimes.net.cn)記者黃海婷 胡夢深 深圳攝影報道
5月7日,距離深圳一家具身智能企業(yè)宣布的“首批機器人進家庭”節(jié)點,還有18天。
在此之前,首屆廣東省人工智能應(yīng)用對接大會剛剛落幕,華為昇騰、騰訊混元等AI成果集中亮相。而更早一周,該企業(yè)發(fā)布了全球首個基于世界統(tǒng)一模型架構(gòu)(WUM)的具身智能大模型,并宣布其新一代機器人將于5月25日正式入戶。
家庭場景,被業(yè)內(nèi)稱為具身智能的“終極考場”。這一考題的啟動時間已從行業(yè)普遍預(yù)期的5至10年,驟然壓縮至“當月”。這究竟是一家企業(yè)的技術(shù)突圍,還是整個產(chǎn)業(yè)鏈系統(tǒng)性優(yōu)勢的集中釋放?
“這不是偶然事件,而是技術(shù)成熟度、產(chǎn)業(yè)配套與市場需求三重共振的必然結(jié)果。”國研新經(jīng)濟研究院創(chuàng)始院長、智能經(jīng)濟首席專家朱克力對《華夏時報》記者表示,這是產(chǎn)業(yè)拐點的標志性事件,是中國硬科技從跟跑到并跑、部分領(lǐng)跑的縮影。
就在不久前,國家電網(wǎng)印發(fā)《2026年具身智能發(fā)展規(guī)劃》,計劃今年集中采購各類具身智能設(shè)備約8500臺,總投資約68億元。若計入南方電網(wǎng)及地方能源集團跟進采購,業(yè)內(nèi)預(yù)計2026年電力行業(yè)具身智能總投資規(guī)模有望突破100億元。產(chǎn)業(yè)需求端的信號已明確亮起。
家庭場景為何是最大瓶頸?
具身智能進家庭,第一個攔路虎并非算法,而是數(shù)據(jù)。
“當前行業(yè)已逐漸擺脫‘缺數(shù)據(jù)’的處境,但進入了‘缺好數(shù)據(jù)’的階段。”深圳市人工智能與機器人研究院研究員、極數(shù)迭代CTO夏軒向《華夏時報》記者指出了核心癥結(jié)。他解釋,這源自三個底層瓶頸:數(shù)據(jù)維度上,需要專業(yè)、長時間、多場景的“縱向數(shù)據(jù)”,而當前多為非專業(yè)、短時間、單任務(wù)的“橫向切片”;隱私約束上,家庭數(shù)據(jù)無法像互聯(lián)網(wǎng)數(shù)據(jù)那樣大規(guī)模匯聚;評估標準上,缺乏針對家庭服務(wù)機器人的評測基準,學術(shù)界仍在用工廠指標衡量家庭場景。
如何破解這一困局?深圳南山的產(chǎn)業(yè)鏈密度提供了獨特解法。
夏軒用“密、快、狠”三個字概括了南山生態(tài)的優(yōu)勢,并強調(diào)這解決的是數(shù)據(jù)“誰來采、怎么采、采完怎么用”的全鏈條問題。“誰來采”——產(chǎn)業(yè)鏈密度大幅降低了試錯成本,多家機器人企業(yè)與科研機構(gòu)集中在半小時車程內(nèi),“一個數(shù)據(jù)采集需求,從提出到驗證,兩天就能跑通”。這種密度讓“小步快跑”成為可能,而數(shù)據(jù)工程最忌諱的恰恰是“大步慢走”。
“怎么采”——硬件供應(yīng)鏈支撐多樣化采集方案。從相機模組、電機到深度傳感器,上游企業(yè)的集聚讓采集設(shè)備的定制成本大幅下降。“采完怎么用”——算力與大模型的協(xié)同。華為昇騰、騰訊混元提供底層算力,采集的數(shù)據(jù)可以就近上云、就近訓(xùn)練、就近部署。“這種地理上的壓縮,本質(zhì)上是迭代周期的壓縮。”夏軒說。
然而,生態(tài)優(yōu)勢并不能自動轉(zhuǎn)化為數(shù)據(jù)優(yōu)勢。夏軒也提醒:“深圳有好的‘工具’,但家庭場景的數(shù)據(jù)‘原料’依然稀缺。工廠可以開放產(chǎn)線,商場可以開放展廳,但家庭是私人空間,數(shù)據(jù)獲取的門檻不在技術(shù),而在信任與制度。”這正是家庭機器人入戶需要跨越的關(guān)鍵坎。
模型“兩難”之辯
如果說數(shù)據(jù)是燃料,那么模型就是引擎。此次引發(fā)行業(yè)關(guān)注的WUM架構(gòu),核心是從VLA(視覺-語言-動作)架構(gòu)向世界統(tǒng)一模型的跨越。這一轉(zhuǎn)變,折射出整個行業(yè)對“物理理解能力”的迫切需求。
夏軒將“跑酷”(預(yù)設(shè)軌跡)與“干活”(真實適應(yīng))之間的差距,概括為三個鴻溝:確定性、泛化性、容錯性。“跑酷是開環(huán)控制,摔了重來。干活是閉環(huán)適應(yīng)——環(huán)境在變、物體在動、人在干擾,每一步都要調(diào)整。這要求機器人具備世界模型,即對物理因果的理解能力。”
WUM架構(gòu)的數(shù)據(jù)效率優(yōu)勢正體現(xiàn)在這幾個維度:強物理先驗讓世界模型能用更少的數(shù)據(jù)學習技能;自監(jiān)督學習降低了標注要求;家庭場景的長尾問題可通過世界模型的“想象”生成,而非逐一采集。
但理論的先進性與工程的可落地性之間,存在顯著落差。夏軒坦承:“算力門檻上,世界模型需要更大的參數(shù)量、更長的訓(xùn)練時間;評估方面,VLA可用‘成功率’衡量,但WUM的‘世界理解能力’如何量化,目前缺乏行業(yè)標準;故障模式上,VLA失敗了你知道是動作錯了,但WUM失敗了,可能是模型預(yù)測錯了,也可能是執(zhí)行器偏差,調(diào)試復(fù)雜度指數(shù)級上升。”
盡管挑戰(zhàn)重重,夏軒仍對WUM方向給出審慎樂觀的判斷:“世界模型是正確方向。”但他強調(diào),批量進家庭能夠積累真實數(shù)據(jù),更快跑通優(yōu)化閉環(huán)。這折射出整個行業(yè)的共性命題:18天后的入戶,不是成熟產(chǎn)品的亮相,而是一場真實環(huán)境下的“極限測試”。
廣東憑什么領(lǐng)跑?
具身智能企業(yè)為何密集出現(xiàn)在深圳、東莞、廣州一帶?答案藏在廣東的“半小時供應(yīng)鏈”和長期產(chǎn)業(yè)布局中。
朱克力指出,南山設(shè)計“大腦”、珠三角制造硬件、家庭場景閉環(huán)驗證數(shù)據(jù),上下游不再是簡單買賣關(guān)系,而是深度綁定的共創(chuàng)關(guān)系,實現(xiàn)了創(chuàng)意快速落地、技術(shù)快速迭代、產(chǎn)品快速優(yōu)化。這種協(xié)同創(chuàng)新讓廣東在具身智能領(lǐng)域形成了獨特競爭力。
但他也毫不回避地指出了行業(yè)共性的卡點:“核心零部件的自主可控仍需加強,部分高端傳感器、精密減速器等仍有短板;基礎(chǔ)軟件與算法的原始創(chuàng)新能力有待提升;數(shù)據(jù)治理與安全合規(guī)體系尚不完善;高端人才供給仍有缺口。”這些短板,是整個中國具身智能產(chǎn)業(yè)在邁向大規(guī)模家庭落地前必須正視的“軟肋”。
值得關(guān)注的是,此次WUM模型的發(fā)布,恰好踩在《廣東省人工智能行動方案》出臺之后。朱克力認為,這是政策牽引、企業(yè)主導(dǎo)、生態(tài)支撐協(xié)同發(fā)力的必然結(jié)果。“三者同向而行、同頻共振,形成‘政策引導(dǎo)產(chǎn)業(yè)、產(chǎn)業(yè)孕育企業(yè)、企業(yè)突破反哺生態(tài)’的良性循環(huán)。”
從產(chǎn)業(yè)規(guī)模看,這一賽道的想象空間正在被數(shù)據(jù)驗證。據(jù)行業(yè)預(yù)測,中國具身智能產(chǎn)業(yè)市場規(guī)模有望在2035年突破萬億元。
艾媒咨詢CEO兼首席分析師張毅從商業(yè)維度指出,通用家務(wù)機器人已跳出單一清潔功能,依托統(tǒng)一模型加具身智能架構(gòu),具備了多任務(wù)交互能力,“意味著它已經(jīng)跨入了一個平臺級的新品類賽道”。而批量真實家庭入戶,價值遠大于單次舞臺展示,“意味著從炫技走向?qū)嵱茫苯咏逃M者,對行業(yè)商業(yè)化的全面提速意義重大”。
距離5月25日還有18天。第一批家庭機器人將敲開志愿者的家門。它們是會成為家庭期待的“新成員”,還是暴露更多“實習生”級別的笨拙?答案尚未可知。但可以確定的是,這道“終極考題”已經(jīng)開卷,而廣東的產(chǎn)業(yè)鏈正在為這場考試提供著獨一無二的支撐。
夏軒在采訪最后給行業(yè)留下一段值得深思的話:“家庭場景的復(fù)雜性、隱私約束、安全要求,是任何生態(tài)都無法替代的‘硬骨頭’。不要低估‘從能用到好用’的距離。機器人進家庭,不是技術(shù)的終點,而是數(shù)據(jù)工程、倫理治理、商業(yè)模式綜合考量的起點。”
責任編輯:徐蕓茜 主編:公培佳
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.