<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      原力靈機發(fā)布Realtime-VLA V2:從遙操作到真實部署,VLA提速的系統(tǒng)解法

      0
      分享至

      責(zé)編 | 夢依丹

      出品丨原力靈機投稿

      最近刷屏的 GEN-1 有一個非常重要的 Feature,就是它的執(zhí)行速度非常“快”:能夠以一種明顯不拖沓的節(jié)奏完成任務(wù),并相較此前方案實現(xiàn)了約 3 倍提速。而這一效果的取得,“依賴系統(tǒng)級組件”,并“不只是模型權(quán)重”的改進。

      事實上,關(guān)于 GEN-1 極速執(zhí)行的底層邏輯,Generalist 在最新技術(shù)報告中給出了答案:GEN-1 并非一個機械疊加機器人動作模塊的微調(diào)版視覺語言模型(VLM),也不僅是一個世界模型,而是一個面向物理交互、具備“一等公民”地位的原生基礎(chǔ)模型。這與原力靈機堅持的技術(shù)路線高度一致。原力靈機明確提出“具身原生”這一全新 AI 范式,將其作為具身智能的核心實現(xiàn)路徑,徹底區(qū)別于行業(yè)普遍采用的“嫁接式訓(xùn)練”,從智能本質(zhì)與形成機制上扎根于物理交互。

      正是基于這種深耕物理世界交互的共識,比較巧的是,恰好在最近一段時間里,我也專門研究了在 VLA 控制下如何讓機器人真正快速地運動起來。相關(guān)結(jié)果最終整理為題為《Realtime-VLA V2》的技術(shù)報告,并已公開在:

      • 文章:https://arxiv.org/abs/2603.26360

      • 視頻與 rrd 文件:https://dexmal.github.io/realtime-vla-v2/

      • 代碼:https://github.com/dexmal/realtime-vla-v2

      總結(jié)來說,我們實現(xiàn)了以數(shù)倍于遙操作采集訓(xùn)練數(shù)據(jù)的速度執(zhí)行 VLA,并且在多個真實場景任務(wù)上完成了驗證。


      在三個不同任務(wù)上比較遙操演示速度(上)算法運行速度(中)和人手操作速度(下)

      當(dāng)然,要做到這一點,絕不是靠一個“巧妙算法打天下”,而是“端到端的全面踩坑”。下面我按照時間順序,記錄一下整個推進過程。


      遙操作數(shù)據(jù)最初甚至無法錄制

      出乎意料的是,整個項目的第一道難關(guān),竟然是遙操作數(shù)據(jù)本身難以采集。

      由于我們的目標(biāo)是在“真實”場景中研究任務(wù)執(zhí)行,而不僅限于傳統(tǒng)的“疊衣服”類 demo,因此我們還選擇了一些來自工業(yè)客戶的擺放類任務(wù)。例如在視頻展示的上料任務(wù)中,需要將工件放置到工裝上,這一過程要求 sub-mm 級精度,稍有偏差就會發(fā)生卡滯。我最初嘗試親自進行遙操作,結(jié)果發(fā)現(xiàn)這個任務(wù)幾乎無法順利完成,一度懷疑它是否具備可行性。

      但反復(fù)嘗試之后,我們逐步總結(jié)出一套有效的方法論。概括來說,核心在于:心要靜。是的,這看似“玄學(xué)”的訣竅,背后對應(yīng)了我們針對遙操作員的若干重要優(yōu)化:

      • 盡可能將動作設(shè)計成“機器人友好”的形式,減少必須依賴超高精度控制的步驟占比

      • 允許主臂基座靈活調(diào)整位置(DOS-W1 支持該能力),為遙操作員提供更舒適的姿態(tài),降低疲勞

      • 每采集 1 小時,固定休息 10 分鐘

      • 在采集初期接受效率較低的現(xiàn)實,直到慢慢達到“人臂合一”的無我境界,采集效率自然上去

      總體來看,目標(biāo)是讓遙操作員盡可能建立起對機器人末端的直接控制感,在視覺、觸覺反饋和動作執(zhí)行之間形成穩(wěn)定耦合,從而提升采集質(zhì)量與一致性。

      我們不得不承認,人類本身依然是一個超強真實世界自主 RL Agent。經(jīng)過一系列優(yōu)化后,演示數(shù)據(jù)總算可以較穩(wěn)定地錄制出來。不過即便如此,采集到的演示速度仍顯著低于最終應(yīng)用需求。換句話說,從項目一開始,我們就必須把目標(biāo)設(shè)定為:“推理速度要遠超訓(xùn)練數(shù)據(jù)本身”。


      充滿細節(jié)的時序問題

      有了數(shù)據(jù)之后,自然就是盡快 Finetune 一版 VLA,再結(jié)合 RTC 算法縮短每一步之間的間隔,看看效果。

      結(jié)果也并不意外:系統(tǒng)很快暴露出問題。我們發(fā)現(xiàn),如果想以合理成功率完成任務(wù),別說超過演示數(shù)據(jù)的速度(定義為 1x),實際上往往需要降到 0.75x 甚至 0.5x 才能穩(wěn)定運行。

      這是否意味著當(dāng)前 VLA 模型能力不足?為此,我們做了更深入的排查,并發(fā)現(xiàn)一個非常關(guān)鍵的問題:推理與執(zhí)行鏈路中的時序延遲遠比預(yù)期嚴重。

      為了驗證這一點,團隊做了一個簡單實驗:測量控制指令從發(fā)送到真正被機械臂執(zhí)行,以及從執(zhí)行到傳感器反饋可觀測之間的時間差。


      結(jié)果非常明確:給機械臂發(fā)送位置指令后,通常需要約 150ms,機械臂才能實際運動到對應(yīng)位置;隨后還要再經(jīng)過約 50ms,我們才能從傳感器反饋中觀察到這一變化。這個時延顯著超出我們此前的預(yù)期,也明顯不同于以往在 UR 等工業(yè)機械臂平臺上的經(jīng)驗。

      這一現(xiàn)象其實不難理解。我們所使用的是桌面級輕量機械臂,其控制系統(tǒng)往往會對輸入進行顯式或隱式平滑,以避免運動過于抖動。但由于機械臂 API 并不提供對未來軌跡的原生支持,任何形式的平滑都不可避免地引入相位滯后。

      既然如此,一個自然的思路是:在 VLA 推理時,模型其實已經(jīng)隱含包含了“未來軌跡”信息,那么我們是否可以在發(fā)送給機械臂的軌跡上進行適當(dāng)“預(yù)放大”,以抵消系統(tǒng)平滑造成的時延影響?


      實驗結(jié)果非常直觀。如上圖所示,當(dāng)輸入軌跡變成綠色所示那種經(jīng)過適度“夸張”的形式后,機械臂的實際執(zhí)行軌跡(橙色)就能更好地貼合模型原始輸出(藍色)。

      但這一方案也帶來了新的問題。帶有明顯“過沖”特征的控制信號,會顯著增加機械臂抖動風(fēng)險;而一旦機械臂抖動,相機隨之抖動,視覺輸入進一步惡化,再反饋到模型端后,系統(tǒng)很容易進入不穩(wěn)定狀態(tài)。

      為此,我們在模型輸出之后引入了額外的速度規(guī)劃與位置規(guī)劃,通過優(yōu)化方法將高加速度段的變化分散到其他時段中,使最終下發(fā)給機械臂的軌跡既具備補償效果,又不會引發(fā)過強抖動。

      完成這些處理之后,對于大多數(shù)任務(wù),系統(tǒng)已經(jīng)可以直接 2x 速度下取得較為理想的效果。


      挑戰(zhàn)極限:上機器學(xué)習(xí)!

      不過,我們對 2x 的狀態(tài)仍然不完全滿意。我一直在問一個問題:還能不能更快?

      進一步分析動作序列后可以發(fā)現(xiàn),不同階段對速度的要求并不一致。比如在精細接觸階段,系統(tǒng)通常需要更慢、更穩(wěn);而在空中轉(zhuǎn)移階段,則完全可以更快。

      于是,一個自然的方向就是加 RL:讓系統(tǒng)自動學(xué)習(xí)“在什么時刻應(yīng)該以什么速度執(zhí)行”。

      這類思路此前已有論文提出,代表性工作如 Speed Tuning。不過,任何涉及真實世界機器人 RL 的工作,落地起來都非常復(fù)雜。

      這時,團隊里一位實習(xí)生提出了一個非常有效的思路:既然采集過程中本來就需要有人在旁監(jiān)控,不如直接讓他加RL。于是,我們形成了目前最穩(wěn)定、也最 work 的一種“油門式采集”方法:


      具體做法是:先讓現(xiàn)有模型自主執(zhí)行推理,人類站在旁邊觀察;當(dāng)判斷當(dāng)前階段可以更快時,就按下加速鍵;當(dāng)感覺應(yīng)當(dāng)減速時,就按下減速鍵。這個過程很像在駕駛過程中踩油門和剎車,只不過調(diào)節(jié)對象變成了執(zhí)行速度。

      采集到這樣的數(shù)據(jù)后,再用于訓(xùn)練新的模型,并持續(xù)迭代,我們便得到了一系列速度逐步提升的模型。

      不得不說,人類確實是非常高效的真實世界自主 Agent。我們發(fā)現(xiàn),這種 DAgger-style 的迭代方式非常靠譜,幾乎適用于各種任務(wù),并且不太會引入復(fù)雜的系統(tǒng)不穩(wěn)定問題。

      也正因如此,機器人的執(zhí)行速度得以進一步向前推進。


      與人類速度的比較,以及進一步的邊界

      如果這是一個童話故事,那么結(jié)尾大概會是:“最終我們讓機器人達到了媲美人類的速度,項目圓滿完成。”但現(xiàn)實通常不會如此簡單。

      確實,經(jīng)過上述優(yōu)化之后,機器人在我們測試過的任務(wù)上的執(zhí)行速度已經(jīng)有了非常明顯的提升。甚至在旁觀其疊衣服時,已經(jīng)能清晰聽見關(guān)節(jié)電機高速運轉(zhuǎn)的聲音。我們還專門讓人類以一種“不快不慢、但合理”的節(jié)奏,按照“機器人完成任務(wù)的方式”來執(zhí)行同樣任務(wù),結(jié)果顯示:在部分任務(wù)上,機器人確實已經(jīng)接近“人手速度”。

      但問題在于,人類從來不是以“機器人式”的方式完成任務(wù)。

      人類雙手在結(jié)構(gòu)、力量分布、材料特性和控制自由度上,依然展現(xiàn)出極強的生物學(xué)優(yōu)勢。很多動作,人類可以以高度靈活、近乎一步到位的方式自然完成,而這些能力,目前的機器人硬件體系仍無法真正復(fù)制。

      我們當(dāng)然可以在六軸機械臂體系下持續(xù)探索其極限,但是離人的性能,還是差著很遠。

      另一方面,當(dāng)我們把執(zhí)行速度不斷推高后,在各種延時的debuff下,VLA 模型本身其實也逐漸被推到了一個并不理想的工作區(qū)間:它需要在很高的提前量下以很準(zhǔn)的要求輸出未來位置。

      所以在執(zhí)行速度的這條路上,如果要繼續(xù)走,必然還是要和硬件以及模型都再大戰(zhàn)一番,才能再繼續(xù)突破了。

      這些問題,就留待未來繼續(xù)解決。

      不過,我們?nèi)匀幌Mㄟ^這次工作的記錄與開源,讓更多人在構(gòu)建機器人 demo 時,能夠真正重視執(zhí)行速度這一問題,而不是讓行業(yè)外的人繼續(xù)形成“用了 VLA 之后機器人只能慢吞吞動作”的刻板印象。


      【活動分享】2026 奇點智能技術(shù)大會將于 4 月 17-18 日在上海環(huán)球港凱悅酒店正式召開,大會聚焦大模型技術(shù)演進、智能體系統(tǒng)工程、OpenClaw 生態(tài)實踐及 AI 行業(yè)落地等十二大專題板塊,特邀來自BAT、京東、微軟、小紅書等頭部企業(yè)的 50+ 位技術(shù)決策者分享實戰(zhàn)案例。旨在幫助技術(shù)管理者與一線 AI 落地人員規(guī)避選型風(fēng)險、降低試錯成本、獲取可復(fù)用的工程方法論,真正實現(xiàn) AI 技術(shù)的規(guī)模化落地與商業(yè)價值轉(zhuǎn)化。這不僅是一場技術(shù)的盛宴,更是決策者把握 2026 AI 拐點的戰(zhàn)略機會。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      季后賽把身價打沒了!暴跌5000萬,全明星中鋒被棄用

      季后賽把身價打沒了!暴跌5000萬,全明星中鋒被棄用

      德譯洋洋
      2026-05-15 13:06:16
      網(wǎng)傳焦泊喬提出離隊申請,下家或上海廣州3選1,朱芳雨遭遇挑戰(zhàn)

      網(wǎng)傳焦泊喬提出離隊申請,下家或上海廣州3選1,朱芳雨遭遇挑戰(zhàn)

      二哥聊球
      2026-05-15 11:22:39
      “空軍一號”來華菜單曝光:牛肉炒面、春卷、幸運餅干等美式中餐

      “空軍一號”來華菜單曝光:牛肉炒面、春卷、幸運餅干等美式中餐

      臺州交通廣播
      2026-05-14 23:40:37
      有期徒刑十年六個月,青島市人民政府原黨組成員、副市長吳經(jīng)建受賄案一審宣判

      有期徒刑十年六個月,青島市人民政府原黨組成員、副市長吳經(jīng)建受賄案一審宣判

      大風(fēng)新聞
      2026-05-14 19:18:37
      美國總統(tǒng)特朗普結(jié)束訪華

      美國總統(tǒng)特朗普結(jié)束訪華

      蓬勃新聞
      2026-05-15 14:49:47
      A股三大指數(shù)跌逾1%

      A股三大指數(shù)跌逾1%

      每日經(jīng)濟新聞
      2026-05-15 10:10:12
      王勵勤動真格了!亞運會名單大洗牌重用3位選手,兩大名將被棄用

      王勵勤動真格了!亞運會名單大洗牌重用3位選手,兩大名將被棄用

      可愛的巴比龍
      2026-05-15 07:03:15
      廣東多地暴雨紅色預(yù)警 啟動防汛Ⅳ級應(yīng)急響應(yīng)

      廣東多地暴雨紅色預(yù)警 啟動防汛Ⅳ級應(yīng)急響應(yīng)

      金臺資訊
      2026-05-15 14:51:54
      美國一旦霸權(quán)結(jié)束,一定會滅亡的三個國家,排第一的果然是它

      美國一旦霸權(quán)結(jié)束,一定會滅亡的三個國家,排第一的果然是它

      琴音繚繞回
      2026-04-25 07:21:31
      太陽報:致敬70年代風(fēng)格,曼聯(lián)下賽季主場球衣發(fā)布后廣受好評

      太陽報:致敬70年代風(fēng)格,曼聯(lián)下賽季主場球衣發(fā)布后廣受好評

      懂球帝
      2026-05-15 12:29:31
      停課!廣州3區(qū)發(fā)布紅色預(yù)警

      停課!廣州3區(qū)發(fā)布紅色預(yù)警

      南方都市報
      2026-05-15 14:33:26
      外事不決看英國?英國自己都快被玩死了

      外事不決看英國?英國自己都快被玩死了

      難得君
      2026-05-07 15:36:23
      相親要1000萬彩禮的“泡面姐姐”露真容,網(wǎng)友很失望勸她戴上面罩

      相親要1000萬彩禮的“泡面姐姐”露真容,網(wǎng)友很失望勸她戴上面罩

      漢史趣聞
      2026-05-13 10:21:50
      史密斯爆料:湖人高層"不喜歡"詹姆斯,矛盾源于威斯布魯克交易

      史密斯爆料:湖人高層"不喜歡"詹姆斯,矛盾源于威斯布魯克交易

      林間小溫柔
      2026-05-15 01:42:36
      笑死!馬斯克像個“好奇寶寶”,360度轉(zhuǎn)圈拍人民大會堂。網(wǎng)友:沒發(fā)朋友圈等于白來...

      笑死!馬斯克像個“好奇寶寶”,360度轉(zhuǎn)圈拍人民大會堂。網(wǎng)友:沒發(fā)朋友圈等于白來...

      品牌新
      2026-05-14 17:08:48
      純手工縫制,一只包耗時7天!馬斯克兒子一個包,拯救300多位繡娘

      純手工縫制,一只包耗時7天!馬斯克兒子一個包,拯救300多位繡娘

      火山詩話
      2026-05-15 13:16:30
      一夜情后勒索NBA雄鹿老板12.15億美元,羅某在登機回國時被捕

      一夜情后勒索NBA雄鹿老板12.15億美元,羅某在登機回國時被捕

      聽心堂
      2026-05-12 13:19:43
      湖人內(nèi)部矛盾加劇,傳詹東互相厭惡,詹姆斯立雕像基本無望

      湖人內(nèi)部矛盾加劇,傳詹東互相厭惡,詹姆斯立雕像基本無望

      藝兔體壇
      2026-05-14 16:25:13
      中美會晤結(jié)束,中方率先定調(diào),特朗普通告全球,美媒:美國變了

      中美會晤結(jié)束,中方率先定調(diào),特朗普通告全球,美媒:美國變了

      野渡舟山人
      2026-05-15 11:20:45
      百日乾州攻防戰(zhàn),皇帝都沒了,五萬大軍為何還在拼命?

      百日乾州攻防戰(zhàn),皇帝都沒了,五萬大軍為何還在拼命?

      歷史按察使司
      2026-05-15 11:20:11
      2026-05-15 15:43:00
      AI科技大本營 incentive-icons
      AI科技大本營
      連接AI技術(shù)的創(chuàng)造者和使用者
      2692文章數(shù) 7684關(guān)注度
      往期回顧 全部

      科技要聞

      兩年聯(lián)姻一地雞毛,傳蘋果OpenAI瀕臨決裂

      頭條要聞

      女游客以1分錢拍下標(biāo)價1980元的三亞海景房 酒店回應(yīng)

      頭條要聞

      女游客以1分錢拍下標(biāo)價1980元的三亞海景房 酒店回應(yīng)

      體育要聞

      德約科維奇買的球隊,從第6級聯(lián)賽升入法甲

      娛樂要聞

      方媛為何要來《桃花塢6》沒苦硬吃?

      財經(jīng)要聞

      特朗普的北京時刻

      汽車要聞

      雙零重力座椅/AI智能體/調(diào)光天幕 啟境GT7內(nèi)飾發(fā)布

      態(tài)度原創(chuàng)

      手機
      本地
      親子
      數(shù)碼
      公開課

      手機要聞

      史上最低價!iPhone 17 Pro系列京東天貓大促,全系優(yōu)惠拉滿

      本地新聞

      用蘇繡的方式,打開江西婺源

      親子要聞

      考前焦慮家長扎堆問診!濟南六一兒童醫(yī)院:學(xué)習(xí)困難需醫(yī)學(xué)“破局”,暑假正當(dāng)時

      數(shù)碼要聞

      25999元!華碩ROGxAMD聯(lián)名主機發(fā)布:一身極品裝備

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 激情上位来个颜射HD| 日本东京热不卡一区二区| 美女裸体十八禁免费网站| av三区在线| 国产高清一级毛片视频直播| 欧美伊香蕉久久综合网99| 久久精品国产久精国产果冻传媒| 嗯91色色| 亚洲男人天堂一区二区| 亚洲三级片在线看| 中文字幕av久久| 国产精品 欧美 亚洲 制服| 和平区| 成人午夜无人区一区二区| 办公室强奷漂亮少妇视频| 色偷偷男人的天堂亚洲av| 中文天堂在线视频| 夜夜嗨av一区二区| 亚洲av成人在线| 亚洲s色大片在线观看一区| 精品国产一区二区三区麻豆| 在线第99页| 亚洲色成人网一二三区| 中文字幕日韩精品有码| 欧美日韩免费专区在线观看| 亚洲一级毛片免费看| 亚洲国产激情一区二区三区| 农村欧美丰满熟妇xxxx| 偷柏自拍亚洲综合在线在线视频日本三区精品 | 亚洲日本精品国产第一区| 日本久久高清一区二区三区毛片| 国产成年女人毛片80s网站| 国产亚洲欧美日韩亚洲中文色 | 男人添女人下面的视频| 亚洲国产成人久久精品软件| 99r精品视频| 九九热视频在线精品18| 久久精品国产久精国产爱| 国内不卡不区二区三区| 99热国产在线| 四虎国产精品永久地址49|