<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      CVPR 2026 | 1000萬(wàn)段駕駛視頻,教會(huì)模型如何估計(jì)相機(jī)位姿

      0
      分享至



      不用百萬(wàn)級(jí) 3D 標(biāo)注,模型也能從普通駕駛視頻中學(xué)會(huì)「自己是怎么動(dòng)的」。Wayve 的 LA-Pose 試圖把未標(biāo)注視頻里的運(yùn)動(dòng)信號(hào),轉(zhuǎn)化為自動(dòng)駕駛系統(tǒng)所需的相機(jī)位姿估計(jì)能力。

      一輛車駛過(guò)一段路,它該如何知道自己剛才在三維空間中怎樣移動(dòng)?

      對(duì)人來(lái)說(shuō),答案似乎很自然:看一段行車視頻,道路、車輛、路燈和建筑如何在畫面中移動(dòng),幾乎就能判斷相機(jī)是在直行、轉(zhuǎn)彎、減速,還是停下。但對(duì)自動(dòng)駕駛系統(tǒng)來(lái)說(shuō),這是一項(xiàng)核心幾何感知能力。系統(tǒng)不僅要看見(jiàn)場(chǎng)景,還要知道相機(jī)在連續(xù)幀之間發(fā)生了怎樣的平移和旋轉(zhuǎn)。

      過(guò)去,訓(xùn)練這類模型往往依賴高質(zhì)量 3D 真值標(biāo)注。為了得到這些標(biāo)注,通常需要 LiDAR、精密標(biāo)定、重建管線或仿真系統(tǒng)。數(shù)據(jù)越準(zhǔn),成本越高;成本越高,覆蓋的城市、天氣和道路類型就越有限。模型最后也容易繼承這些數(shù)據(jù)集本身的邊界。

      Wayve 的最新研究 LA-Pose 換了一個(gè)切入點(diǎn):先不要求模型直接學(xué)習(xí)精確 3D 位姿,而是讓它從海量未標(biāo)注駕駛視頻里理解「運(yùn)動(dòng)長(zhǎng)什么樣」。這篇論文已被 CVPR 2026 接收,完整題目是 LA-Pose: Latent Action Pretraining Meets Pose Estimation。

      論文標(biāo)題:LA-Pose: Latent Action Pretraining Meets Pose Estimation

      • 項(xiàng)目地址:https://la-pose.github.io/
      • 論文地址:https://arxiv.org/abs/2604.27448
      • Wayve 博客:https://wayve.ai/thinking/la-pose/
      • 作者:Zhengqing Wang, Saurabh Nair, Prajwal Chidananda, Pujith Kachana, Samuel Li, Matthew Brown, Yasutaka Furukawa
      • 機(jī)構(gòu):Wayve、Simon Fraser University
      • 會(huì)議:CVPR 2026

      一句話概括這篇論文

      LA-Pose 先從約 1000 萬(wàn)段未標(biāo)注駕駛視頻中自監(jiān)督學(xué)習(xí)「潛在動(dòng)作」表示,再用少量 3D 標(biāo)注訓(xùn)練一個(gè)輕量級(jí)位姿預(yù)測(cè)頭,把視頻里的運(yùn)動(dòng)規(guī)律轉(zhuǎn)化為準(zhǔn)確、高效、可泛化的相機(jī)位姿估計(jì)能力。

      為什么這件事難

      相機(jī)位姿估計(jì)要回答的是:相機(jī)從上一幀到下一幀,到底移動(dòng)了多遠(yuǎn)、轉(zhuǎn)了多少角度?這聽(tīng)起來(lái)像一個(gè)幾何問(wèn)題,但在真實(shí)道路上,情況遠(yuǎn)比干凈數(shù)據(jù)集復(fù)雜。夜間、雨天、隧道、擁擠城市道路、山路和鄉(xiāng)村道路都會(huì)出現(xiàn),視覺(jué)外觀變化很大,傳統(tǒng)監(jiān)督訓(xùn)練很難靠有限標(biāo)注覆蓋所有情況。

      LA-Pose 的出發(fā)點(diǎn)是,真實(shí)駕駛視頻本身已經(jīng)包含了大量運(yùn)動(dòng)線索。車輛向前開(kāi)、轉(zhuǎn)彎、減速、駛?cè)胨淼溃嬅娑紩?huì)隨時(shí)間發(fā)生規(guī)律變化。問(wèn)題不一定是「怎樣標(biāo)更多 3D 數(shù)據(jù)」,也可以是「怎樣讓模型先從普通視頻里學(xué)會(huì)運(yùn)動(dòng)」。

      核心方法:先學(xué)運(yùn)動(dòng),再學(xué)位姿



      圖:LA-Pose 的兩階段方法。

      LA-Pose 分成兩個(gè)階段。

      第一階段是 Latent Action Pretraining。研究團(tuán)隊(duì)用約 1000 萬(wàn)段未標(biāo)注駕駛視頻片段進(jìn)行自監(jiān)督預(yù)訓(xùn)練,讓模型學(xué)習(xí)一種「潛在動(dòng)作」表示。可以把它理解為相鄰畫面之間運(yùn)動(dòng)變化的緊湊編碼:車輛是否在左轉(zhuǎn)、右轉(zhuǎn)、直行、減速,畫面結(jié)構(gòu)如何隨時(shí)間變化,這些信息不需要人工寫成標(biāo)簽,而是天然藏在視頻序列里。

      具體來(lái)說(shuō),LA-Pose 訓(xùn)練了一個(gè)逆向 - 正向動(dòng)力學(xué)系統(tǒng)。模型看到連續(xù)視頻幀后,需要捕捉「當(dāng)前畫面如何變化到下一幀」的規(guī)律。它不知道車輛的精確速度、航向角或 3D 位姿,也沒(méi)有被提供位姿標(biāo)簽;它只是通過(guò)觀看大量駕駛視頻,逐漸學(xué)會(huì)哪些視覺(jué)變化對(duì)應(yīng)哪些運(yùn)動(dòng)模式。

      第二階段再把這種運(yùn)動(dòng)表示用于位姿估計(jì)。研究者凍結(jié)預(yù)訓(xùn)練得到的運(yùn)動(dòng)編碼器,只在其上接一個(gè)輕量級(jí)位姿預(yù)測(cè)頭,并用少量高質(zhì)量 3D 標(biāo)注微調(diào)。這個(gè)預(yù)測(cè)頭會(huì)把潛在動(dòng)作轉(zhuǎn)換為相機(jī)位姿,包括相對(duì)平移、旋轉(zhuǎn)、視場(chǎng)角和尺度。整個(gè)推理過(guò)程仍然是前饋式的,因此更接近實(shí)際部署對(duì)效率的要求。

      沒(méi)有位姿標(biāo)簽,也能長(zhǎng)出運(yùn)動(dòng)結(jié)構(gòu)



      圖:潛在動(dòng)作空間中自然浮現(xiàn)的運(yùn)動(dòng)結(jié)構(gòu)。

      這篇論文里最直觀的結(jié)果之一,是潛在動(dòng)作空間自己長(zhǎng)出了結(jié)構(gòu)。

      當(dāng)研究者把學(xué)到的潛在動(dòng)作可視化到二維空間后,相似動(dòng)作會(huì)自然聚在一起,不同區(qū)域?qū)?yīng)直行、左轉(zhuǎn)、右轉(zhuǎn)、停止等駕駛行為。這說(shuō)明模型并不只是記住畫面外觀,而是在沒(méi)有 3D 標(biāo)注的情況下,學(xué)到了具有幾何意義的運(yùn)動(dòng)先驗(yàn)。

      另一個(gè)有意思的發(fā)現(xiàn)是:表示并不是越大越好。LA-Pose 的實(shí)驗(yàn)顯示,一個(gè) 50 維的潛在空間瓶頸,雖然不一定最擅長(zhǎng)重建畫面細(xì)節(jié),卻比更高維的表示更適合后續(xù)位姿估計(jì)。壓縮迫使模型丟掉一部分外觀信息,留下更關(guān)鍵的運(yùn)動(dòng)結(jié)構(gòu)。

      結(jié)果:更少標(biāo)注,更高精度

      實(shí)驗(yàn)結(jié)果顯示,LA-Pose 在 Waymo 和 PandaSet 等自動(dòng)駕駛基準(zhǔn)上,相比近期前饋式方法取得超過(guò) 10% 的位姿精度提升,同時(shí)所需標(biāo)注數(shù)據(jù)少了多個(gè)數(shù)量級(jí)。

      更重要的是,在沒(méi)有參與訓(xùn)練的 PandaSet 上,LA-Pose 依然超過(guò)基線方法,展示出較強(qiáng)的跨數(shù)據(jù)集泛化能力。對(duì)于自動(dòng)駕駛來(lái)說(shuō),這一點(diǎn)很關(guān)鍵:系統(tǒng)不能只在熟悉數(shù)據(jù)集里表現(xiàn)穩(wěn)定,也要能面對(duì)新的城市、道路形態(tài)和天氣條件。

      意義:把未標(biāo)注視頻變成幾何能力

      為了更直觀看到這種泛化能力,Wayve 還展示了 LA-Pose 與 VGGT 在不同真實(shí)道路場(chǎng)景中的對(duì)比:雨天高速出口與環(huán)島、德國(guó)鄉(xiāng)村窄路。 LA-Pose 的價(jià)值在于,它把「未標(biāo)注視頻規(guī)模」轉(zhuǎn)化成了幾何視覺(jué)能力。車輛每天在真實(shí)世界中產(chǎn)生的視頻,本身就包含豐富的運(yùn)動(dòng)信息。只要模型能從中學(xué)到緊湊、可遷移的運(yùn)動(dòng)表示,再用少量標(biāo)注把這種表示落到真實(shí)尺度上,就有可能改變幾何感知系統(tǒng)的訓(xùn)練成本和擴(kuò)展路徑。

      當(dāng)然,LA-Pose 還不是終點(diǎn)。Wayve 在博客中提到,模型目前在倒車運(yùn)動(dòng)上仍會(huì)出現(xiàn)退化,一個(gè)原因是倒車在后訓(xùn)練數(shù)據(jù)中相對(duì)少見(jiàn)。團(tuán)隊(duì)認(rèn)為,下一步需要繼續(xù)擴(kuò)大預(yù)訓(xùn)練和后訓(xùn)練數(shù)據(jù),并把這種逆向動(dòng)力學(xué)預(yù)訓(xùn)練拓展到機(jī)器人采集視頻、手持視頻等更廣泛的動(dòng)態(tài)視覺(jué)場(chǎng)景。

      但這篇工作的信號(hào)已經(jīng)很清楚:幾何視覺(jué)不一定只能從昂貴標(biāo)注開(kāi)始。運(yùn)動(dòng)本身就是監(jiān)督信號(hào),而真實(shí)世界的視頻中到處都有運(yùn)動(dòng)。

      結(jié)語(yǔ):運(yùn)動(dòng)本身就是信號(hào)

      如果 LA-Pose 的方向繼續(xù)成立,未來(lái)的自動(dòng)駕駛系統(tǒng)也許可以更少依賴為每個(gè)城市、每類場(chǎng)景重新構(gòu)建昂貴 3D 標(biāo)注集,而是從不斷增長(zhǎng)的真實(shí)駕駛視頻中學(xué)習(xí)更通用的幾何先驗(yàn)。

      這也是「Latent Action Pretraining Meets Pose Estimation」這個(gè)題目的意義:潛在動(dòng)作不再只是世界模型或策略網(wǎng)絡(luò)里的動(dòng)作條件,它也可以成為連接視頻規(guī)模與 3D 幾何理解的一座橋。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      63歲黃仁勛回臺(tái)探親,和父母一起吃飯,96歲父親神采奕奕狀態(tài)超好

      63歲黃仁勛回臺(tái)探親,和父母一起吃飯,96歲父親神采奕奕狀態(tài)超好

      丫頭舫
      2026-05-26 17:55:54
      沙利文萬(wàn)字長(zhǎng)文承認(rèn):面對(duì)中國(guó),我們確實(shí)錯(cuò)了!

      沙利文萬(wàn)字長(zhǎng)文承認(rèn):面對(duì)中國(guó),我們確實(shí)錯(cuò)了!

      浪子的煙火人間
      2026-05-26 01:30:03
      細(xì)糠!!太通透了,這才是對(duì)孩子真正的托舉!

      細(xì)糠!!太通透了,這才是對(duì)孩子真正的托舉!

      另子維愛(ài)讀史
      2026-05-25 19:44:13
      竇唯早期的這身打扮,至今看也很時(shí)尚,才華帥氣集于一身

      竇唯早期的這身打扮,至今看也很時(shí)尚,才華帥氣集于一身

      大江
      2026-05-26 11:50:46
      打破常規(guī),中方設(shè)宴招待,日本想見(jiàn)的人來(lái)了,高市需要好好珍惜

      打破常規(guī),中方設(shè)宴招待,日本想見(jiàn)的人來(lái)了,高市需要好好珍惜

      起喜電影
      2026-05-26 18:45:35
      阿爾特塔私人聚會(huì)視頻外泄,阿森納內(nèi)部擔(dān)憂激勵(lì)巴黎

      阿爾特塔私人聚會(huì)視頻外泄,阿森納內(nèi)部擔(dān)憂激勵(lì)巴黎

      樂(lè)道足球C
      2026-05-27 09:54:38
      美國(guó)抽身歐洲,俄羅斯一旦翻盤,中國(guó)必須立刻封死這三個(gè)致命缺口

      美國(guó)抽身歐洲,俄羅斯一旦翻盤,中國(guó)必須立刻封死這三個(gè)致命缺口

      松林侃世界
      2026-05-24 02:51:44
      樹(shù)莓派拯救了我的NAS:一個(gè)被低估的40美元升級(jí)

      樹(shù)莓派拯救了我的NAS:一個(gè)被低估的40美元升級(jí)

      硅嶼手記
      2026-05-26 00:19:07
      出差的路上被裁員,我立刻掉頭回家,第二天公司損失20億大訂單

      出差的路上被裁員,我立刻掉頭回家,第二天公司損失20億大訂單

      千秋文化
      2026-05-12 20:17:35
      蕁麻,不要讀xún má,丟不起那個(gè)人!

      蕁麻,不要讀xún má,丟不起那個(gè)人!

      未央看點(diǎn)
      2026-05-19 08:54:23
      廣西醫(yī)科大保安踹出租車,和兩名司機(jī)吵架,視頻曝光,網(wǎng)友一邊倒

      廣西醫(yī)科大保安踹出租車,和兩名司機(jī)吵架,視頻曝光,網(wǎng)友一邊倒

      阿纂看事
      2026-05-26 19:44:31
      網(wǎng)絡(luò)爆料浪姐四公環(huán)節(jié)擬邀請(qǐng)6位男藝人助演惹爭(zhēng)議

      網(wǎng)絡(luò)爆料浪姐四公環(huán)節(jié)擬邀請(qǐng)6位男藝人助演惹爭(zhēng)議

      悅君兮君不知
      2026-05-26 09:58:04
      38歲巨星再奪最佳,火箭背鍋爭(zhēng)議,數(shù)據(jù)揭曉真相?

      38歲巨星再奪最佳,火箭背鍋爭(zhēng)議,數(shù)據(jù)揭曉真相?

      川川八卦說(shuō)
      2026-05-27 11:15:14
      26歲身價(jià)30億,如今負(fù)債百億!ofo戴威,把一手王炸徹底打爛

      26歲身價(jià)30億,如今負(fù)債百億!ofo戴威,把一手王炸徹底打爛

      流蘇晚晴
      2026-05-26 17:59:55
      有錢人私下玩的多花?網(wǎng)友:開(kāi)眼了

      有錢人私下玩的多花?網(wǎng)友:開(kāi)眼了

      另子維愛(ài)讀史
      2026-05-16 21:38:47
      景甜工作室被曝失聯(lián)!跟富商進(jìn)入?yún)f(xié)商階段,對(duì)方要求支付2億和解

      景甜工作室被曝失聯(lián)!跟富商進(jìn)入?yún)f(xié)商階段,對(duì)方要求支付2億和解

      李橑在北漂
      2026-05-26 23:46:16
      戰(zhàn)勝一眾名帥,綠軍主帥馬祖拉憑啥能當(dāng)選賽季最佳教練的?

      戰(zhàn)勝一眾名帥,綠軍主帥馬祖拉憑啥能當(dāng)選賽季最佳教練的?

      齊魯壹點(diǎn)
      2026-05-27 11:30:45
      打臉瓜迪奧拉!曼城水貨徹底被棄!寧愿無(wú)歐戰(zhàn)踢也要離隊(duì)

      打臉瓜迪奧拉!曼城水貨徹底被棄!寧愿無(wú)歐戰(zhàn)踢也要離隊(duì)

      瀾歸序
      2026-05-27 07:03:34
      人民日?qǐng)?bào)建議:人生下半場(chǎng),比存錢更重要的,是存肌肉

      人民日?qǐng)?bào)建議:人生下半場(chǎng),比存錢更重要的,是存肌肉

      洞見(jiàn)
      2026-05-25 09:25:00
      網(wǎng)友爆料!吳夢(mèng)潔微創(chuàng)手術(shù)順利完成,這次排協(xié)終于坦誠(chéng)透明

      網(wǎng)友爆料!吳夢(mèng)潔微創(chuàng)手術(shù)順利完成,這次排協(xié)終于坦誠(chéng)透明

      金毛愛(ài)女排
      2026-05-27 10:16:25
      2026-05-27 11:56:49
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      13091文章數(shù) 142653關(guān)注度
      往期回顧 全部

      科技要聞

      雙雙暴漲!SK海力士/美光市值均破萬(wàn)億美元

      頭條要聞

      男子投百萬(wàn)養(yǎng)魚"打水漂":對(duì)方稱每條魚苗回收價(jià)3千元

      頭條要聞

      男子投百萬(wàn)養(yǎng)魚"打水漂":對(duì)方稱每條魚苗回收價(jià)3千元

      體育要聞

      這群老阿姨,是最硬核的馬刺球迷

      娛樂(lè)要聞

      小S曬歸寧宴舊照,大S穿吊帶裙扎丸子頭

      財(cái)經(jīng)要聞

      ST巖石退市背后:A股“炒殼”時(shí)代終結(jié)

      汽車要聞

      更智能的國(guó)民SUV 體驗(yàn)吉利博越L小藍(lán)燈版

      態(tài)度原創(chuàng)

      家居
      教育
      旅游
      時(shí)尚
      藝術(shù)

      家居要聞

      古老而持久 石影扶手椅

      教育要聞

      河南的學(xué)生和家長(zhǎng)注意了!河南義務(wù)教育將增加新課程,今年秋季學(xué)期開(kāi)始執(zhí)行

      旅游要聞

      太美了!橫沙島這片“神仙花海”藏不住了

      她們的包背了20年,今年夏天還在流行

      藝術(shù)要聞

      這個(gè)夏天去蘇州過(guò)幾天清閑安逸的日子

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 久久久噜噜噜久久熟女aa片| 亚洲an第二区国产精品| 又大又黄又粗又爽的免费视频| 国产精品天堂avav在线| 男人av无码天堂| 婷婷综合五月| 中文字幕亚洲中文字幕无码码| 极品私人尤物在线精品首页| 欧美 亚洲 国产 精品有声| 欧美日韩在线第一页免费观看| 九九热免费精品在线视频| 中文字幕av不卡电影网| 日日猛噜噜狠狠扒开双腿小说| 欧洲亚洲一区| 国产一级妓女av网站| 天堂αv亚洲αv日韩在线| 精品国产美女福到在线直播| 中文字幕自拍偷拍福利视频| 免费3?P视频久久| 2021av在线| 少妇高潮无套内谢麻豆传| 国产精品无码久久四虎| www.亚洲国产| 丝袜美腿亚洲综合第一区| 男女动图视频网站在线播放| 亚洲一区| 一二三四视频社区3在线高清| 无码区日韩专区免费系列| 天堂网www中文在线| 91久久精品国产| 国产91色综合久久高清| A级毛片18以上观看视频免费| a国产一区二区免费入口| 成午夜福利人试看120秒| 国产精品熟女高潮视频| 国产成人无码精品久久久免费| www亚洲精品| 亚洲精品在线视频自拍| 日韩av自拍偷拍| 久久青青草原亚洲AV无码麻豆| 亚洲精品久久久中文字幕痴女|