<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      打破碎片化瓶頸!浙大&哈佛開源UniGeo,高保真相機可控編輯

      0
      分享至


      新智元報道

      編輯:LRST

      【新智元導讀】UniGeo通過視頻模型的連續視角先驗與統一幾何引導,實現穩定、高質量的相機可控圖像生成,全面超越現有方法,在不同幅度的相機運動中提升跨視角一致性與結構穩定性。

      當前主流的相機可控圖像編輯主要基于圖像擴散模型,通過處理離散視角映射,在場景生成和新視角合成領域取得了顯著成功。

      然而,圖像模型天生的離散屬性使其在應對連續相機運動時,極易出現幾何漂移和結構退化。現有方法引入的幾何引導也往往是碎片化的(如僅在表示層注入點云),這導致即使引入視頻模型來克服圖像模型的缺點,提供連續視角先驗,模型也依然難以形成穩定的全局幾何理解,無法徹底消除結構退化現象。

      近日,浙大聯合哈佛發布了全新的基于視頻模型的統一幾何引導相機可控編輯框架UniGeo。該框架系統性地打破了碎片化瓶頸,創新性地在決定生成輸出的三個核心層面(表示層、架構層、損失函數層)全面注入了統一的幾何引導。結合視頻模型的連續先驗與全局統一的幾何引導,UniGeo 有效克服了結構退化問題,顯著提升了在不同幅度的相機運動下的視覺質量與跨視角幾何一致性。


      模型代碼網址:https://github.com/mo230761/UniGeo

      英文技術報告網址:https://arxiv.org/pdf/2604.17565

      Project Page網址:https://mo230761.github.io/UniGeo.github.io/

      HF Space網址:https://huggingface.co/spaces/123123aa123/UniGeo

      現有主流的相機可控圖像編輯(Camera-controllable image editing)主要依托于圖像擴散模型。其基本范式是:通過處理離散的二維視角映射,并輔以局部層面的幾何信息(如僅在表示層注入點云),來合成不同相機姿態下的新場景。這一技術路徑在二維視角的轉換上取得了顯著進展。

      然而,這類方法在應對真實的連續相機運動時,面臨著跨視角幾何不一致和結構退化等嚴峻問題。真實物理世界中的相機運動在三維空間內是平滑且連續的,但受限于圖像模型天生的「離散屬性」,以及僅停留在單一層面的「碎片化」幾何引導,現有模型內部難以形成全局協同的三維幾何對應關系,導致生成過程常常發生幾何漂移。

      鑒此,研究團隊認為,要實現高保真的相機可控圖像生成,必須摒棄以往「離散生成+碎片化幾何引導」的局限思路。視頻模型天然具備連續視角建模的先驗能力,這為攻克上述難題提供了絕佳基座。

      但僅引入視頻先驗并不充分,研究團隊在此基礎上提出了一條系統性重構的新路徑:即系統地將「統一幾何引導」貫穿于生成模型的全鏈路,確保模型從特征輸入到特征交互、再到最終優化的每一個環節,都遵循嚴格的三維幾何引導。

      在該思路的指引下,研究團隊探索了連續視頻先驗與全局幾何引導的深度融合,提出了全新的相機可控圖像編輯框架UniGeo。該框架系統地重構了決定生成輸出的三大核心基石:在表示層實現幀解耦的幾何參考注入,在架構層引入對齊多視角的幾何錨點注意力,并在損失函數層強化軌跡端點的幾何監督。

      UniGeo 成功打通了視頻模型與三維幾何理解之間的壁壘,在不同幅度的相機運動下均實現了跨視角一致性的突破,或將為影視后期制作、具身智能感知等依賴高可靠渲染的前沿領域提供堅實的基礎模型積累。

      核心技術

      給定輸入圖像與相機控制指令,UniGeo 的目標是在嚴格保持三維幾何結構的前提下合成新視角。為此,模型從表示層、架構層和損失函數層系統性地注入了統一幾何引導(圖1)。


      圖1. UniGeo框架概覽

      在表示層,為避免直接輸入相機參數帶來的映射模糊,模型構建了幀解耦點云注入機制。該機制首先提取首幀點云并沿目標相機軌跡渲染,生成顯式的 3D 幾何先驗序列。隨后,區別于傳統的通道拼接,模型將該渲染序列作為獨立的幾何上下文,與目標視頻特征在幀維度(Frame-dim)進行拼接。這一解耦設計避免了強硬的像素級對齊,使幾何先驗能夠與視頻特征在網絡中靈活交互并提升容錯率。

      在架構層,為維持連續生成中的跨視角結構一致性,模型引入了幾何錨點注意力。該機制將序列首幀顯式指定為「幾何錨點」,后續所有幀均通過新增的少量可學習投影矩陣(Query 與 Output),持續與首幀的 Key 和 Value 進行注意力交互。這一設計在不破壞預訓練視頻生成先驗的前提下,以極低的計算開銷在微觀特征層面實現了全局的結構對齊。

      在損失函數層,為強化目標最終視角的結構保真度,模型提出了軌跡端點幾何監督策略。在稀疏時間采樣的基礎上,模型將各時間步的損失權重設計為隨時間中心距離遞增的二次函數,從而增加對軌跡兩端(特別是目標端點)的幾何懲罰力度。進一步結合在序列末尾復制擴展目標幀的聯合建模策略,模型以持續的幾何引導嚴格鎖定了最終視角的 3D 結構表達。

      性能亮點

      UniGeo 在跨視角幾何一致性與高保真生成質量上實現了全面領跑。在 DL3DV、RE10K 以及 Tanks 等多個權威數據集上,面對大幅度(Extensive)和小幅度(Limited)相機運動的雙重測試,UniGeo 全面超越了 CameraCtrl、MotionCtrl、ViewCrafter、FlexWorld 以及 PE-Field 等現有主流方法,在所有關鍵量化評估指標上均取得了最佳(SOTA)成績。


      在視覺生成效果層面,UniGeo 直擊現有方法在物理結構上的痛點。定性對比結果顯示,現有模型在相機運動(尤其是大范圍視角轉移)下,往往難以維持場景的底層幾何結構,極易產生結構重疊、幾何關系扭曲以及局部內容割裂等嚴重偽影。相比之下,UniGeo 憑借全局統一的幾何引導,在跨視角轉換中展現出了極高的結構穩定性,生成了極為自然、連貫的新視角畫面(圖2)。


      圖2. 定性對比結果

      進一步的中間連續軌跡可視化徹底展現了 UniGeo 的過程優勢。模型能夠極其平滑且精準地模擬由相機運動驅動的連續幾何變換,在整個視角的中間推演過程中保持了高度的結構連貫性。這種平滑的過渡完美契合了真實的物理相機運動規律,從而在全鏈路上保證了最終渲染新視角時的絕對精準與極高畫質(圖3)。


      圖3. 中間軌跡可視化

      總結

      本次發布的相機可控圖像編輯框架 UniGeo 深度探索了視頻擴散模型的連續性先驗與三維幾何約束之間的內在聯系,系統性地在表示層、架構層和損失函數層貫穿了統一的幾何引導,通過全鏈路的三維對齊克服了傳統碎片化幾何注入帶來的結構退化局限,在確保場景結構完整性的同時,建立了極其可靠的跨視角對應關系。

      這種具備高度一致性的連續視角建模能力,在面對各類復雜且大范圍的相機運動時,不僅全面超越了現有方法的幾何可靠性與視覺質量,也為影視后期制作、具身智能感知等高度依賴嚴格空間連貫性的視覺生成任務,提供了原則性且高效的解決方案。

      未來,該團隊將進一步探索連續視頻先驗與真實世界三維空間物理結構之間的深度耦合機制,構建二維視頻生成與三維空間智能之間的橋梁,期望通過整合統一的幾何引導理念來突破現有離散圖像生成模型的局限,進而實現高結構保真、支持復雜場景自由漫游的下一代可控視覺生成模型,為未來的三維視覺生成生態提供重要啟發。

      參考資料:

      https://arxiv.org/pdf/2604.17565

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      如果趙繼偉離開遼籃,下賽季會去哪,依我分析,下家3選1

      如果趙繼偉離開遼籃,下賽季會去哪,依我分析,下家3選1

      男足的小球童
      2026-05-08 19:08:40
      中疾控:本次漢坦病毒疫情涉及的安第斯病毒,我國境內無自然宿主分布

      中疾控:本次漢坦病毒疫情涉及的安第斯病毒,我國境內無自然宿主分布

      界面新聞
      2026-05-08 13:42:14
      “工資存到中信銀行還安全嗎?”員工辦卡被綁第三方,1425元遭支付寶直接劃扣

      “工資存到中信銀行還安全嗎?”員工辦卡被綁第三方,1425元遭支付寶直接劃扣

      山西經濟日報
      2026-05-08 15:40:44
      美3艘軍艦成功駛出海峽、伊朗沒攔住,川普稱不簽協議就繼續打

      美3艘軍艦成功駛出海峽、伊朗沒攔住,川普稱不簽協議就繼續打

      邵旭峰域
      2026-05-08 10:02:59
      五四晚會收視全國第一,一屋子專業歌手,愣是沒唱過兩個跨界演員

      五四晚會收視全國第一,一屋子專業歌手,愣是沒唱過兩個跨界演員

      白面書誏
      2026-05-07 15:05:02
      老頭能留住她,肯定有兩把刷子。

      老頭能留住她,肯定有兩把刷子。

      新時代的兩性情感
      2026-05-08 19:56:07
      戰術大師墨菲因何世錦賽輸吳宜澤?因為他決勝局犯了一個戰術錯誤

      戰術大師墨菲因何世錦賽輸吳宜澤?因為他決勝局犯了一個戰術錯誤

      老高說體育
      2026-05-08 11:14:15
      Model Y勁敵登場!上汽奧迪E7X今日預售:751km續航+3.9秒破百

      Model Y勁敵登場!上汽奧迪E7X今日預售:751km續航+3.9秒破百

      快科技
      2026-05-08 10:36:08
      AI記賬軟件懟用戶159元給父親買壽衣,“壽衣是死人穿的,你爸穿的藍白衫確實像”,官方回應:系AI話術漏洞所致,非人為惡意,已緊急修復

      AI記賬軟件懟用戶159元給父親買壽衣,“壽衣是死人穿的,你爸穿的藍白衫確實像”,官方回應:系AI話術漏洞所致,非人為惡意,已緊急修復

      揚子晚報
      2026-05-06 20:50:03
      特朗普訪華前突然改口,親口承認不得不買中國貨,背后算盤太精明

      特朗普訪華前突然改口,親口承認不得不買中國貨,背后算盤太精明

      阿天愛旅行
      2026-05-08 20:23:18
      上海觀鳥愛好者拍“鳥”,卻被“鳥”揍了!頭部被劃傷…

      上海觀鳥愛好者拍“鳥”,卻被“鳥”揍了!頭部被劃傷…

      上海圈
      2026-05-08 18:25:10
      倫敦世乒賽:林詩棟第2局9-1險輸球!4次吃發球,張禹珍11-13惜敗

      倫敦世乒賽:林詩棟第2局9-1險輸球!4次吃發球,張禹珍11-13惜敗

      劉姚堯的文字城堡
      2026-05-08 20:53:03
      190元榴蓮遭“僅退款”,商家花5000余元驅車1600公里找買家,翻遍垃圾桶找證據,騙取退款的買家已被行拘

      190元榴蓮遭“僅退款”,商家花5000余元驅車1600公里找買家,翻遍垃圾桶找證據,騙取退款的買家已被行拘

      極目新聞
      2026-05-08 13:19:35
      納賽爾:恩里克第一年幾乎每晚都睡在訓練基地,研究球隊發展

      納賽爾:恩里克第一年幾乎每晚都睡在訓練基地,研究球隊發展

      懂球帝
      2026-05-07 23:44:38
      世界杯門票太貴,特朗普驚了:即使是我也不會花1000美元看比賽!央視拒絕花天價買轉播權,底氣何在?“國際足聯可能已經慌了”上熱搜

      世界杯門票太貴,特朗普驚了:即使是我也不會花1000美元看比賽!央視拒絕花天價買轉播權,底氣何在?“國際足聯可能已經慌了”上熱搜

      每日經濟新聞
      2026-05-08 14:58:09
      意媒:國米與薩索洛達成口頭協議,2000萬歐簽穆哈雷莫維奇

      意媒:國米與薩索洛達成口頭協議,2000萬歐簽穆哈雷莫維奇

      懂球帝
      2026-05-08 18:58:17
      5月中旬,財路大開,意外之財接連入賬的三個星座,好好把握

      5月中旬,財路大開,意外之財接連入賬的三個星座,好好把握

      小晴星座說
      2026-05-08 20:52:16
      女子川西徒步身亡后續,遇難全過程曝光,網友一邊倒:不值得同情

      女子川西徒步身亡后續,遇難全過程曝光,網友一邊倒:不值得同情

      削桐作琴
      2026-05-08 00:04:51
      剛剛,暴跌!AI大牛股,突發利空!

      剛剛,暴跌!AI大牛股,突發利空!

      數據寶
      2026-05-08 10:46:11
      瓦倫丁直播,把整個機車圈的臉打腫了!張雪:我的車手不借錢參賽

      瓦倫丁直播,把整個機車圈的臉打腫了!張雪:我的車手不借錢參賽

      小娛樂悠悠
      2026-05-08 09:57:28
      2026-05-08 21:44:49
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      15162文章數 66850關注度
      往期回顧 全部

      科技要聞

      SK海力士平均獎金600萬 工服成相親神器

      頭條要聞

      "大衣哥"再度翻紅:五一假期3天跑5場 累到"要保命"

      頭條要聞

      "大衣哥"再度翻紅:五一假期3天跑5場 累到"要保命"

      體育要聞

      他把首勝讓給隊友,然后用一年時間還清賬單

      娛樂要聞

      古天樂被曝隱婚生子,新娘竟是她

      財經要聞

      特朗普全球關稅又受阻,也能退款?

      汽車要聞

      MG 4X實車亮相 將于5月11日開啟盲訂

      態度原創

      家居
      旅游
      數碼
      公開課
      軍事航空

      家居要聞

      流動的尺度 打破家的形式主義

      旅游要聞

      519中國旅游日 | 去追一場星光,愛上一座城!

      數碼要聞

      華碩天選7系列發布 天選7 Pro/Pro Max已開啟預約

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗:最高領袖穆杰塔巴全面掌控局勢

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: AV天堂中文字幕| 久久国产热这里只有精品| 亚洲精品乱码久久久久久久| 国产精品夜间视频香蕉| 一本视频精品中文字幕| 人妻聚色窝窝人体www一区| 亚洲大尺度无码专区尤物| 人人超碰在线| 在厨房拨开内裤进入在线视频| 人妻无码系列一区二区三区| 久久这里精品国产99丫e6| 日韩偷拍一区二区| 久久婷婷五月综合色一区二区 | 日本在线看片免费人成视频1000| 亚色网站| 亚洲精品国产美女久久久99| 精品久久精品久久人妻| 18禁裸乳无遮挡啪啪无码免费| 青青青国产免费线在| 福利二区| 精品婷婷色一区二区三区蜜桃| 91亚洲人成手机在线观看| 色欲国产精品一区成人精品| 亚洲高清激情一区二区三区| 国产???做受视频| 中文字幕亚洲中文字幕无码码| 亚洲人成网站色7799在线观看| 亚洲一区二区经典在线播放| av无码久久久久久不卡网站| yy19影院| 亚洲精品女同午夜在线| 国产成人自拍视频综合| 国产人妻一区二区三区四区五区六| 四虎库影成人在线播放| 日韩av日韩| 草草影院发布页| 午夜免费福利视频| 亚洲妇女黄色三级视频| 亚洲国产精品午夜电影| mm1313亚洲国产精品无码试看| 欧美第3页|