<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      CMU等團(tuán)隊(duì):PAT3D把文生3D從能看推進(jìn)到能模擬、能交互

      0
      分享至



      論文已被 ICLR 2026 接收,第一作者為 CMU 博士生林谷穎,師從 CMU 的李旻辰教授。研究團(tuán)隊(duì)中還包括 CMU 的 Jun-Yan Zhu 教授、Michael Liu、高睿晗、陳瀚可、陳律豪、盧貝嘉、HKU 的 Taku Komura 教授、黃可蒙,以及 HKUST 的劉緣教授。

      現(xiàn)在的 3D AIGC 已經(jīng)可以很快生成場(chǎng)景,但離真正落地還有一段距離。很多場(chǎng)景看起來還行,一進(jìn)物理模擬就會(huì)暴露問題,比如物體懸空、互相穿插,甚至還沒碰就散。這些問題讓它們很難直接用于游戲、XR 或機(jī)器人等實(shí)際場(chǎng)景。

      問題的根源在于,過去的大多數(shù)文生 3D 方法主要優(yōu)化的是視覺效果:只要渲染出來看起來合理就可以。但這種做法忽略了一個(gè)關(guān)鍵點(diǎn)——場(chǎng)景是否在物理上成立。一旦進(jìn)入模擬環(huán)境,物體之間的接觸、支撐關(guān)系以及整體穩(wěn)定性都會(huì)成為問題,而這些恰恰是實(shí)際應(yīng)用中最關(guān)鍵的部分。

      來自卡耐基梅隆大學(xué)(CMU)、香港大學(xué)(HKU)和香港科技大學(xué)(HKUST)的研究團(tuán)隊(duì)提出了 PAT3D(Physics-Augmented Text-to-3D Scene Generation),嘗試解決這個(gè)問題。他們的目標(biāo)很直接:讓生成的 3D 場(chǎng)景不只是視覺上合理,而是在物理上也站得住,可以直接用于編輯、交互和仿真。



      圖 1:PAT3D 關(guān)注的不只是視覺效果,而是讓場(chǎng)景在模擬中也能成立。



      • 論文標(biāo)題:PAT3D: Physics-Augmented Text-to-3D Scene Generation
      • 論文地址:https://openreview.net/pdf?id=iIRxFkeCuY
      • 論文作者:Guying Lin, Kemeng Huang, Michael Liu, Ruihan Gao, Hanke Chen, Lyuhao Chen, Beijia Lu, Taku Komura, Yuan Liu, Jun-Yan Zhu, Minchen Li
      • 作者單位:卡耐基梅隆大學(xué)、香港大學(xué)、香港科技大學(xué)
      • 項(xiàng)目主頁:https://simulation-intelligence.github.io/PAT3D/
      • 代碼鏈接:https://github.com/Simulation-Intelligence/PAT3D

      PAT3D 是怎么做的?

      PAT3D 的思路可以概括成三步。

      第一階段是3D 物體與空間關(guān)系抽取。系統(tǒng)先根據(jù)文本提示生成一張參考圖,再借助視覺語言模型識(shí)別場(chǎng)景中的物體類別、材質(zhì)和相對(duì)位置,并把圖像分割成多個(gè)對(duì)象區(qū)域。隨后,系統(tǒng)為每個(gè)對(duì)象分別生成 3D 資產(chǎn),而不是把整個(gè)場(chǎng)景直接做成一個(gè)整體網(wǎng)格。這樣做的關(guān)鍵意義在于:后續(xù)每個(gè)物體都能作為獨(dú)立剛體參與接觸、碰撞和支撐關(guān)系計(jì)算。

      第二階段是布局初始化。PAT3D 會(huì)先利用單目深度估計(jì),把 2D 參考圖回投成粗略的 3D 布局,再根據(jù)視覺語言模型抽取出的物體依賴關(guān)系,構(gòu)建一個(gè)層級(jí)化的「場(chǎng)景樹」。這個(gè)「場(chǎng)景樹」描述的不是普通語義標(biāo)簽,而是沿重力方向的物理依賴,例如「支撐」「包含」等。在此基礎(chǔ)上,PAT3D 會(huì)對(duì)初始布局做兩類修正:

      一類是同層物體之間的水平去重疊,避免兄弟節(jié)點(diǎn)互相擠壓;另一類是父子節(jié)點(diǎn)之間沿重力方向的垂直分離,例如讓「杯子里的筆」先處在合理的容器范圍內(nèi)、讓「桌上的書」先位于桌面的支撐區(qū)域之上。這樣得到的初始化場(chǎng)景,不一定已經(jīng)完全穩(wěn)定,但至少是無穿插、適合進(jìn)入物理模擬的。

      第三階段是布局優(yōu)化。PAT3D 引入了 libuipc 的可微剛體仿真,讓物體在重力和接觸力作用下朝靜力平衡狀態(tài)演化。這里更關(guān)鍵的一點(diǎn)是,它并不滿足于「只要物理上站得住就行」。因?yàn)閱慰课锢矸抡妫芏鄨?chǎng)景雖然穩(wěn)定,卻可能偏離文本語義,比如本應(yīng)放在桌上的物體滑落到地面,依然可能是一個(gè)物理上成立的終態(tài)。

      為了解決這個(gè)問題,PAT3D 引入了基于物理模擬的閉環(huán)優(yōu)化:它根據(jù)最終模擬狀態(tài)是否滿足「場(chǎng)景樹」中的包含與支撐關(guān)系,定義語義損失,再把這個(gè)損失反向傳回初始布局,持續(xù)調(diào)整初始位置。這樣,最終得到的不是單純「不會(huì)倒」的場(chǎng)景,而是「既穩(wěn)定、又盡量保留文本語義」的場(chǎng)景。



      圖 2:PAT3D 將物體生成、關(guān)系理解、布局初始化和物理優(yōu)化串聯(lián)成一個(gè)完整流程。

      下面的視頻展示了一個(gè)具體示例的生成過程。

      實(shí)驗(yàn)結(jié)果說明了什么?

      從結(jié)果看,PAT3D 的優(yōu)勢(shì)并不只是「更穩(wěn)定一點(diǎn)」,而是把場(chǎng)景生成從「能展示」推到了「能落地」。在包含 18 個(gè)復(fù)雜提示詞的測(cè)試中,PAT3D 與 GraphDreamer、Blender-MCP、MIDI 等方法進(jìn)行了比較。結(jié)果顯示,PAT3D 在關(guān)鍵物理指標(biāo)上非常突出:繼續(xù)模擬位移為 0,物體穿插比例為 0,物理合理性評(píng)分高達(dá) 88.5。



      圖 3:PAT3D 與現(xiàn)有方法在場(chǎng)景質(zhì)量和物理合理性上的定量對(duì)比。

      更直觀地看,在書本、杯子、餐具、積木、水果籃這些接觸關(guān)系比較復(fù)雜的場(chǎng)景里,PAT3D 能避免物體懸空和模擬后坍塌,并且明顯減少擺放錯(cuò)位。以積木堆疊為例,普通方法生成的布局往往要么不符合物理規(guī)律,要么一進(jìn)入模擬就容易倒掉;而 PAT3D 會(huì)進(jìn)一步調(diào)整初始擺放,使最終穩(wěn)定下來的結(jié)果仍然盡量貼近文本描述。



      圖 4:與已有方法相比,PAT3D 在復(fù)雜接觸場(chǎng)景里更容易得到物理合理的結(jié)果。

      為什么這項(xiàng)工作值得關(guān)注?

      更重要的是,PAT3D 的結(jié)果不是停留在論文圖里的靜態(tài)展示,而是可以直接拿去做后續(xù)任務(wù)。論文里展示了三個(gè)很有代表性的應(yīng)用方向。

      第一個(gè)是場(chǎng)景編輯。當(dāng)用戶刪除一個(gè)筆筒、抽走一本書,或在原有布局上再加一個(gè)物體時(shí),場(chǎng)景不會(huì)立刻變成一團(tuán)穿插或懸空的模型,而是能在模擬中重新達(dá)到平衡。這意味著未來的 3D 內(nèi)容創(chuàng)作可以更像「搭積木」。



      圖 5:PAT3D 支持增刪物體后的物理一致場(chǎng)景編輯。注:此處仿真為準(zhǔn)靜態(tài)。

      第二個(gè)是動(dòng)畫制作。PAT3D 生成的場(chǎng)景本身就滿足基本的物理約束,因此不需要再花很多時(shí)間手動(dòng)修正和調(diào)整初始布局,就可以直接用于后續(xù)動(dòng)畫制作。換句話說,它生成的不只是一個(gè)靜態(tài)場(chǎng)景,而是一個(gè)已經(jīng)為運(yùn)動(dòng)和模擬做好準(zhǔn)備的場(chǎng)景。在傳統(tǒng)的物理仿真動(dòng)畫制作中,場(chǎng)景建模上往往需要花費(fèi)大量時(shí)間,PAT3D 無疑將大大提高其效率。



      圖 6:PAT3D 生成的場(chǎng)景可直接用于后續(xù)動(dòng)畫制作。

      第三個(gè)是機(jī)器人仿真。機(jī)器人通常需要靠模擬環(huán)境檢驗(yàn)學(xué)習(xí)到的抓取、搬運(yùn)和交互策略。如果場(chǎng)景本身存在漂浮、重疊或碰撞不合理等問題,那么訓(xùn)練出來的結(jié)果往往也不可靠。PAT3D 生成的場(chǎng)景可以直接導(dǎo)入模擬器,用來測(cè)試抓取是否成功、操作過程中物體會(huì)不會(huì)傾倒,從而為機(jī)器人訓(xùn)練和評(píng)估提供大量更可信的環(huán)境。



      圖 7:當(dāng)生成的場(chǎng)景能夠直接進(jìn)入機(jī)器人模擬流程,文本到場(chǎng)景的價(jià)值就不再只是展示。左圖展示了成功抓取的例子,右圖展示了失敗抓取的例子。

      PAT3D 的意義,不只是讓生成結(jié)果更好看,而是讓 3D 生成更接近真正可用。隨著生成系統(tǒng)開始同時(shí)理解和處理語義、結(jié)構(gòu)與物理,它面向的也不再只是展示層面的效果,而是更完整的數(shù)字內(nèi)容生產(chǎn)流程,以及機(jī)器人、仿真等更真實(shí)的應(yīng)用場(chǎng)景。

      同時(shí),PAT3D 的成功也讓我們看到將物理仿真用于 3D 生成任務(wù)的巨大潛力。更可貴的是,其源代碼已在 Apache-2.0 許可下開源,這不僅降低了研究復(fù)現(xiàn)與二次開發(fā)的門檻,也為社區(qū)進(jìn)一步驗(yàn)證、擴(kuò)展和落地這一路線提供了堅(jiān)實(shí)基礎(chǔ)。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      江蘇省“臭名昭著”的四所大學(xué)!畢業(yè)證猶如廢紙,學(xué)生謹(jǐn)慎報(bào)考

      江蘇省“臭名昭著”的四所大學(xué)!畢業(yè)證猶如廢紙,學(xué)生謹(jǐn)慎報(bào)考

      寂寞染指悲傷
      2026-05-14 05:18:26
      黃仁勛這次為什么不穿皮夾克?

      黃仁勛這次為什么不穿皮夾克?

      麥杰遜
      2026-05-14 18:07:51
      魯比奧仰頭那一瞥,人民大會(huì)堂的天花板憑什么讓美國(guó)國(guó)務(wù)卿挪不開眼?

      魯比奧仰頭那一瞥,人民大會(huì)堂的天花板憑什么讓美國(guó)國(guó)務(wù)卿挪不開眼?

      愛下廚的阿釃
      2026-05-15 11:20:46
      太逆天了!中國(guó)的“強(qiáng)大密碼”,西方羨慕死了

      太逆天了!中國(guó)的“強(qiáng)大密碼”,西方羨慕死了

      毛豆論道
      2026-05-10 17:41:34
      帥位告急!若本賽季再次無緣冠軍,阿爾特塔或遭阿森納解雇

      帥位告急!若本賽季再次無緣冠軍,阿爾特塔或遭阿森納解雇

      星耀國(guó)際足壇
      2026-05-15 12:12:30
      形勢(shì)有多嚴(yán)峻?坐標(biāo)上海:80末90初程序員都開始失業(yè),評(píng)論區(qū)炸了

      形勢(shì)有多嚴(yán)峻?坐標(biāo)上海:80末90初程序員都開始失業(yè),評(píng)論區(qū)炸了

      番外行
      2026-05-15 09:05:39
      什么是基本盤?什么又是愛國(guó)?

      什么是基本盤?什么又是愛國(guó)?

      十柱
      2026-05-14 12:44:22
      33℃!中到大雨!局部暴雨!天氣最新預(yù)測(cè)

      33℃!中到大雨!局部暴雨!天氣最新預(yù)測(cè)

      錫城頭條
      2026-05-15 10:21:33
      禹作敏最囂張的時(shí)候有多無法無天?

      禹作敏最囂張的時(shí)候有多無法無天?

      尚書喬
      2024-11-10 00:00:03
      姆巴佩出場(chǎng) 6萬人漫天狂噓!賽后好戲:皇馬將帥隔空交鋒

      姆巴佩出場(chǎng) 6萬人漫天狂噓!賽后好戲:皇馬將帥隔空交鋒

      葉青足球世界
      2026-05-15 09:42:10
      世乒賽獎(jiǎng)金大曝光!王楚欽65萬,梁靖崑爭(zhēng)議最大

      世乒賽獎(jiǎng)金大曝光!王楚欽65萬,梁靖崑爭(zhēng)議最大

      不想長(zhǎng)大的莫扎特
      2026-05-15 12:16:02
      日本乒協(xié)沒想到,世乒賽慘敗中國(guó)隊(duì)后,最先扛不住的,是張本智和

      日本乒協(xié)沒想到,世乒賽慘敗中國(guó)隊(duì)后,最先扛不住的,是張本智和

      素衣讀史
      2026-05-14 20:50:33
      帶領(lǐng)成都蓉城斬獲2勝1平,約翰-阿洛伊西當(dāng)選中超3月最佳教練

      帶領(lǐng)成都蓉城斬獲2勝1平,約翰-阿洛伊西當(dāng)選中超3月最佳教練

      懂球帝
      2026-05-15 11:07:10
      重磅!國(guó)產(chǎn)第四代肺癌靶向藥獲突破,三代藥耐藥緩解率達(dá)52.9%

      重磅!國(guó)產(chǎn)第四代肺癌靶向藥獲突破,三代藥耐藥緩解率達(dá)52.9%

      牛鍋巴小釩
      2026-05-15 01:53:05
      八路軍最慘痛一戰(zhàn),看完?duì)奚呒?jí)將領(lǐng)名單,主席:取消政委決定權(quán)

      八路軍最慘痛一戰(zhàn),看完?duì)奚呒?jí)將領(lǐng)名單,主席:取消政委決定權(quán)

      馬捗在解說
      2026-05-08 14:50:30
      乒乓球全錦賽延期!原因:與王楚欽和孫穎莎有關(guān),球迷力挺王勵(lì)勤

      乒乓球全錦賽延期!原因:與王楚欽和孫穎莎有關(guān),球迷力挺王勵(lì)勤

      老王大話體育
      2026-05-15 12:19:44
      同樣2-3輸梁靖崑!大勒布倫與女友秀恩愛曬銅牌,張本智和卻被罵慘了!

      同樣2-3輸梁靖崑!大勒布倫與女友秀恩愛曬銅牌,張本智和卻被罵慘了!

      好乒乓
      2026-05-15 12:30:26
      她為兒子30年不嫁,兒子墓前哭:來生還做您兒子!

      她為兒子30年不嫁,兒子墓前哭:來生還做您兒子!

      東方不敗然多多
      2026-05-14 18:01:16
      “23歲研究生被少年無證駕車撞致顱腦損傷”追蹤:當(dāng)?shù)卣疄槠渖贽k困難補(bǔ)助,愛心網(wǎng)友捐款相助

      “23歲研究生被少年無證駕車撞致顱腦損傷”追蹤:當(dāng)?shù)卣疄槠渖贽k困難補(bǔ)助,愛心網(wǎng)友捐款相助

      紅星新聞
      2026-05-14 21:02:57
      格局拉滿!米切爾賽后狂贊哈登:他為大場(chǎng)面而生,冷靜感染全隊(duì)!

      格局拉滿!米切爾賽后狂贊哈登:他為大場(chǎng)面而生,冷靜感染全隊(duì)!

      田先生籃球
      2026-05-14 14:48:37
      2026-05-15 13:07:00
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      13001文章數(shù) 142648關(guān)注度
      往期回顧 全部

      科技要聞

      兩年聯(lián)姻一地雞毛,傳蘋果OpenAI瀕臨決裂

      頭條要聞

      歡迎宴會(huì)座位公開:馬斯克黃仁勛與中國(guó)企業(yè)家同桌吃飯

      頭條要聞

      歡迎宴會(huì)座位公開:馬斯克黃仁勛與中國(guó)企業(yè)家同桌吃飯

      體育要聞

      德約科維奇買的球隊(duì),從第6級(jí)聯(lián)賽升入法甲

      娛樂要聞

      方媛回應(yīng)住男生單人間:女孩的配得感

      財(cái)經(jīng)要聞

      特朗普的北京時(shí)刻

      汽車要聞

      雙零重力座椅/AI智能體/調(diào)光天幕 啟境GT7內(nèi)飾發(fā)布

      態(tài)度原創(chuàng)

      藝術(shù)
      教育
      手機(jī)
      房產(chǎn)
      公開課

      藝術(shù)要聞

      一個(gè)北大 “反卷教授” 的意外走紅

      教育要聞

      在地球另一端,我成了這所小眾留學(xué)院校法學(xué)院的首位中國(guó)學(xué)生

      手機(jī)要聞

      紅魔11S Pro系列手機(jī)搭載8000mAh電池,自帶80W氮化鎵充電器

      房產(chǎn)要聞

      海南樓市新政要出!擬調(diào)公積金貸款額度,最高可貸168萬!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 少妇人妻精品一区二区| 国内精品久久久久影院嫩草| 日日添夜夜操试看一二区| 四虎成人精品国产永久免费| 国产一区二区视频啪啪视频| 亚洲中文字幕成人综合网| 两个奶头被吃高潮视频| 国产精品无码不卡在线播放| 日本成人在线网站| 一本大道无码av天堂| 四虎库影成人在线播放| 欧美青青草| 亚洲AV综合色区无码| 久久天堂综合亚洲伊人HD| 婷婷开心激情综合五月天| 国产av综合色高清自拍| 亚洲中文字幕系列| 欧美一区二区日韩国产| 大肉大捧一进一出好爽| 日本一区三区高清视频| va亚洲三区| 国产成视频在线观看| 色综合另类小说图片区| 狼友看片| 亚洲日本成人| 久久无码中文字幕免费影院| 久久人人爽天天玩人人妻精品| 强行糟蹋人妻hd中文| 国产美女久久久亚洲综合| 91青青草视频在线观看| 老司机亚洲精品影院| 国产精品成人一区二区三| 久久无码网站| 美腿丝袜亚洲综合第一页| 亚洲AV怡红院影院怡春院| 丝袜 亚洲 另类 欧美 变态| 精精国产XXX在线观看| 国产精品成人免费一区久久羞羞| 亚洲午夜视频| 无码AV无码免费一区二区| 日韩一区中文免费视频|