<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      別被「更像真的視頻」騙了,AI視頻生成,還遠(yuǎn)未真正學(xué)會(huì)物理世界

      0
      分享至



      這兩年,視頻生成模型進(jìn)步很快。清晰度更高了,鏡頭更穩(wěn)了,人物和場(chǎng)景看上去也越來越自然。很多時(shí)候,我們判斷一個(gè)模型強(qiáng)不強(qiáng),看的就是它 “像不像真的”。但這其實(shí)只回答了一半的問題:它看起來像真的,不代表它真的符合現(xiàn)實(shí)世界的物理規(guī)律。這件事放在短視頻生成里,也許只是 “偶爾有點(diǎn)怪”;但如果視頻模型真的要往 world model、仿真系統(tǒng)、具身智能這些方向走,問題就不一樣了。一個(gè)模型如果連物體怎么接觸、狀態(tài)怎么變化、事件怎么按因果順序發(fā)生都搞不清楚,那它再像,也只是像。



      現(xiàn)在的視頻評(píng)測(cè),更像是在比 “好不好看”

      目前,視頻生成領(lǐng)域常見的評(píng)測(cè)方式,要么看自動(dòng)指標(biāo),要么讓人直接選 “哪個(gè)視頻更好”。這種方式當(dāng)然有意義,它能比較清晰度、流暢度、觀感這些東西,但它很難告訴你:視頻里到底有沒有違反基本物理常識(shí)

      比如,一個(gè)物體是不是無緣無故消失了;兩個(gè)東西是不是明明沒接觸卻發(fā)生了交互;一個(gè)動(dòng)作的結(jié)果是不是和前面的過程根本對(duì)不上。這些問題,才真正關(guān)系到模型是在 “生成一個(gè)像真的畫面”,還是在 “模擬一個(gè)可信的世界”。

      Physion-Eval:從 “視覺真實(shí)” 走向 “物理真實(shí)” 的新 benchmark

      這篇工作提出了Physion-Eval。它不是再做一個(gè) “誰的視頻更好看” 的排行榜,而是想認(rèn)真回答一個(gè)更關(guān)鍵的問題:AI 生成的視頻,在物理層面到底有多真實(shí)



      • 論文標(biāo)題: Physion-Eval: Evaluating Physical Realism in Generated Video via Human Reasoning
      • 作者: Qin Zhang, Peiyu Jing, Hong-Xing Yu, Fangqiang Ding, Fan Nie, Weimin Wang, Yilun Du, James Zou, Jiajun Wu, and Bing Shuai
      • 作者單位:Physion Labs,斯坦福大學(xué),MIT,哈佛大學(xué),Character AI
      • 論文鏈接: https://arxiv.org/abs/2603.19607
      • 數(shù)據(jù)集鏈接: https://huggingface.co/datasets/PhysionLabs/Physion-Eval
      • 視頻鏈接:https://www.youtube.com/watch?v=Vbn_W3WNUHw

      這個(gè) benchmark 同時(shí)覆蓋第一人稱和第三人稱場(chǎng)景,包含10,990 條專家推理軌跡,覆蓋22 類細(xì)粒度物理現(xiàn)象。和常見評(píng)測(cè)不太一樣的地方在于,這里的每條樣本不只是簡(jiǎn)單打個(gè)分,而是會(huì)標(biāo)出錯(cuò)誤發(fā)生在什么時(shí)候、屬于哪一類問題,以及為什么不對(duì)

      數(shù)據(jù)上,第三人稱部分來自WISA-80K,第一人稱部分基于EPIC-KITCHENS構(gòu)建。為了保證標(biāo)注質(zhì)量,論文組織了90 位具有 STEM 背景并接受過本科物理訓(xùn)練的專家標(biāo)注者,采用雙人標(biāo)注和資深專家裁決的流程,最后得到的是帶時(shí)間戳、錯(cuò)誤類別和文字解釋的高質(zhì)量標(biāo)注。

      在這一過程中,人類智能所展現(xiàn)出的優(yōu)勢(shì)尤為明顯:人類不僅能夠識(shí)別視覺上的異常,更能夠基于物理直覺與因果理解,對(duì)復(fù)雜的動(dòng)態(tài)過程進(jìn)行推理和解釋。相比之下,即使是當(dāng)前最先進(jìn)的多模態(tài)模型,在時(shí)序一致性、交互合理性以及隱含物理規(guī)律的判斷上,仍存在明顯不足。





      最直接的結(jié)論:現(xiàn)在的模型,還遠(yuǎn)談不上 “物理一致”

      這篇工作的主結(jié)論其實(shí)很簡(jiǎn)單,也很扎眼:在物理過程敏感的場(chǎng)景里,83.3% 的第三人稱生成視頻和 93.5% 的第一人稱生成視頻,都至少包含一個(gè)人類可以明確識(shí)別的物理錯(cuò)誤。這說明什么?說明今天的視頻模型確實(shí)越來越會(huì)制造 “真實(shí)感” 了,但離 “真正符合物理規(guī)律” 還有很遠(yuǎn)。



      而且這些錯(cuò)誤不是零零散散的小毛病,而是系統(tǒng)性的。論文里總結(jié)的典型問題包括:接觸或交互失敗、對(duì)象突然出現(xiàn)或消失、時(shí)間連貫性崩塌、因果順序錯(cuò)亂、材料或狀態(tài)變化異常、幾何碰撞不合理等等。換句話說,問題不只是 “畫面有點(diǎn)假”,而是模型對(duì)物體、接觸、運(yùn)動(dòng)和結(jié)果之間最基本的關(guān)系,還經(jīng)常搞錯(cuò)。



      很多錯(cuò)誤不是粗糙,而是 “看著像,但其實(shí)完全不對(duì)”

      Physion-Eval 里最有意思的地方,其實(shí)是那些具體例子。它們不是那種一眼就看出來的低級(jí) bug,而是第一眼好像還行,仔細(xì)一想?yún)s明顯不符合常識(shí)。

      比如,桌面上突然多出一把本來不存在的刀;瓶口朝下,液體卻不往下流;水直接穿過鍋底;又或者一個(gè)鍋被兩根手指以幾乎不可能的方式拎起來。它們的問題不在于 “渲染不精細(xì)”,而在于直接違背了物體守恒、重力、不可穿透性和穩(wěn)定接觸這些最基本的物理規(guī)律。

      這也是為什么我們覺得,這項(xiàng)工作不只是 “又多了一個(gè) benchmark”。它更像是在提醒大家:今天很多模型也許已經(jīng)很會(huì)生成 “像真的視頻”,但還遠(yuǎn)沒有學(xué)會(huì) “世界為什么會(huì)這樣動(dòng)”。





      更麻煩的是,連最強(qiáng)的多模態(tài)模型也不太會(huì)看這些錯(cuò)誤

      論文還問了另一個(gè)很現(xiàn)實(shí)的問題:那能不能讓現(xiàn)在的大模型來當(dāng) “自動(dòng)評(píng)委”,替人判斷一個(gè)視頻有沒有物理問題?

      答案是,暫時(shí)還不行。

      文章評(píng)估了10 個(gè)開源和閉源的 MLLM critic,結(jié)果顯示,它們和人類判斷之間還有明顯差距。以Gemini 3.0 Pro為例,它會(huì)漏掉超過74.4% 的第三人稱錯(cuò)誤視頻和 90.1% 的第一人稱錯(cuò)誤視頻。而且它們不只是漏檢,還會(huì)把錯(cuò)誤發(fā)生的時(shí)間說錯(cuò),甚至編出根本不存在的原因。

      這點(diǎn)其實(shí)很關(guān)鍵。因?yàn)槿绻院蟠蠹艺嫦肟孔詣?dòng) critic 去評(píng)估 world model 或視頻生成系統(tǒng),那 critic 本身至少得先真的看懂視頻里的物理過程。就目前來看,人類判斷依然是最可靠的標(biāo)準(zhǔn)。









      越是高動(dòng)態(tài)的物理過程,越容易暴露當(dāng)前模型的短板

      論文進(jìn)一步從physical intensitydynamics兩個(gè)維度分析了生成模型與市面上已有的 MLLM critic 的表現(xiàn)。結(jié)果表明,相比強(qiáng)度大小,過程本身的動(dòng)態(tài)性和復(fù)雜性更容易暴露視頻生成模型的物理建模缺陷。對(duì) MLLM critic 來說也是如此:只有當(dāng)錯(cuò)誤足夠明顯時(shí),它們才會(huì)表現(xiàn)出有限的判斷能力,但整體仍明顯落后于人類。







      總結(jié)

      Physion-Eval 想指出的,不只是 “現(xiàn)在的視頻生成模型還不夠強(qiáng)”,而是一個(gè)更根本的問題:當(dāng)行業(yè)越來越關(guān)注視頻 “看起來有多真” 的時(shí)候,我們可能忽略了它 “實(shí)際上對(duì)不對(duì)”

      對(duì)于真正想做 world model、機(jī)器人、具身智能和仿真的人來說,這個(gè)問題繞不過去。畫面更清晰、動(dòng)作更順滑,當(dāng)然重要;但如果物體會(huì)無故出現(xiàn),液體不會(huì)往下流,動(dòng)作結(jié)果和前因?qū)Σ簧希悄P途瓦€沒有真正學(xué)會(huì)世界的運(yùn)行方式。

      視頻生成下一階段,也許不該只繼續(xù)卷觀感,而應(yīng)該更認(rèn)真地去解決物體持續(xù)性、接觸關(guān)系、狀態(tài)變化、時(shí)序一致性和因果結(jié)構(gòu)這些更本質(zhì)的問題。“看起來對(duì)”,從來不等于 “實(shí)際上對(duì)”

      作者介紹

      本文由來自美國(guó)頂級(jí)科技公司與世界一流高校的豪華作者陣容共同完成,集結(jié) Physion Labs、斯坦福大學(xué)、MIT、哈佛大學(xué)及 Character AI 的核心研究者。其中,Physion Labs 團(tuán)隊(duì)(Qin Zhang、Peiyu Jing、Bing Shuai)長(zhǎng)期專注于生成式視頻與世界模型中的物理一致性問題,構(gòu)建了面向行業(yè)的評(píng)估基礎(chǔ)設(shè)施與數(shù)據(jù)閉環(huán),致力于成為下一代生成模型的 “物理可信層”。其余作者包括斯坦福大學(xué)的 Hong-Xing Yu、Fan Nie、James Zou、Jiajun Wu,麻省理工學(xué)院的 Fangqiang Ding,哈佛大學(xué)的 Yilun Du,以及 Character AI 的 Weimin Wang 等業(yè)內(nèi)頂尖學(xué)者。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      醫(yī)生發(fā)現(xiàn):過了六十歲,凡是白發(fā)少的老人,大多都有這2個(gè)共性

      醫(yī)生發(fā)現(xiàn):過了六十歲,凡是白發(fā)少的老人,大多都有這2個(gè)共性

      垚垚分享健康
      2026-05-03 15:25:09
      大師賽之王即將誕生!辛納29連勝追平費(fèi)德勒,沖擊史無前例的紀(jì)錄

      大師賽之王即將誕生!辛納29連勝追平費(fèi)德勒,沖擊史無前例的紀(jì)錄

      體育妞世界
      2026-05-10 09:25:48
      社保局提醒:退休證不算啥!這三張“保命紙”不辦,晚年虧大了

      社保局提醒:退休證不算啥!這三張“保命紙”不辦,晚年虧大了

      起喜電影
      2026-05-10 14:12:17
      拆開中國(guó)無人機(jī)一看,美媒心涼透了,若插手臺(tái)海,美軍必?cái)o疑?

      拆開中國(guó)無人機(jī)一看,美媒心涼透了,若插手臺(tái)海,美軍必?cái)o疑?

      最新聲音
      2026-05-10 02:09:58
      鎖死海峽!阿聯(lián)酋突襲伊朗,埃及陣風(fēng)戰(zhàn)機(jī)馳援:伊朗遭遇兇險(xiǎn)包圍

      鎖死海峽!阿聯(lián)酋突襲伊朗,埃及陣風(fēng)戰(zhàn)機(jī)馳援:伊朗遭遇兇險(xiǎn)包圍

      知法而形
      2026-05-08 16:39:04
      功夫巨星新片慘敗,三天沒有票房統(tǒng)計(jì),觀眾差評(píng)如潮

      功夫巨星新片慘敗,三天沒有票房統(tǒng)計(jì),觀眾差評(píng)如潮

      影視高原說
      2026-05-10 13:09:18
      烏軍精準(zhǔn)點(diǎn)穴令普京暴怒,澤連斯基批準(zhǔn)莫斯科免死區(qū)域

      烏軍精準(zhǔn)點(diǎn)穴令普京暴怒,澤連斯基批準(zhǔn)莫斯科免死區(qū)域

      西樓飲月
      2026-05-09 16:34:50
      任何一個(gè)男人到了六十歲后,只要還對(duì)異性懷有欣賞與追求,往往因?yàn)檫@兩件事

      任何一個(gè)男人到了六十歲后,只要還對(duì)異性懷有欣賞與追求,往往因?yàn)檫@兩件事

      心理觀察局
      2026-05-04 08:51:11
      林彪準(zhǔn)兒媳張寧:獨(dú)子被水管工報(bào)復(fù)沉河,逃去美國(guó)當(dāng)闊太后為何躲進(jìn)深山當(dāng)了道士?

      林彪準(zhǔn)兒媳張寧:獨(dú)子被水管工報(bào)復(fù)沉河,逃去美國(guó)當(dāng)闊太后為何躲進(jìn)深山當(dāng)了道士?

      史海孤雁
      2026-05-07 18:01:13
      1985年,國(guó)安叛徒藏身南美,中國(guó)6名兵王萬里鋤奸,F(xiàn)BI顏面盡失

      1985年,國(guó)安叛徒藏身南美,中國(guó)6名兵王萬里鋤奸,F(xiàn)BI顏面盡失

      干史人
      2026-04-14 21:10:03
      喬治:必須向布倫森致敬 他總能找到自己的進(jìn)攻位置

      喬治:必須向布倫森致敬 他總能找到自己的進(jìn)攻位置

      北青網(wǎng)-北京青年報(bào)
      2026-05-10 10:22:18
      烏克蘭收復(fù)克里米亞在望,普京面臨歷史性挑戰(zhàn)。

      烏克蘭收復(fù)克里米亞在望,普京面臨歷史性挑戰(zhàn)。

      世界探索發(fā)現(xiàn)
      2026-05-06 18:27:11
      50歲查理茲·塞隆自曝不婚原因:睡小鮮肉太爽了!

      50歲查理茲·塞隆自曝不婚原因:睡小鮮肉太爽了!

      阿廢冷眼觀察所
      2026-05-05 14:57:32
      韓國(guó)瑜訪歐嘆臺(tái)灣處境艱難,稱呼吸新鮮空氣都難

      韓國(guó)瑜訪歐嘆臺(tái)灣處境艱難,稱呼吸新鮮空氣都難

      原來仙女不講理
      2026-05-10 11:04:17
      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實(shí)情

      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實(shí)情

      健康科普365
      2026-05-09 21:05:04
      一分不得!廣東最強(qiáng)引援完全活在集錦里,球迷:給嘉爺打替補(bǔ)不冤

      一分不得!廣東最強(qiáng)引援完全活在集錦里,球迷:給嘉爺打替補(bǔ)不冤

      弄月公子
      2026-05-10 15:06:46
      吃他汀猝死的人增多?醫(yī)生含淚苦勸:天熱吃他汀,必須多注意4點(diǎn)

      吃他汀猝死的人增多?醫(yī)生含淚苦勸:天熱吃他汀,必須多注意4點(diǎn)

      健康科普365
      2026-05-10 13:55:09
      釋永信被一女子爆料:她們姐妹住少林寺3天,爭(zhēng)著往釋永信房間跑

      釋永信被一女子爆料:她們姐妹住少林寺3天,爭(zhēng)著往釋永信房間跑

      江山揮筆
      2026-03-23 15:40:31
      回顧遼寧一廠長(zhǎng)邀15名歌廳舞女做客,喝完酒后,將15人沖進(jìn)下水道

      回顧遼寧一廠長(zhǎng)邀15名歌廳舞女做客,喝完酒后,將15人沖進(jìn)下水道

      談史論天地
      2026-04-27 15:00:03
      1986年的運(yùn)10下馬案,位列中國(guó)30年重大間諜案首位,真相令人扼腕

      1986年的運(yùn)10下馬案,位列中國(guó)30年重大間諜案首位,真相令人扼腕

      干史人
      2026-01-12 22:07:50
      2026-05-10 16:24:49
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      12957文章數(shù) 142647關(guān)注度
      往期回顧 全部

      科技要聞

      DeepSeek融資,改寫所有人的估值

      頭條要聞

      七旬鄰居凌晨爬窗入室無刑責(zé) 上海男子全家被逼搬離

      頭條要聞

      七旬鄰居凌晨爬窗入室無刑責(zé) 上海男子全家被逼搬離

      體育要聞

      詹姆斯生涯第6次0-3困境:今年會(huì)被橫掃嗎

      娛樂要聞

      大S女兒玥兒開通賬號(hào),用煙花緬懷母親

      財(cái)經(jīng)要聞

      白酒大逃殺

      汽車要聞

      軸距加長(zhǎng)/智駕拉滿 阿維塔07L定位大五座SUV

      態(tài)度原創(chuàng)

      教育
      家居
      手機(jī)
      本地
      游戲

      教育要聞

      去年中考628分,放棄前三所重高選擇職高,這位女生如今怎么樣?

      家居要聞

      菁英人居 全能豪宅

      手機(jī)要聞

      HarmonyOS 7將至?華為開發(fā)者大會(huì)HDC 2026活動(dòng)詳情公布

      本地新聞

      用蘇繡的方式,打開江西婺源

      《GTA6》進(jìn)入沖刺階段!終極爆料匯總來了

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产成人午夜精品福利视频| 国产日韩成人内射视频| 少妇精品久久久一区二区三区| 亚洲国产精品综合久久20| 欧美日韩成人| 国产一区二区三区不卡视频| 韩国三级丰满少妇高潮| 人人妻人人添人人爽欧美一区| 欧美乱伦视频| 日本亚洲色大成网站www久久| 高清乱码一区二区三区| 亚洲人成网站77777在线观看| 熟女在线播放| 欧美怡红院视频一区二区三区| 香蕉97超级碰碰碰免费公| 丁香婷婷色| 色综合久久中文字幕无码| 性大毛片视频| 亚洲精品亚洲人成在线观看下载 | 国产成人啪精品午夜网站| 久久www色情成人免费观看| 亚洲熟妇丰满大屁股熟妇| 亚洲更新最快无码视频| 亚洲精品久久无码av片| 国内精品人妻一区二区三区| 黄色精品视频网站| 国产亚洲成人综合| 九九re6热在线视频精品66| 国产精品一区2区三区| 免费高清欧美一区二区三区| 中文字幕国产精品自拍| 亚洲乱码精品乱码精品中文| 野外少妇被弄到喷水在线观看| 色色午夜| 免费在线色| 国产手机在线精品| 亚洲va| 国产高潮流白浆喷水免费a片| 日韩av日韩| 无码人妻一区二区三区免费九色| 久久国内精品自在自线400部|