<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      證據攤開看,場景圖畫清:讓流式視頻大模型拿捏「何時開口」

      0
      分享至



      隨著多模態技術和大語言模型的發展,人類與 AI 的交互關系正在從「命令 - 執行」走向真正的共生。AI 將不再只是等待人類指令再執行的工具,而是與人類共處同一時空的主動智能體。

      它們像人類一樣持續地感知動態環境,基于環境理解和內部目標,主動向他人發起交互(例如主動提醒「杯子要掉了」或在關鍵時刻主動詢問「需要幫助嗎」)。

      同時,視覺作為現實世界最豐富、最自然的感知媒介,是主動智能體理解外部環境的核心窗口。在這種持續的外部感知和響應判斷下,視頻的輸入特征從「離線轉為在線」。

      換言之,智能體所承載的視頻大模型(Video-LLM),不再是整段看完再作答的離線推理系統,而應像人類一樣邊看邊判斷:在響應條件不足時保持克制,在關鍵證據出現時果斷響應交互。

      因此,在這種流式主動交互場景下,視頻大模型真正棘手的,不只是「能不能看懂某一幀」,還有「該不該在這一秒開口」。然而,要把「證據是否足夠」做成穩定、可泛化的決策,現有方法往往仍把視覺證據與問題語義中的響應條件藏在隱式表征里,難以做到精細對齊和對「響應時機」的深刻理解。

      為了解決這一痛點,來自西北工業大學、香港科技大學、清華大學等的研究團隊在 ACL 2026 上提出了一種基于證據 - 條件結構化對齊的流式視頻理解主動交互框架。該方法以顯式場景圖(Scene Graph)為統一表示,把流式觀測到的「視覺證據」與用戶查詢所蘊含的「響應條件」進行顯式建模,并結合記憶檢索與觸發式提示,在無需微調的方式下完成流式「靜默 / 響應」決策。



      • 論文標題:Response-G1: Explicit Scene Graph Modeling for Proactive Streaming Video Understanding
      • 論文鏈接:https://arxiv.org/abs/2605.07575
      • 代碼倉庫:https://github.com/kadmkbl/Response-G1

      主動流式交互的裂縫:當證據與條件被「藏」在隱式表征里

      流式主動交互的關鍵難點并不只在于內容生成,還在于每一時間步都要思考一個底層的問題:當前累積的視覺證據,是否已經滿足用戶問題所隱含的響應條件?

      一旦這個判斷依賴隱式的證據 - 條件理解,模型就很容易在「相似幀」之間搖擺:視覺上幾乎一樣,但「該不該說」的標簽卻可能相反。這也是許多需要幀級標注的訓練路線的方法難以泛化的根源之一。

      而在無需微調的路線中,幀間差異閾值等基于規則的方法實現簡單,卻容易把「畫面變化」誤當成「語義條件滿足」,從而忽略用戶響應需求。另一方面,基于觸發提示的方法(直接詢問大模型是否在當前時刻響應)雖能更加理解響應需求,但現有工作仍未顯式地構建證據與條件,對響應時機的理解缺少可核對的中間結構。

      Response-G1 的切入點因此非常直接:用戶問題中的響應條件往往對應一個由物體、屬性與關系構成的結構化期望場景,場景圖為此提供了顯式的證據對齊方式,讓「證據是否足夠」不再依賴隱式表征,而轉由可解釋的中間結構進行逐項核對。



      圖 1. 流式視頻理解中的主動機制對比

      Response-G1 總覽:把「時機判斷」變成可解釋的圖對齊問題

      Response-G1 將流程組織為三個彼此銜接、且都可視為「推理增強」的模塊:在線查詢引導的場景圖生成(流式證據建模)、基于動態記憶庫的場景圖檢索(證據 - 條件對齊),以及檢索增強的流式觸發決策(主動交互決策)。

      框架不改變骨干視頻大模型的訓練目標與參數更新方式,主要通過結構化中間表示與檢索上下文,把模型的「響應判斷」從黑箱里往外拽半步。

      • 在線查詢引導的場景圖生成:對以當前時刻為中心的流式視頻片段,模型輸出場景圖節點(物體及其屬性)與邊(關系謂詞),并以三元組集合形式表示。為抑制與問題無關的細節,生成提示中注入用戶查詢,使視頻大模型優先抽取與問題相關的子結構,從而得到查詢敏感、證據聚焦的圖表示。



      • 基于記憶的場景圖檢索:為實現細粒度的「證據 - 條件」匹配對齊,框架維護隨時間增長的記憶庫,存儲歷史時刻生成的場景圖。檢索時,將各圖的三元組線性化為自然語言短語并拼接,同時對用戶查詢解析得到響應條件圖及其文本表示;二者經同一文本編碼器嵌入后做均值池化,以余弦相似度衡量語義相關性,并取 Top-K 子圖作為對齊證據上下文。



      • 檢索增強的流式觸發與回答:在每一需要決策的時間步,模型輸入由視頻幀嵌入、帶時間戳前綴的檢索場景圖編碼以及觸發指令(例如「現在是否應該回答?僅回答 Yes/No」)共同構成。若判定為靜默,則繼續累積觀測;若判定為響應,則在與交互決策一致的上下文中拼接原始問題,生成最終自然語言響應。





      圖 2. Response-G1 框架概覽

      實驗結果:主動式大幅領先,被動式同步受益

      研究團隊在主流流式視頻理解基準 OVO-Bench 與 StreamingBench 上開展評估,并區分主動式(模型自主決定響應時刻)與被動式(響應時刻與提問時刻一致)子任務。實現上采用 Qwen3-VL-8B 作為模型骨干,并遵循既有工作對輸入分辨率與幀采樣策略的設置。

      實驗結果顯示,在主動式子任務方面,Response-G1 在開源流式視頻大模型上提升顯著:在 OVO-Bench 上,Response-G1 提升了12.8%;在 StreamingBench 的 PO 子任務上,提升達15.1%。在被動式子任務方面,Response-G1 也形成穩定增益。

      這表明,顯式場景圖不僅改善「何時說」,而且在有時空推理需求的用戶問題上,也有助于「說得準」。



      表 1. OVO-Bench 上的性能對比(主動式子任務為 Forward Active Responding;其余子任務為被動式設定)



      表 2. StreamingBench 上的性能對比(主動式子任務為 PO;其余子任務為被動式設定)

      消融與流式主動交互案例

      消融實驗表明:(1)引入基于場景圖的檢索增強可同步提升主動式與被動式流式視頻理解的表現,而引入時間戳的場景圖編碼一定程度地提升了模型的證據理解。(2)在流式視頻的場景圖證據在線生成階段,「查詢引導」優于「目標引導」策略,后者可能誘發模型生成不存在的場景圖三元組證據并導致過早響應問題。



      表 3. 消融實驗(左:不同檢索增強策略的有效性;右:不同證據生成引導策略的有效性)

      可視化案例展示了一個需要等待證據線索逐步顯露的流式視頻主動交互場景(用戶提問:「一個穿著紅色 T 恤的男孩在離開后做了什么事情?」)。

      結果表明,在時間「18:51」處,Response-G1 準確檢索到與查詢相關的場景圖(即證據)并觸發響應,而基線方法在整個視頻流中均始終未能作出響應。



      圖 3. 流式視頻主動式交互可視化案例

      結語

      該研究的意義在于:它把主動交互流式視頻理解里難以捉摸的「時機」問題,通過顯式的統一的圖表示,轉寫為更可解釋、可調試的「證據 - 條件對齊」問題。

      在視頻大模型逐步走向真實在線、主動交互的當下,這種結構化中間表示或許能為后續的多模態全能助手、長流式記憶與更復雜的人機協同,提供一個更可組合的底座。

      作者介紹

      本文作者馬可(https://kadmkbl.github.io)、唐家祺(https://jqt.me),分別來自西北工業大學和香港科技大學的博士研究生,研究方向為多模態大模型與智能體。

      通訊作者是西北工業大學的郭斌教授(http://guob.org),長期從事普適計算、群智感知、具身智能及智能物聯網等領域的研究。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      看了《主角》,對比翟子路和竇驍,我想說:男演員還是要看演技

      看了《主角》,對比翟子路和竇驍,我想說:男演員還是要看演技

      老羴學科普
      2026-05-27 06:38:11
      美國被踢出局,英國牽頭,10國確定派兵,聯合遠征軍已鎖定俄羅斯

      美國被踢出局,英國牽頭,10國確定派兵,聯合遠征軍已鎖定俄羅斯

      曉徙娛樂
      2026-05-27 10:41:26
      老夫少妻生活不和諧,33歲妻子網聊婚外情暴露,殺死丈夫后焚尸!

      老夫少妻生活不和諧,33歲妻子網聊婚外情暴露,殺死丈夫后焚尸!

      易玄
      2026-05-24 17:35:34
      太尷尬!35+大齡剩女相親成冷門,現場男士繞著走,沒人上前搭訕

      太尷尬!35+大齡剩女相親成冷門,現場男士繞著走,沒人上前搭訕

      丫頭舫
      2026-05-25 12:54:05
      華為的車,開始自己打起來了

      華為的車,開始自己打起來了

      茄小茄說事
      2026-05-25 11:41:47
      饒穎:趙忠祥曾跟我發生關系多年,他有特殊癖好,令我身心受傷害

      饒穎:趙忠祥曾跟我發生關系多年,他有特殊癖好,令我身心受傷害

      鄉野小珥
      2026-05-24 15:09:00
      主角:古存孝慘死!原來,這才是憶秦娥移情別戀,嫁劉紅兵的真相

      主角:古存孝慘死!原來,這才是憶秦娥移情別戀,嫁劉紅兵的真相

      慢半拍sir
      2026-05-23 23:57:01
      歐盟通過鋼鐵關稅后反手豁免中企,590票鐵拳自打臉

      歐盟通過鋼鐵關稅后反手豁免中企,590票鐵拳自打臉

      奇思妙想生活家
      2026-05-27 11:01:58
      主角:晚年癱瘓截肢的劉紅兵,離婚喪子父母不認,卻一生有情有義

      主角:晚年癱瘓截肢的劉紅兵,離婚喪子父母不認,卻一生有情有義

      容妃
      2026-05-25 15:44:15
      消息稱小紅書拿下2026世界杯獨家轉播權,沖擊2億日活新紀錄、撬動男性用戶增長

      消息稱小紅書拿下2026世界杯獨家轉播權,沖擊2億日活新紀錄、撬動男性用戶增長

      金融界
      2026-05-27 11:49:55
      2026年6月1日,一個讓全國數億駕駛人必須高度警惕的日子。

      2026年6月1日,一個讓全國數億駕駛人必須高度警惕的日子。

      沙雕小琳琳
      2026-05-26 18:04:35
      WTT權力格局大洗牌,意大利老記者一語驚人:樊振東回歸或已不遠

      WTT權力格局大洗牌,意大利老記者一語驚人:樊振東回歸或已不遠

      史智文道
      2026-05-27 09:40:27
      奇葩!廣廈外援癡迷單打,孫銘徽噴臟話后接球不投再將球扔了回去

      奇葩!廣廈外援癡迷單打,孫銘徽噴臟話后接球不投再將球扔了回去

      新殺豬的秀才
      2026-05-27 00:21:45
      廣西醫科大保安踹出租車,和兩名司機吵架,視頻曝光,網友一邊倒

      廣西醫科大保安踹出租車,和兩名司機吵架,視頻曝光,網友一邊倒

      阿纂看事
      2026-05-26 19:44:31
      窮果然不養人!家里破產后,王文也面相都變了,公主開始吃路邊攤

      窮果然不養人!家里破產后,王文也面相都變了,公主開始吃路邊攤

      殘夢重生來
      2026-05-25 04:29:17
      陳雨菲顯疲態,失誤不斷;混雙再受重創,新加坡公開賽僅剩獨苗

      陳雨菲顯疲態,失誤不斷;混雙再受重創,新加坡公開賽僅剩獨苗

      佑銘羽球
      2026-05-27 13:11:41
      “中國首胖”王浩楠!為愛切胃暴瘦480斤,成名出軌拋妻 結局唏噓

      “中國首胖”王浩楠!為愛切胃暴瘦480斤,成名出軌拋妻 結局唏噓

      攬星河的筆記
      2026-05-25 17:08:18
      母親執意生下帶病“天生壞種”,14歲少年暴戾行徑,讓人膽寒

      母親執意生下帶病“天生壞種”,14歲少年暴戾行徑,讓人膽寒

      莫地方
      2026-05-26 01:20:03
      波蘭闖下大禍,普京徹底怒了,簽下總統令后,俄向美發出撤離通報

      波蘭闖下大禍,普京徹底怒了,簽下總統令后,俄向美發出撤離通報

      史料布籍
      2026-05-27 11:49:06
      東北3歲小網紅吃播也不愛青菜,明顯早熟,很注意看父母的臉色

      東北3歲小網紅吃播也不愛青菜,明顯早熟,很注意看父母的臉色

      九方魚論
      2026-05-26 22:53:36
      2026-05-27 14:00:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      13091文章數 142653關注度
      往期回顧 全部

      科技要聞

      韜定律:全球在卷納米數 華為換了一把尺子

      頭條要聞

      258畝薺菜地遭數百人哄搶造成損失約70萬 種植戶發聲

      頭條要聞

      258畝薺菜地遭數百人哄搶造成損失約70萬 種植戶發聲

      體育要聞

      這群老阿姨,是最硬核的馬刺球迷

      娛樂要聞

      小S曬歸寧宴舊照,大S穿吊帶裙扎丸子頭

      財經要聞

      ST巖石退市背后:A股“炒殼”時代終結

      汽車要聞

      極狐問道V9今日將正式上市 搭載華為雪鸮增程系統

      態度原創

      親子
      本地
      游戲
      公開課
      軍事航空

      親子要聞

      輔酶q10備孕的能吃多久?調理卵巢早衰的方法有哪些?

      本地新聞

      用剪紙的方式,打開江蘇揚州

      昂揚不滅!2026英雄聯盟手游超級聯賽夏季賽正式開賽

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普稱要和賴清德談軍售 國臺辦回應

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲AV无码之国产精品网址| 国产精品国产三级国产专区53| 亚洲熟妇无码av不卡在线观看| wwww在线观看| 亚洲人成网站在线播放大全| 久热久热免费在线观视频| av中文字幕不卡| 99这里只有精品| 熟女蜜臀av麻豆一区二区| 欧美福利| 国产高清在线不卡一区| 免费午夜福利在线观看视频| 亚洲男人皇宫| 日韩有码av中文字幕| 强开少妇嫩苞又嫩又紧九色| 久久大香香蕉国产免费网站| 免费看的一级毛片| 久久国产36精品色熟妇| 99精品在线| 国精产品一区一区三区| 日本护士一区二区三区| 最新亚洲人成无码网站欣赏网| 人妻体内射精一区二区三区| 一卡二卡三卡四卡视频区| 亚洲自拍三区| jizzjizz亚洲| 人妻三级成| 制服丝袜视频国产一区| 国产亚洲精品久久久性色情软件| 国产亚洲一区二区手机在线观看| 在线观看中文字幕码国产| 动漫搞逼视频| 丰满少妇被猛烈进入无码| 亚洲人成综合网站7777香蕉| 日本精品视频一区二区| 国产 另类 在线 欧美日韩| 国色天香成人网| 最新亚洲人成网站在线影院| 中文字幕日产熟女乱码| 九九视频在线观看| 丰满人妻在线一区二区三区视频53|