<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      引入幾何約束后,VLM跨越了「空間推理」的認(rèn)知鴻溝

      0
      分享至



      現(xiàn)有的視覺大模型普遍存在「語義-幾何鴻溝」(Semantic-to-Geometric Gap),不僅分不清東南西北,更難以處理精確的空間量化任務(wù)。例如問「你坐在沙發(fā)上時,餐桌在你的哪一側(cè)?」,VLM 常常答錯。

      這種「語義?幾何鴻溝」源自于視覺大模型的語義空間無法承載高保真的幾何細(xì)節(jié),導(dǎo)致其在空間推理時是在「憑空瞎猜」,這使得模型讀懂了畫面的語義,卻停留在「語言的世界」中,不具備現(xiàn)實(shí)世界賴以運(yùn)行的幾何直覺,導(dǎo)致空間判斷漏洞百出。



      • 論文標(biāo)題:Geometrically-Constrained Agent for Spatial Reasoning
      • 論文鏈接:https://arxiv.org/pdf/2511.22659
      • 作者團(tuán)隊(duì):Zeren Chen, Xiaoya Lu, Zhijie Zheng, Pengrui Li, Lehan He, Yijin Zhou, Jing Shao, Bohan Zhuang, Lu Sheng
      • 通訊單位:北京航空航天大學(xué),上海人工智能實(shí)驗(yàn)室
      • 項(xiàng)目主頁:https://gca-spatial-reasoning.github.io
      • 項(xiàng)目代碼:https://github.com/gca-spatial-reasoning/gca

      針對這一痛點(diǎn),北京航空航天大學(xué)上海人工智能實(shí)驗(yàn)室的研究團(tuán)隊(duì)創(chuàng)新提出了幾何約束智能體(Geometrically-Constrained Agent, GCA),開創(chuàng)了「先形式化約束,后確定性計(jì)算」的空間推理新范式。GCA 不依賴海量數(shù)據(jù)微調(diào),而是通過構(gòu)建形式化任務(wù)約束,強(qiáng)制 VLM 從「模糊直覺」轉(zhuǎn)向「精確求解」,通過視覺工具調(diào)用和編寫計(jì)算代碼進(jìn)行參數(shù)化計(jì)算,為空間推理搭建了一座可驗(yàn)證、確定性的幾何橋梁。

      GCA 直接帶領(lǐng) Qwen、Gemini 等基座模型實(shí)現(xiàn)「能力躍遷」。在公認(rèn)高難度的 MMSI-Bench 測試中,GCA 將模型性能提升近 50%,擊敗現(xiàn)有 Training-based 及 Tool-integrated 方法,并在多個主流空間推理測試中確立了空間推理領(lǐng)域的新 SOTA。



      核心挑戰(zhàn):跨越「語義 - 幾何」的認(rèn)知鴻溝

      視覺語言模型(VLM)在圖像描述與通用語義理解上表現(xiàn)卓越,然而,當(dāng)任務(wù)轉(zhuǎn)向需要高精度幾何計(jì)算的空間推理時 —— 例如判斷物體的精確朝向、測量距離或進(jìn)行視角變換 —— 其表現(xiàn)卻顯著下滑。

      研究團(tuán)隊(duì)指出,這種能力斷層的根源在于「語義 - 幾何鴻溝」。具體表現(xiàn)為:

      • 視覺 & 幾何信息的有損壓縮:VLM 將豐富的像素信息壓縮為抽象的語義特征,這一過程如同將一幅詳細(xì)地圖簡化為幾個地標(biāo)名稱,導(dǎo)致物體精確位置、朝向、尺度等高保真幾何細(xì)節(jié)大量丟失。
      • 幾何想象的缺失:以「坐在沙發(fā)上」這一場景為例,VLM 僅能調(diào)用模糊的空間常識(知道人與沙發(fā)通常同向),卻無法在腦海中精確構(gòu)建出「從沙發(fā)視角看去」的三維場景。這種幾何想象力的匱乏,使其在面對復(fù)雜空間推理時力不從心。

      ? 核心方法:基于形式化約束的兩階段推理





      1. 任務(wù)形式化 —— 從「模糊指令」到「精確規(guī)則」

      VLM 首先扮演「語義分析師」的角色,利用其強(qiáng)大的語義理解能力,將模糊的自然語言指令轉(zhuǎn)化為明確的數(shù)學(xué)約束。這一步驟不涉及具體計(jì)算,而是確立規(guī)則:



      • 基于物體的參考系 (Object-based Frame):利用物體自身的坐標(biāo)系。例如指令「當(dāng)你在洗手時...」隱含了觀察者必須「面對洗手池」,因此參考系由洗手池的朝向決定。
      • 基于相機(jī)的參考系 (Camera-based Frame):即標(biāo)準(zhǔn)的視圖坐標(biāo)系。例如「從圖 1 的視角來看...」,此時參考系直接綁定為相機(jī)的基于方向的參考系 (Direction-based Frame):由兩個物體的位置關(guān)系定義。例如「烤箱在水槽的北面」,此時「北」的方向由從水槽指向烤箱的向量嚴(yán)格定義。





      2. 幾何計(jì)算 —— 在規(guī)則內(nèi)進(jìn)行「確定性求解」



      • 智能工具調(diào)度與綁定:VLM 像指揮官一樣,調(diào)度 3D 重建等感知工具獲取數(shù)據(jù),并能智能地將「最左邊的椅子」等模糊描述,精準(zhǔn)綁定到具體的幾何對象上,消除語義歧義。
      • 感知與計(jì)算的無縫銜接:感知工具負(fù)責(zé)將視覺世界參數(shù)化為高保真 3D 表示,計(jì)算工具則負(fù)責(zé)執(zhí)行代碼、完成坐標(biāo)轉(zhuǎn)換,二者在統(tǒng)一框架下協(xié)同,實(shí)現(xiàn)從「看到」到「算準(zhǔn)」的閉環(huán)。
      • 檢索增強(qiáng)的可靠計(jì)算:采用類似 RAG 的策略,VLM 從一個已驗(yàn)證的幾何公式庫中檢索正確模型來生成代碼,從根本上杜絕「幻覺」,確保每項(xiàng)計(jì)算都基于可靠的物理原理。

      實(shí)驗(yàn)結(jié)果:全新的空間推理 SOTA

      在 MMSI-Bench、MindCube-tiny、OmniSpatial 等多個主流空間推理基準(zhǔn)上,GCA 證明了其有效性,構(gòu)建了一個全新的空間智能 SOTA。

      綜合性能提升

      GCA 取得了 65.1% 的平均準(zhǔn)確率,顯著超越了現(xiàn)有基于訓(xùn)練的方法與工具集成的方法。特別是在極具挑戰(zhàn)性的多圖空間推理基準(zhǔn) MMSI-Bench 中,面對復(fù)雜的視角變換與相對方位推斷,現(xiàn)有主流模型往往只能徘徊在 25%~30% 左右的「隨機(jī)猜測」水平線。

      而基于 Qwen3-VL-Thinking 構(gòu)建的 GCA,準(zhǔn)確率從 32.6% 躍升至 47.6%。這一數(shù)據(jù)證明,GCA 成功讓 VLM 擺脫了「蒙答案」的困境,向具備可靠的空間推理能力邁出了關(guān)鍵一步。

      強(qiáng)大的通用性

      GCA 并非特定模型的「專屬補(bǔ)丁」,而是一種無需訓(xùn)練(Training-free)的通用推理范式,可直接賦能各類基座模型。

      實(shí)驗(yàn)顯示,在搭載 GCA 架構(gòu)后,受測模型在 MMSI-Bench 上的性能平均實(shí)現(xiàn)了約 37% 的相對提升。其中,基于 Gemini-2.5-Pro 構(gòu)建的 GCA 表現(xiàn)尤為驚艷,其準(zhǔn)確率從 36.9% 飛躍至 55.0%,有效地激發(fā)了頂級模型的空間推理潛力。





      通過系統(tǒng)的消融實(shí)驗(yàn)與歸因分析,研究進(jìn)一步證實(shí)了 GCA 架構(gòu)的前瞻性:



      • 可解釋的錯誤歸因:得益于 GCA 架構(gòu)的模塊化設(shè)計(jì),研究團(tuán)隊(duì)能夠?qū)ν评礞溌愤M(jìn)行精確的錯誤歸因。分析顯示,VLM 在「任務(wù)形式化」階段的準(zhǔn)確率已高達(dá)~70%,當(dāng)前主要錯誤來源于下游感知工具(如 3D 重建失敗或遮擋)。這表明,GCA 的推理邏輯是穩(wěn)健的,其性能將隨著感知模型的進(jìn)步而持續(xù)提升。



      總結(jié)與意義

      GCA 提出了一種「語言定義約束,幾何執(zhí)行計(jì)算」的新范式。通過將模糊的空間查詢轉(zhuǎn)化為帶約束的數(shù)學(xué)問題,GCA 有效避免了 VLM 在有損語義空間中進(jìn)行不可靠的空間想象。這不僅大幅提升了推理的準(zhǔn)確性,也讓機(jī)器向擁有「幾何直覺」邁出了關(guān)鍵一步,回應(yīng)了攀登「空間智能」高峰的核心挑戰(zhàn)。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      武大用力過猛!

      武大用力過猛!

      梳子姐
      2026-05-10 21:46:30
      上騙中央,下騙百姓,三回入獄,從首富到首騙,把他吹的太神了!

      上騙中央,下騙百姓,三回入獄,從首富到首騙,把他吹的太神了!

      縱擁千千晚星
      2026-04-20 04:45:06
      科爾續(xù)約勇士兩年,繼續(xù)執(zhí)教庫里格林

      科爾續(xù)約勇士兩年,繼續(xù)執(zhí)教庫里格林

      體育硬核說
      2026-05-11 11:58:54
      紅場閱兵結(jié)束!普京感謝中國,特朗普最不愿意看到的一幕發(fā)生

      紅場閱兵結(jié)束!普京感謝中國,特朗普最不愿意看到的一幕發(fā)生

      書紀(jì)文譚
      2026-05-10 21:14:35
      39+35+33!隊(duì)史第1!這就是尼克斯給他1.57億美金大合同的原因

      39+35+33!隊(duì)史第1!這就是尼克斯給他1.57億美金大合同的原因

      世界體育圈
      2026-05-10 19:03:04
      美國總統(tǒng)特朗普將于5月13日至15日對中國進(jìn)行國事訪問

      美國總統(tǒng)特朗普將于5月13日至15日對中國進(jìn)行國事訪問

      新京報(bào)
      2026-05-11 09:09:06
      西寧一17歲高中女生寫作業(yè)至凌晨,外出復(fù)印試卷失聯(lián),身影消失在2公里外大橋監(jiān)控里

      西寧一17歲高中女生寫作業(yè)至凌晨,外出復(fù)印試卷失聯(lián),身影消失在2公里外大橋監(jiān)控里

      極目新聞
      2026-05-10 22:57:52
      從明天起,迎來“開掛模式”的3生肖,貴人出現(xiàn),橫財(cái)找上門

      從明天起,迎來“開掛模式”的3生肖,貴人出現(xiàn),橫財(cái)找上門

      毅談生肖
      2026-05-11 10:59:47
      他活埋近5000紅軍,逃往國外安享晚年,如今國內(nèi)竟還有人紀(jì)念他!

      他活埋近5000紅軍,逃往國外安享晚年,如今國內(nèi)竟還有人紀(jì)念他!

      興趣知識
      2026-05-08 00:23:54
      一夜暴跌25%!小馬哥最怕的事還是發(fā)生了:年輕人正在從騰訊溜走

      一夜暴跌25%!小馬哥最怕的事還是發(fā)生了:年輕人正在從騰訊溜走

      潮鹿逐夢
      2026-03-21 11:54:42
      滬指突破4200點(diǎn)

      滬指突破4200點(diǎn)

      財(cái)聯(lián)社
      2026-05-11 09:28:20
      特斯拉:再次突破

      特斯拉:再次突破

      新浪財(cái)經(jīng)
      2026-05-11 10:29:59
      成本極低卻狂收1.39億!《給阿嬤的情書》飆升9.1分徹底火了

      成本極低卻狂收1.39億!《給阿嬤的情書》飆升9.1分徹底火了

      桃桃淘電影
      2026-05-11 10:00:32
      “重達(dá)11000克拉”!外媒:緬甸發(fā)現(xiàn)迄今為止第二重的“罕見巨型”紅寶石

      “重達(dá)11000克拉”!外媒:緬甸發(fā)現(xiàn)迄今為止第二重的“罕見巨型”紅寶石

      環(huán)球網(wǎng)資訊
      2026-05-10 11:20:10
      60歲李澤楷,愛江山也愛美人,終其一生也未能擺脫李嘉誠的陰影

      60歲李澤楷,愛江山也愛美人,終其一生也未能擺脫李嘉誠的陰影

      妙知
      2026-05-11 05:04:30
      紹切克:我特別無奈,阿森納本賽季靠著類似尺度打進(jìn)了幾十個進(jìn)球

      紹切克:我特別無奈,阿森納本賽季靠著類似尺度打進(jìn)了幾十個進(jìn)球

      畫夕
      2026-05-11 11:17:02
      英國成伊斯蘭國家了?斯塔默宣布:穆斯林是現(xiàn)代英國的標(biāo)志性面孔

      英國成伊斯蘭國家了?斯塔默宣布:穆斯林是現(xiàn)代英國的標(biāo)志性面孔

      番外行
      2026-05-11 08:50:52
      美國總統(tǒng)特朗普將對中國進(jìn)行國事訪問

      美國總統(tǒng)特朗普將對中國進(jìn)行國事訪問

      澎湃新聞
      2026-05-11 10:01:03
      伊朗足協(xié)主席:美國還沒有發(fā)放簽證,現(xiàn)在已經(jīng)太晚了

      伊朗足協(xié)主席:美國還沒有發(fā)放簽證,現(xiàn)在已經(jīng)太晚了

      懂球帝
      2026-05-11 10:12:20
      五萬多人被套路!女子租共享充電寶被扣149元,涉事企業(yè)被撕底褲

      五萬多人被套路!女子租共享充電寶被扣149元,涉事企業(yè)被撕底褲

      火山詩話
      2026-05-10 14:42:17
      2026-05-11 12:32:49
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      12965文章數(shù) 142648關(guān)注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機(jī)會

      頭條要聞

      特朗普時隔9年再度訪華 今年特朗普還贊嘆中國儀仗隊(duì)

      頭條要聞

      特朗普時隔9年再度訪華 今年特朗普還贊嘆中國儀仗隊(duì)

      體育要聞

      那個曾讓詹姆斯抱頭的兄弟,40歲從大學(xué)畢業(yè)了

      娛樂要聞

      謝霆鋒沒想到,王菲靠張藝謀重返巔峰

      財(cái)經(jīng)要聞

      "手搓汽車"曝光:偽造證件、電池以舊代新

      汽車要聞

      全球化成國內(nèi)車企未來勝負(fù)手,誰是出海最強(qiáng)"水手"?

      態(tài)度原創(chuàng)

      本地
      藝術(shù)
      游戲
      公開課
      軍事航空

      本地新聞

      用蘇繡的方式,打開江西婺源

      藝術(shù)要聞

      2026中央美術(shù)學(xué)院博士生畢業(yè)作品選

      《深海迷航2》確認(rèn)5月14日開啟搶先體驗(yàn) 支持多人聯(lián)機(jī)

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗革命衛(wèi)隊(duì)深夜警告

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 激情内射亚洲一区二区三区 | 欧美喷潮久久久xxxxx| 金典亚洲经典av| 熟妇人妻无码xxx视频| 免费无码高h视频在线观看| 亚洲色成人一区二区三区小说| 久久国产精品乱子乱精品| 99色色网| 国产一区二区三区最新视频| 久久夜色精品国产网站| 亚洲AV永久无码精品一福利| 超碰人人摸| 久久婷婷五月综合97色一本一本| 婷婷精品国产一区二区三区日韩| 国产成人综合亚洲色就色| 欧洲乱码伦视频免费国产| 久久久久99精品国产片| 牛鞭伸入女人下身的真视频| av电影一区| 国产麻豆一精品一av一免费| 很很鲁很很很鲁在线视频播放| 手机看片久久国产永久免费| 成人动漫久久| 高清无码视频直接看| 久久亚洲精品中文字幕波多野结衣| 麻豆精品在线视频| 久久精品这里热有精品| 亚洲天堂中文| 亚洲综合伦理| 强奷乱码中文字幕熟女一| 色综合久久88一二三| 国产精品天干天干在线观蜜臀| 久久精品国产精品亚洲20| 亚洲欧美熟妇自拍色综合图片| 元码人妻精品一区二区三区9| 久久色窝窝| 九九热久久免费视频| 色AV专区无码影音先锋| 交换少妇隔壁呻吟| 老太婆性杂交视频| 成人在线免费视频ww|