<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      AAAI 2026 Oral|LENS:基于統(tǒng)一強(qiáng)化推理的分割大模型

      0
      分享至



      文本提示圖像分割(Text-prompted image segmentation)是實(shí)現(xiàn)精細(xì)化視覺理解的關(guān)鍵技術(shù),在人機(jī)交互、具身智能及機(jī)器人等前沿領(lǐng)域具有重大的戰(zhàn)略意義。這項(xiàng)技術(shù)使機(jī)器能夠根據(jù)自然語言指令,在復(fù)雜的視覺場景中定位并分割出任意目標(biāo)。

      然而,當(dāng)前主流的技術(shù)路徑,如基于監(jiān)督式微調(diào)(Supervised Fine-Tuning, SFT)的方法,正面臨著根本性的瓶頸。這些方法本質(zhì)上是靜態(tài)的模式匹配,雖然在特定數(shù)據(jù)集上表現(xiàn)優(yōu)異,但其泛化能力往往受限,形成了一個(gè)難以逾越的 “能力天花板”。尤其是在處理需要多步、復(fù)雜推理的未知指令時(shí),性能會(huì)顯著下降,其根源在于 SFT 方法在訓(xùn)練中忽略了動(dòng)態(tài)的、顯式的推理過程。

      為了 shatter 這一能力天花板,我們引入了 LENS(Learning to Segment Anything with Unified Reinforced Reasoning)框架。LENS 摒棄了靜態(tài)的 SFT,轉(zhuǎn)而采用端到端的強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)機(jī)制,將高層次的 “思考” 過程(即思維鏈推理)與像素級(jí)的 “執(zhí)行” 過程(即圖像分割)進(jìn)行動(dòng)態(tài)的聯(lián)合優(yōu)化。通過這種設(shè)計(jì),LENS 旨在賦予分割模型真正的、上下文感知的推理能力,從而在根本上提升其在復(fù)雜任務(wù)中的魯棒性和泛化性。

      本文將深入介紹一下我們 AAAI 榮獲 Oral 的工作,“會(huì)思考的分割大模型 LENS”。有幸在這次 AAAI 2026 得到了審稿人們一致正面的評(píng)價(jià),并被 AC 和 PC 一致同意推薦為 Oral 論文。



      • 論文標(biāo)題:LENS: Learning to Segment Anything with Unified Reinforced Reasoning
      • 論文鏈接:https://arxiv.org/abs/2508.14153
      • 代碼鏈接:https://github.com/hustvl/LENS

      LENS 框架概覽:推理與分割的協(xié)同進(jìn)化

      在這個(gè)工作中,我們研究了分割大模型領(lǐng)域的一大一小兩個(gè)關(guān)鍵問題,大問題就是老生常談的 “泛化能力”,傳統(tǒng)分割大模型對(duì)未見過的提示和領(lǐng)域的泛化能力往往有限;小問題則是隱藏的 “信息瓶頸”,此前的分割大模型從 “大腦思考”(MLLM)到 “分割解碼”(SAM)之間往往只通過單一的分割 Token 傳遞信息,存在隱形的 “信息輸送瓶頸”。



      LENS 框架的核心設(shè)計(jì)在于通過端到端的聯(lián)合優(yōu)化,徹底打破傳統(tǒng)模型中 “思考”(推理)與 “執(zhí)行”(分割)之間的信息壁壘。

      以往的方法,例如同期的優(yōu)秀工作 Seg-Zero,采用的是非端到端的設(shè)計(jì),即先由推理模型生成邊界框和點(diǎn)提示,再交由現(xiàn)成的(off-the-shelf)SAM 進(jìn)行分割。這種分離式流程的主要缺陷在于誤差的單向傳播。這意味著像 Seg-Zero 這樣的非端到端模型是根本上脆弱的;它們的性能上限被其初始猜測的準(zhǔn)確性所鎖定。一旦推理階段的定位出現(xiàn)偏差,下游的分割模型將無法糾正,最終必然導(dǎo)致分割失敗。相比之下,LENS 通過其端到端的反饋閉環(huán),具備了即便從不完美的初步定位中也能自我糾正的能力。



      LENS 的整體架構(gòu)由三大核心組件構(gòu)成,它們協(xié)同工作,實(shí)現(xiàn)了從高級(jí)語義理解到精確像素輸出的無縫銜接:

      • 多模態(tài)大語言模型 (MLLM) - 推理核心:作為系統(tǒng)的 “大腦”,LENS 采用先進(jìn)的 MLLM(如 Qwen2.5-VL-3B-Instruct)來處理輸入的圖像和文本指令。它負(fù)責(zé)生成詳盡的思維鏈(Chain-of-Thought, CoT)推理過程,并給出一個(gè)初步的目標(biāo)邊界框。這一過程不僅是定位,更是對(duì)指令的深度理解。





      • 上下文模塊 (Context Module) - 信息橋梁:這是 LENS 的關(guān)鍵創(chuàng)新,它充當(dāng)了 MLLM 和分割模型之間的信息高速公路。該模塊由一組可學(xué)習(xí)的上下文查詢(Context Queries)和一個(gè)連接器(Connector)組成,其任務(wù)是將 MLLM 生成的豐富推理軌跡和定位信息,轉(zhuǎn)化為分割模型能夠高效利用的、信息密集的分割提示





      • 分割模型 (SAM-2) - 像素解碼器:作為系統(tǒng)的 “雙手”,LENS 采用高性能的分割模型(SAM2-Large)。它接收來自上下文模塊的復(fù)雜指令,并結(jié)合原始圖像信息,執(zhí)行精準(zhǔn)的像素級(jí)掩碼生成任務(wù),將推理結(jié)果精確地體現(xiàn)在圖像上。

      通過這種 “推理 - 橋接 - 分割” 三位一體的緊密耦合架構(gòu),LENS 實(shí)現(xiàn)了推理質(zhì)量和分割精度的同步提升。這種設(shè)計(jì)使得最終的分割性能可以直接反作用于推理過程的優(yōu)化,形成一個(gè)完整的閉環(huán),為實(shí)現(xiàn)更高水平的通用分割能力奠定了基礎(chǔ)。

      LENS 框架同時(shí)在 “思考推理” 端也做出了改進(jìn),我們基于 Group Relative Policy Optimization(GRPO)方法構(gòu)建了統(tǒng)一強(qiáng)化學(xué)習(xí)獎(jiǎng)勵(lì)機(jī)制(Unified Rewards Scheme)。該獎(jiǎng)勵(lì)機(jī)制是多維度的,同時(shí)監(jiān)督以下三個(gè)層級(jí)的線索:

      1. 格式獎(jiǎng)勵(lì)(Format Reward):確保 MLLM 的輸出(包括推理過程和定位結(jié)果)遵循預(yù)期的結(jié)構(gòu)和格式一致性。
      2. 邊界框 IoU 獎(jiǎng)勵(lì)(Box IoU Reward):衡量預(yù)測邊界框與真實(shí)邊界框之間的定位準(zhǔn)確性。
      3. 分割掩碼 IoU 獎(jiǎng)勵(lì)(Segment IoU Reward):評(píng)估像素級(jí)分割掩碼的質(zhì)量。



      通過我們提出的聯(lián)合優(yōu)化(將統(tǒng)一的 GRPO 目標(biāo)與監(jiān)督分割損失相結(jié)合),LENS 能夠從獎(jiǎng)勵(lì)驅(qū)動(dòng)的推理改進(jìn)和直接的分割監(jiān)督中同時(shí)受益。值得一提的是,LENS 的端到端特性解決了定位錯(cuò)誤(Grounding Error)向下游傳播的問題,如上圖右一右二所示,哪怕有些情況定位框是錯(cuò)的,強(qiáng)大的上下文查詢(Context Query)也能帶領(lǐng)分割模型走向正確。

      性能評(píng)估與分析



      核心結(jié)果方面,LENS 取得了文本提示分割任務(wù)的最先進(jìn)性能(SoTA):LENS 在 RefCOCO 系列的基準(zhǔn)測試中取得了 81.2% 的平均 cIoU,達(dá)到了世界最高水平。在 GroundingSuite-Eval 這類更具挑戰(zhàn)性的零樣本基準(zhǔn)測試中,LENS 展現(xiàn)出卓越的域外泛化能力,cIoU 達(dá)到 78.3%,超越第二優(yōu)方法接近 10%。



      這些成果表明,LENS 這一類基于統(tǒng)一強(qiáng)化學(xué)習(xí)獎(jiǎng)勵(lì)驅(qū)動(dòng)的 CoT 推理方法,能夠顯著提升文本提示下的分割能力。我們相信,LENS 為強(qiáng)化學(xué)習(xí)與視覺分割的無縫集成提供了新的思路,并有望推動(dòng)更通用、更穩(wěn)健的視覺 - 語言系統(tǒng)的研究。代碼和預(yù)訓(xùn)練權(quán)重已開源(https://github.com/hustvl/LENS),感興趣的朋友們歡迎研究和使用。我們也期待在 AAAI 2026 與學(xué)術(shù)界同行進(jìn)行深入交流。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      黃子韜回應(yīng)徐藝洋搖頭晃腦!直播模仿又損又護(hù)短

      黃子韜回應(yīng)徐藝洋搖頭晃腦!直播模仿又損又護(hù)短

      科學(xué)發(fā)掘
      2026-05-12 19:30:54
      航空新規(guī)終于要實(shí)行!今年7月起,日本客機(jī)不得隨意通過中國領(lǐng)空

      航空新規(guī)終于要實(shí)行!今年7月起,日本客機(jī)不得隨意通過中國領(lǐng)空

      安珈使者啊
      2026-05-12 19:32:35
      什么是CPO、OCS、PCB、CPC?概念股大全就在這里

      什么是CPO、OCS、PCB、CPC?概念股大全就在這里

      風(fēng)風(fēng)順
      2026-05-13 04:15:07
      細(xì)節(jié)決定成敗:為什么說殲-35的隱身可能真的做到了世界第一

      細(xì)節(jié)決定成敗:為什么說殲-35的隱身可能真的做到了世界第一

      隨夢而飛起
      2026-05-13 05:22:30
      郭大杰被免去廣東旅控集團(tuán)黨委書記、董事長職務(wù)

      郭大杰被免去廣東旅控集團(tuán)黨委書記、董事長職務(wù)

      齊魯壹點(diǎn)
      2026-05-12 18:22:17
      又一家中國廠商量產(chǎn)DDR5內(nèi)存條

      又一家中國廠商量產(chǎn)DDR5內(nèi)存條

      放毒
      2026-05-12 17:24:38
      特朗普登機(jī)前,美國兩黨議員聯(lián)手,通告白宮,不許和中方達(dá)成協(xié)議

      特朗普登機(jī)前,美國兩黨議員聯(lián)手,通告白宮,不許和中方達(dá)成協(xié)議

      君笙拂兮啊
      2026-05-13 07:41:44
      76人和總裁莫雷分道揚(yáng)鑣 主教練納斯繼續(xù)留任

      76人和總裁莫雷分道揚(yáng)鑣 主教練納斯繼續(xù)留任

      體壇周報(bào)
      2026-05-13 08:42:17
      300965,重大資產(chǎn)重組!提前漲停!

      300965,重大資產(chǎn)重組!提前漲停!

      中國基金報(bào)
      2026-05-13 00:11:20
      特朗普訪華攜血漿抵京,安保堪比小型戰(zhàn)爭,542噸恐懼隨行

      特朗普訪華攜血漿抵京,安保堪比小型戰(zhàn)爭,542噸恐懼隨行

      甜美蜜桃派
      2026-05-12 20:11:19
      搶在接機(jī)前,特朗普隨行名單變了,英偉達(dá)出局,外交部四字表態(tài)

      搶在接機(jī)前,特朗普隨行名單變了,英偉達(dá)出局,外交部四字表態(tài)

      傲傲講歷史
      2026-05-13 00:04:46
      俄軍前線失控,指揮癱瘓、軍頭林立,1917年式危機(jī)陰影重現(xiàn)。

      俄軍前線失控,指揮癱瘓、軍頭林立,1917年式危機(jī)陰影重現(xiàn)。

      高博新視野
      2026-05-13 07:30:17
      擠走董卿、靠爹上位、央視“窮鬼”,龍洋的私生活謠言有多離譜?

      擠走董卿、靠爹上位、央視“窮鬼”,龍洋的私生活謠言有多離譜?

      豬小艷吖
      2026-05-12 03:50:15
      半決賽首組對(duì)決出爐!北京與上海強(qiáng)強(qiáng)對(duì)話,四大內(nèi)線上演巔峰對(duì)決

      半決賽首組對(duì)決出爐!北京與上海強(qiáng)強(qiáng)對(duì)話,四大內(nèi)線上演巔峰對(duì)決

      老葉評(píng)球
      2026-05-12 22:01:58
      曝黑海艦隊(duì)成鐵籠!俄烏戰(zhàn)爭以來首次安裝無人機(jī)“防護(hù)網(wǎng)”

      曝黑海艦隊(duì)成鐵籠!俄烏戰(zhàn)爭以來首次安裝無人機(jī)“防護(hù)網(wǎng)”

      項(xiàng)鵬飛
      2026-05-12 18:14:38
      劉嘉玲曬法國度假照,依偎梁朝偉身旁,滿臉幸福藏不住

      劉嘉玲曬法國度假照,依偎梁朝偉身旁,滿臉幸福藏不住

      人間煙火記事本
      2026-05-13 08:37:19
      416億買來的教訓(xùn):剝離格力后,集團(tuán)再也無法撼動(dòng)董明珠的鐵王座

      416億買來的教訓(xùn):剝離格力后,集團(tuán)再也無法撼動(dòng)董明珠的鐵王座

      李砍柴
      2026-05-12 21:51:06
      Claude Opus 蒸餾Qwen3.6-35B-A3B,開源了,消費(fèi)級(jí)顯卡輕松跑

      Claude Opus 蒸餾Qwen3.6-35B-A3B,開源了,消費(fèi)級(jí)顯卡輕松跑

      Ai學(xué)習(xí)的老章
      2026-05-12 07:21:23
      5.13早評(píng)|全線跳水!美股大消息!A股要爆了!

      5.13早評(píng)|全線跳水!美股大消息!A股要爆了!

      龍行天下虎
      2026-05-13 08:23:32
      59:48,罕見一幕出現(xiàn)!鄭麗文大獲全勝,新黨卻揭開了藍(lán)綠的老底

      59:48,罕見一幕出現(xiàn)!鄭麗文大獲全勝,新黨卻揭開了藍(lán)綠的老底

      野史日記
      2026-05-12 09:55:07
      2026-05-13 09:24:49
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      12979文章數(shù) 142648關(guān)注度
      往期回顧 全部

      科技要聞

      谷歌劇透安卓重大升級(jí) Gemini深度集成底層

      頭條要聞

      牛彈琴:印度的大麻煩來了 CNN的報(bào)道更是觸目驚心

      頭條要聞

      牛彈琴:印度的大麻煩來了 CNN的報(bào)道更是觸目驚心

      體育要聞

      騎士終于玩明白了?

      娛樂要聞

      白鹿風(fēng)波升級(jí)!掉粉20萬評(píng)論區(qū)淪陷

      財(cái)經(jīng)要聞

      深圳夫妻囤芯片,身家飆漲320億

      汽車要聞

      吉利銀河“TT”申報(bào)圖曝光 電動(dòng)尾翼+激光雷達(dá)

      態(tài)度原創(chuàng)

      時(shí)尚
      教育
      游戲
      旅游
      房產(chǎn)

      沒八卦、純素人、不驚艷,可她贏麻了

      教育要聞

      600分以下想要本科就業(yè),如何報(bào)志愿

      《共鳴:瘟疫傳說傳承》新截圖 畫面相當(dāng)唯美!

      旅游要聞

      占地3.2平方公里,它是西安的國家遺址公園,坐高鐵離廣元不遠(yuǎn)!

      房產(chǎn)要聞

      穗八條引爆樓市!萬博寶藏紅盤,五一勁銷出圈

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 亚洲国产高清在线观看视频| 狠狠色噜噜狠狠狠888米奇视频 | 久久加勒比| 国产精品激情欧美可乐视频| 国产成人一区二区三区别| 国产国产成人精品久久蜜| 国产99reb| 动漫av永久无码精品每日更新| 亚洲国产人成自久久国产| 中文字幕有码免费视频| 无码写真精品永久福利在线| 国产一区二区三区在线观看免费| 亚洲日本乱码在线观看| 18久久| A级毛片无码久久精品免费| 国产成人午夜福利在线观看视频| 99re6在线观看国产精品| 国产99在线a视频| 巨大乳女人做爰视频在线看| 亚洲精品AⅤ一区二| 大桥未久亚洲无av码在线| 亚洲AV在线免费观看| 五十路丰满中年熟女中出| 亚洲精品国产一区二区小泽玛利亚| 国产成人久久综合一区| 国产亚洲综合欧美视频| 操逼不卡| AV色色色| 天堂在线WWW天堂中文在线| 好看精品日本一区二区| 精品免费人成视频网| 嫩草成人AV影院在线观看| 天天躁夜夜躁狠狠眼泪| 国产精品999999| 中国老熟妇自拍hd发布| 性色欲情网站| 国产美女在线看网站| 国产日韩一区二区三区免费高清| 免费吃奶摸下激烈视频| 久久精品熟妇丰满人妻99| 艳妇乳肉豪妇荡乳xxx|