<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      多模態(tài)檢索新突破,用軟標簽打破傳統(tǒng)剛性映射約束,全面超越CLIP

      0
      分享至

      UniME-V2團隊 投稿
      量子位 | 公眾號 QbitAI

      統(tǒng)一多模態(tài)嵌入模型是眾多任務(wù)的技術(shù)基石。

      當(dāng)前主流方法通常采用批內(nèi)負例挖掘策略,通過計算查詢-候選對的相似度進行訓(xùn)練。

      但這類方法存在明顯局限:難以捕捉候選樣本間細微的語義差異,負例樣本多樣性不足,且模型在區(qū)分錯誤負例與困難負例時的判別能力有限。

      針對這些問題,團隊提出全新解決方案——基于多模態(tài)大模型語義理解能力的統(tǒng)一多模態(tài)嵌入模型UniME-V2。

      該方法首先通過全局檢索構(gòu)建潛在困難負例集,隨后創(chuàng)新性地引入“MLLM-as-a-Judge”機制:利用MLLM對查詢-候選對進行語義對齊評估,生成軟語義匹配分數(shù)。

      這一設(shè)計帶來三重突破:

      • 以匹配分數(shù)為依據(jù)實現(xiàn)精準困難負例挖掘,有效規(guī)避錯誤負例干擾
      • 確保篩選出的困難負例兼具多樣性與高質(zhì)量特性
      • 通過軟標簽機制打破傳統(tǒng)一對一的剛性映射約束



      通過將模型相似度矩陣與軟語義匹配分數(shù)矩陣對齊,使模型真正學(xué)會辨析候選樣本間的語義差異,顯著提升判別能力。

      為進一步提升性能,團隊基于挖掘的困難負例訓(xùn)練出重排序模型UniME-V2-Reranker,采用配對與列表聯(lián)合優(yōu)化策略。



      圖1 UniME-V2與以往方法的本質(zhì)不同,在于巧妙利用了多模態(tài)大模型(MLLM)的深層語義理解能力。它不僅能用此能力精準挖掘“困難負例”,更能生成一個軟語義匹配分數(shù),如同一位資深導(dǎo)師,指導(dǎo)模型學(xué)會辨別候選樣本間微妙的語義差異。

      方法
      MLLM-as-a-Judge 困難負樣本挖掘

      過去的研究主要依賴于批內(nèi)硬負樣本挖掘,其中計算查詢-候選嵌入相似性以采樣負樣本。

      然而,這種方法通常受到負樣本多樣性有限和嵌入判別能力不足的困擾,難以有效區(qū)分錯誤和困難的負樣本。

      為了克服這些挑戰(zhàn),如圖2所示,首先利用全局檢索構(gòu)建一個潛在的困難負樣本集。

      之后,利用MLLM的強大理解能力來評估每個查詢-候選對的語義對齊性,并生成軟語義匹配分數(shù)。

      這個分數(shù)指導(dǎo)了硬負樣本挖掘,使得能夠識別出多樣化和高質(zhì)量的困難負樣本,同時減少錯誤負樣本的影響。



      圖2:基于MLLM-as-a-Judge的困難負樣本挖掘流程。我們首先利用現(xiàn)有的多模態(tài)嵌入模型進行全局檢索,構(gòu)建一個潛在的困難負樣本集。然后,利用MLLM強大的理解能力根據(jù)語義對齊性對查詢-候選對進行評分,從而精確識別困難負樣本。

      潛在困難負樣本集合為了從全局樣本中提取更高質(zhì)量的困難負樣本,首先使用VLM2Vec為查詢和候選生成嵌入。

      接著,為每個查詢檢索出50個最相關(guān)的候選。

      為了應(yīng)對錯誤負樣本并增加多樣性,我們基于查詢-候選相似度分數(shù)設(shè)定一個相似度閾值,并選擇前50名的候選作為潛在的困難負樣本集:

      其中 是由VLM2Vec模型計算得出的查詢 與候選 的相似度分數(shù)。

      語義匹配分數(shù)在構(gòu)建潛在的困難負樣本集后,我們使用MLLM作為評判,為中的每個查詢-候選對計算語義匹配分數(shù),具體指令如下:



      隨后,根據(jù)()和()標記的logits計算語義匹配分數(shù),其中。這里,表示查詢的數(shù)量。利用MLLMs的高級理解能力,語義匹配分數(shù)有效地捕捉了查詢和候選之間的語義對齊程度。

      困難負樣本采樣為了提高困難負樣本的質(zhì)量,利用語義匹配分數(shù)對候選進行精煉。

      候選樣本的分數(shù)超過閾值(其中表示正樣本,是控制閾值間隔的超參數(shù))則會當(dāng)作錯誤負樣本并排除。為保持多樣性,采用五步間隔的循環(huán)采樣策略。

      如果精煉后的集合包含的候選少于十個,將重復(fù)選擇以確保至少有十個。

      在極少數(shù)情況下(<1%),如果沒有候選符合條件,將從最初的五十個候選中隨機選擇10個,并給每個分配1.0的語義匹配分數(shù)。

      最后,對于每個查詢,我們獲得困難負樣本集及其相應(yīng)的語義匹配分數(shù)。



      圖3:基于MLLM判斷的訓(xùn)練框架結(jié)構(gòu)。UniME-V2使用軟語義匹配分數(shù)作為監(jiān)督信號,以增強候選者間的語義區(qū)分學(xué)習(xí)。UniME-V2-Reranker采用pairwise和listwise聯(lián)合訓(xùn)練以提升重排序性能。

      基于MLLM判斷的訓(xùn)練框架

      UniME-V2為此提出了一個基于MLLM判斷的分布對齊框架,如圖3所示,利用軟語義匹配分數(shù)作為監(jiān)督信號來提高表征性能。

      具體來說,給定一個查詢及其候選集,將它們輸入到MLLM中,并提取最后一個標記作為查詢和候選集的嵌入,其中是目標候選的嵌入,是每個查詢的困難負樣本數(shù)。然后計算查詢嵌入與候選嵌入之間的關(guān)系得分矩陣如下:

      基于語義匹配分數(shù),計算由MLLM判斷得出的語義匹配分數(shù)矩陣如下:

      為了增強學(xué)習(xí)的穩(wěn)健性并確保矩陣對稱性,采用了JS-Divergence,這是KL-Divergence的一種對稱替代。最終的損失函數(shù)定義為:

      除此之外,受前人工作啟發(fā),UniME-V2聯(lián)合pairwise和listwise訓(xùn)練了一個重排序模型UniME-V2-Reranker(如圖3所示)來提高基于初始嵌入的檢索精度。

      在成對訓(xùn)練中,為每個查詢構(gòu)造兩對,一對與正候選結(jié)合,另一對與最困難的負候選結(jié)合。然后指導(dǎo)UniME-V2-Reranker對正候選輸出,對負候選輸出。成對損失使用交叉熵損失函數(shù)計算如下:

      其中表示UniME-V2-Reranker的自回歸輸出過程。對于列表訓(xùn)練,基于語義匹配分數(shù),從困難負候選中選擇前個候選,隨機插入目標候選并獲取其索引。

      然后提示UniME-V2-Reranker輸出真實位置,公式為:

      最終的損失函數(shù)定義為。



      表1:MMEB基準測試結(jié)果。IND表示在分布內(nèi),OOD表示在分布外。分數(shù)為補充材料中的平均精度結(jié)果。

      實驗
      多模態(tài)檢索

      表1展示了在相同訓(xùn)練數(shù)據(jù)和配置下UniME-V2與現(xiàn)有基線模型在MMEB基準上的性能對比。

      UniME-V2在各種基礎(chǔ)模型上均有顯著的性能提升。

      具體來說,UniME-V2在Qwen2-VL-2B和7B模型上分別比VLM2Vec高出3.5%和2.2%。

      當(dāng)基于LLaVA-OneVision作為基礎(chǔ)時,UniME-V2比包括QQMM、LLaVE和UniME在內(nèi)的之前的最先進模型提高了0.5%-0.9%。此外,UniME-V2在分布外數(shù)據(jù)集上的得分為66.7,凸顯其魯棒性和卓越的遷移能力。



      表2:在短描述(Flickr30K, MS-COCO)、長描述(ShareGPT4V, Urban1K)和組合(SugarCrepe)數(shù)據(jù)集上的零樣本文本-圖像檢索結(jié)果。

      跨模態(tài)檢索

      如表2所示,在零樣本跨模態(tài)檢索任務(wù)上評估UniME-V2。對于短描述數(shù)據(jù)集,包括Flickr30K和MS-COCO,UniME-V2在圖像到文本檢索中比UniME表現(xiàn)出了2.2%-9.7%的性能提升。

      在文本到圖像檢索中,其性能與UniME相當(dāng),這主要歸因于兩個因素:

      (1)MMEB訓(xùn)練集中文本到圖像數(shù)據(jù)的比例有限;

      (2)短描述中的語義信息不足。

      對于長描述跨模態(tài)檢索任務(wù),UniME-V2在ShareGPT4V和Urban1K上取得了顯著改進,這得益于其增強的區(qū)分能力和詳細描述提供的豐富語義內(nèi)容。

      值得注意的是,與EVA-CLIP-8B相比,UniME-V2展示了更為穩(wěn)健的檢索性能,這主要因為其通用多模態(tài)嵌入能顯著減少模態(tài)間的差距(如圖4所示)。



      圖4:EVA-CLIP-8B與UniME-V2(LLaVA-OneVision-7B)之間的表示分布對比。

      組合跨模態(tài)檢索

      基于SugarCrepe評估UniME-V2模型區(qū)分困難負樣本的能力。

      如表2所示,UniME-V2在所有評估指標上均表現(xiàn)出卓越性能。

      與UniME相比在使用Qwen2-VL-2B時性能提升了5.3%,6.0%,4.5%。當(dāng)模型從2B擴展到7B后也實現(xiàn)了9.0%,9.2%,9.2%的性能提升。

      此外,與EVA-CLIP-8B相比,UniME-V2還顯示出2.7%,3.4%,和3.8%的改進,凸顯其在區(qū)分困難負樣本上的強大能力。



      表3:使用UniME-V2 (Qwen2-VL-7B) 和 UniME-V2 (Qwen2-VL-2B) 比較LamRA與UniME-V2-Reranker的重排序性能。

      重排序?qū)Ρ?/h5>

      在表3中基于top5檢索結(jié)果對比了LamRA與UniME-V2-Reranker的性能。為確保公平,使用與LamRA相同的訓(xùn)練參數(shù)和基礎(chǔ)模型(Qwen2.5-VL-7B)。

      當(dāng)使用LamRA和UniME-V2-Reranker對UniME-V2 (Qwen2-VL-2B) 檢索結(jié)果進行重排后在四個下游任務(wù)上均提升了性能。

      UniME-V2-Reranker在只使用一半數(shù)據(jù)的情況下始終獲得更優(yōu)結(jié)果。類似地,使用UniME-V2 (Qwen2-VL-7B) 進行檢索時,UniME-V2-Reranker的表現(xiàn)也超過了LamRA,在四個任務(wù)中分別獲得了0.5%,0.4%,0.3%,和7.4%的性能提升。

      值得注意的是,UniME-V2-Reranker在組合理解檢索任務(wù)中展示了對LamRA的顯著優(yōu)勢,這歸功于其利用MLLM的理解能力提取多樣化和高質(zhì)量的困難樣本,有效增強了模型的區(qū)分能力。

      論文:

      https://arxiv.org/abs/2510.13515

      GitHub:

      https://github.com/GaryGuTC/UniME-v2

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      林詩棟搶王楚欽風(fēng)頭!險被逆轉(zhuǎn)卻跳球桌狂歡,把自己演成關(guān)鍵英雄

      林詩棟搶王楚欽風(fēng)頭!險被逆轉(zhuǎn)卻跳球桌狂歡,把自己演成關(guān)鍵英雄

      三十年萊斯特城球迷
      2026-05-11 01:58:15
      “你管這面相叫聰慧明理?”寶媽寫小作文偏袒小兒子,被網(wǎng)友群嘲

      “你管這面相叫聰慧明理?”寶媽寫小作文偏袒小兒子,被網(wǎng)友群嘲

      妍妍教育日記
      2026-05-09 14:41:48
      陳若儀曬和Kimi合照慶母親節(jié),公開13年前齙牙照坦言不敢公開社群

      陳若儀曬和Kimi合照慶母親節(jié),公開13年前齙牙照坦言不敢公開社群

      小椰的奶奶
      2026-05-11 03:51:11
      給患癌病亡父親寫信的保研清華小伙拍高考應(yīng)援視頻:高中時為10萬元獎金考清華北大沒成功,和偶像龐眾望見面時哭了

      給患癌病亡父親寫信的保研清華小伙拍高考應(yīng)援視頻:高中時為10萬元獎金考清華北大沒成功,和偶像龐眾望見面時哭了

      極目新聞
      2026-05-10 08:40:50
      弗里克:下個目標是拿到100分,下賽季會為歐冠冠軍努力

      弗里克:下個目標是拿到100分,下賽季會為歐冠冠軍努力

      懂球帝
      2026-05-11 07:43:39
      炸裂!熊孩子刮花6張PS5光盤 家長僅200元打發(fā)了事

      炸裂!熊孩子刮花6張PS5光盤 家長僅200元打發(fā)了事

      游民星空
      2026-05-10 17:44:13
      漢坦病毒mRNA疫苗全球研發(fā)緩慢,中國相關(guān)滅活疫苗已上市20年

      漢坦病毒mRNA疫苗全球研發(fā)緩慢,中國相關(guān)滅活疫苗已上市20年

      紅星新聞
      2026-05-09 17:39:29
      王浩案重現(xiàn)?老人猝死公交車上,家屬索要巨額賠償,法院這樣判!

      王浩案重現(xiàn)?老人猝死公交車上,家屬索要巨額賠償,法院這樣判!

      阿鳧愛吐槽
      2026-05-09 23:27:53
      他套現(xiàn)百億,留下27萬股民和一張ST廢紙,聞泰科技給投資者上了一課

      他套現(xiàn)百億,留下27萬股民和一張ST廢紙,聞泰科技給投資者上了一課

      A活著
      2026-05-09 20:47:26
      孔特跪服馬寧!武磊送點,國安10年主場不勝海港,1人成關(guān)鍵罪人

      孔特跪服馬寧!武磊送點,國安10年主場不勝海港,1人成關(guān)鍵罪人

      話體壇
      2026-05-10 22:36:55
      2:3!日本女團惜敗國乒,張本美和賽后采訪滿是心有不甘與心碎!

      2:3!日本女團惜敗國乒,張本美和賽后采訪滿是心有不甘與心碎!

      田先生籃球
      2026-05-10 23:07:16
      弊端顯現(xiàn)!7歲小天賜74歲媽媽患病,剃光頭發(fā)暴瘦,疑似接受化療

      弊端顯現(xiàn)!7歲小天賜74歲媽媽患病,剃光頭發(fā)暴瘦,疑似接受化療

      裕豐娛間說
      2026-05-10 20:35:50
      隨著韓國4-1,印度0-3,也門3-2,亞洲杯最新積分榜出爐

      隨著韓國4-1,印度0-3,也門3-2,亞洲杯最新積分榜出爐

      側(cè)身凌空斬
      2026-05-11 03:15:16
      5月11日精選熱點:電子布再度漲價  這些低位股要爆發(fā)

      5月11日精選熱點:電子布再度漲價 這些低位股要爆發(fā)

      元芳說投資
      2026-05-10 21:26:42
      東風(fēng)導(dǎo)彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

      東風(fēng)導(dǎo)彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

      番外行
      2026-03-31 08:28:28
      為了沖10%增長,越南賭場KTV全面松綁

      為了沖10%增長,越南賭場KTV全面松綁

      鳳眼論
      2026-05-10 22:14:23
      小流氓遇見大流氓,美國正式封鎖霍爾木茲海峽

      小流氓遇見大流氓,美國正式封鎖霍爾木茲海峽

      海子侃生活
      2026-04-14 10:10:15
      遺憾官宣!陳赫直播透露:李晨加盟五哈徹底受阻,多次協(xié)調(diào)無果

      遺憾官宣!陳赫直播透露:李晨加盟五哈徹底受阻,多次協(xié)調(diào)無果

      一盅情懷
      2026-05-10 17:29:06
      《亢奮》第三季爭議鏡頭曝光,劇組內(nèi)部曾激烈反對

      《亢奮》第三季爭議鏡頭曝光,劇組內(nèi)部曾激烈反對

      影視情報室
      2026-05-11 00:33:52
      Redis創(chuàng)始人開源ds4:幾千行C代碼讓DeepSeek V4跑在MacBook上

      Redis創(chuàng)始人開源ds4:幾千行C代碼讓DeepSeek V4跑在MacBook上

      小星球探索
      2026-05-10 17:11:04
      2026-05-11 07:55:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態(tài)
      12599文章數(shù) 176461關(guān)注度
      往期回顧 全部

      科技要聞

      OPPO們永遠學(xué)不會的年輕化

      頭條要聞

      特朗普:伊朗的回應(yīng)“完全不可接受”

      頭條要聞

      特朗普:伊朗的回應(yīng)“完全不可接受”

      體育要聞

      那個曾讓詹姆斯抱頭的兄弟,40歲從大學(xué)畢業(yè)了

      娛樂要聞

      趙露思老實人豁出去了 沒舞蹈天賦硬跳

      財經(jīng)要聞

      白酒大逃殺

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態(tài)度原創(chuàng)

      藝術(shù)
      旅游
      本地
      公開課
      軍事航空

      藝術(shù)要聞

      全國最值得去的八大最美古鎮(zhèn)

      旅游要聞

      在迪士尼與天文館之間,上海多了一座“月背基地”

      本地新聞

      用蘇繡的方式,打開江西婺源

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗革命衛(wèi)隊深夜警告

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 无码国产精品一区二区免费式直播| 日本高清中文字幕一区二区三区| 亚洲插插| 亚洲精品宾馆在线精品酒店| 日韩一区二区中文| 两性午夜刺激性视频| 蜜桃精品免费久久久久影院| 91精品国产91久久久无码95| 亚洲精选av| 国产精品一区二| 偷拍久久网| 粉嫩av一区二区在线观看| 免费a级毛片视频| 黑人av无码一区| 成人性生交大片免费看96| 欧美老熟妇精品| 国产超爽精品国语对白| 欧美疯狂性受xxxxx另类| 午夜电影网va内射| 国产69精品在线| 国产成人精品日本亚洲成熟| 无码精品人妻一区二区三区人妻斩| 欧美性极品| 肏屄欧美| 无码精品一区二区免费AV| 国产成人综合久久精品尤物| 国产网站在线看| 久久国产精品久久w女人spa| 狠狠躁天天躁中文字幕无码| 夜夜躁日日躁狠狠久久AV| 亚洲中文精品人人永久免费| 超频97人妻在线视频| 午夜伦伦电影理论片| 日韩不卡手机视频在线观看| 国产最新一区二区三区天堂| 国产精品v欧美| 国产精品亚洲片在线| 国产女人还美的人妖米兰| 97r久久精品国产99国产精| 隆昌县| 曰本女人牲交视频免费|