<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      HyperEyes:并行多模態搜索智能體的效率革命

      0
      分享至



      現有的開源多模態搜索智能體普遍受困于「裁剪 - 再搜索」的串行處理模式,面對多目標時往往陷入交互冗長、錯誤級聯累積的泥沼。

      為此,小紅書研究團隊提出了一款全新架構的模型:HyperEyes。通過統一定位與搜索的動作空間、構建并行可學習數據以及雙粒度效率感知強化學習的全棧設計,HyperEyes 成功實現了從「搜得更深」到「搜得更寬」的并行多模態搜索范式躍遷。





      • 論文地址:https://arxiv.org/abs/2605.07177
      • 代碼地址:https://github.com/DeepExperience/HyperEyes

      背景:多模態搜索智能體的「串行困局」

      當前主流的 Agent 在面對包含多個實體的復雜圖片時,往往只能采用笨拙的「N 輪串行調用」策略。

      這種傳統的處理路徑帶來了三重難以逾越的困境:首先是極大的交互冗余,原本一句話的多實體查詢被迫退化為多次單實體搜索,導致延遲劇增;其次是錯誤放大的多米諾骨牌效應,前置定位一旦發生偏差,后續的搜索結果將被全部污染;最后是模型訓練中普遍存在的獎勵偏差與「信用分配」問題。

      現有模型往往僅以「最終答案對錯」作為唯一獎勵標準,這不僅會導致智能體為了追求表面準確率而養成「暴力多搜」的壞習慣,引入更多噪聲;更致命的是,這種粗粒度的稀疏獎勵會帶來粗暴的「連坐懲罰」—— 在那些最終失敗的探索軌跡中,原本正確、富有邏輯的中間推理和工具調用也被一并全盤否定,導致模型根本無法從失敗中有效汲取局部經驗。

      方法:從動作空間、數據到 RL 的「全棧式」效率重塑



      為了讓智能體真正具備「一次出手,多目標并發」的內生能力,HyperEyes 研究團隊在動作空間、數據合成與強化學習三個維度上進行了徹底的底層重構。

      傳統的智能體通常將「視覺裁剪」和「網絡搜索」作為兩個獨立的步驟,而HyperEyes 打破了這一隔離,提出了「統一定位即搜索」(UGS)的動作空間重構方案。它將視覺定位框直接作為檢索動作的內嵌參數,使得一次函數調用就能并發攜帶多個目標框。這一設計從物理層面徹底打通了單輪交互內多目標并發的通路。

      然而,空有架構還不夠,開源社區長期缺乏「并行搜索」的訓練語料。為此,研究團隊設計了一套精密的合成流水線。他們首先將多類圖片拼接,合成出必須同時進行定位與檢索才能解答的視覺查詢;接著基于圖譜隨機游走,構造出多約束的交集問題并嚴格剔除捷徑解;最后,通過漸進式拒絕采樣(PRS)技術,在嚴格的遞增輪次預算下,提純出 3 萬條「零冗余」的并行行為種子數據,完美解決了模型 SFT 冷啟動的難題。

      在最核心的強化學習(RL)對齊階段,HyperEyes 徹底顛覆了傳統 RL 的「唯結果論」范式。傳統的稀疏獎勵往往會引發雙重隱患:缺乏效率約束的獎勵機制會縱容模型養成「冗余試錯」的惰性,以犧牲推理速度為代價換取準確率;更糟糕的是,在處理長周期任務時,粗暴的結果導向會帶來極其不公平的「連坐懲罰」—— 即便是一次堪稱完美的中間推理過程,也會因為最終環節的失誤被徹底抹殺,導致模型在復雜探索中迷失方向。



      針對這一問題,團隊創新性地提出了「宏觀 + 微觀」的雙粒度效率感知強化學習框架。在宏觀軌跡層面,系統引入了 TRACE(動態參考的成本效率獎勵)機制。這并不是一個一刀切的步數死命令,而是一把「自我超越」的動態標尺。系統會將模型當前的工具調用表現與標尺對比,只有比標尺更高效才能獲得獎勵。在每個 Epoch 結束后,系統會自動用本輪表現最好、步數最少的軌跡去刷新并收緊標尺。這就像跳高比賽,橫桿隨著模型能力的提升越調越高,逼迫模型不斷擠出水分。

      而在微觀 Token 層面,為了精準搶救失敗軌跡中的「正確中間過程」,HyperEyes 引入了 OPD(策略內蒸餾)機制。這一機制只在軌跡最終答錯時才會啟動,屆時會引入一個 235B 的滿血版教師模型,為失敗軌跡中的每一步提供稠密的 Token 級監督信號,精準打撈那些原本正確的中間規劃。

      這種「僅在失敗時蒸餾」的非對稱設計,完美避免了對學生模型「高效并發」本能的覆蓋。成功時由宏觀獎勵主導效率,失敗時由微觀蒸餾托底糾偏,宏微觀的嚴絲合縫,徹底釋放了多模態大模型的并發檢索天性。

      IMEB Benchmark:把「搜索效率」作為重要評估維度

      現有多模態榜單普遍存在「只看準不看快」的弊端。為了糾正這一導向,團隊發布了首個包含 300 條極具挑戰性多實體視覺評測基準的 IMEB (Image Multi-Entity Benchmark)。

      與之配套,團隊還提出了「成本感知評分」 (CAS)。該評分標準在統一標尺下,將準確率、Token 消耗和工具調用輪次進行聯合評估,把傳統的答案質量換算為「單位延遲下的有效信息密度」,從根本上遏制了大模型靠堆砌算力暴力刷榜的行為。



      實驗結果與核心發現

      在隨后的 6 大主流基準測試中,HyperEyes 展現出了極具統治力的表現,實現了準確率與效率的 Pareto 占優。全面建立開源 SOTA 并非虛言 ——HyperEyes-30B 以64.0%的準確率超越同量級最強開源模型 VDR 達9.9%,而其平均工具調用輪次僅為 VDR 的不到五分之一(2.2 對比 11.6)。而其 235B 版本更是以僅1.1%的微弱差距逼近閉源旗艦 Gemini-3.1-Pro。



      在極為嚴苛的 CAS 成本效率評分中,30B 版本的表現達到了次優開源模型的7.6倍,證明其每一單位算力輸出的信息密度都極高。消融實驗也證實了,這種底層的動作空間重構設計,對傳統的「LLM 外掛裁剪」或「代碼沙箱裁剪」構成了降維打擊。



      更有意思的是其面對噪聲的強魯棒性。在真假證據混合的干擾測試中,HyperEyes 這種「敢于少搜、一次看全」的并行策略,反而大幅規避了過度檢索帶來的幻覺陷阱。



      在一個面對 6 人同框復雜問答的真實測試案例中,傳統 Agent 因為「逐一裁剪 + 搜索」的笨拙邏輯將流程拖拽至 12 輪,最終因噪聲累積而答錯;而 HyperEyes 首輪即并發定位并檢索了全部 6 人,僅用 3 輪便給出精準答案,直觀地展現了什么叫「一次出手,看清全局」。



      結語:多模態搜索智能體的下一站,是「效率即智能」

      長期以來,大家普遍認為多模態搜索必須通過串行加深來保證準確度,而 HyperEyes 打破了這一固有慣性。它用翔實的實驗證明了,在 Agent 訓練中,「準確率」與「效率」完全可以協同進化。

      隨著多模態 Agent 逐漸步入電商比價、視覺檢索、實時交互等真實的高并發業務場景,從「搜得更深」轉向「搜得更寬」,必將成為下一代智能體角逐的核心競爭力。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      官方:沙特裁判組將執法中國U17半決賽;此前國少淘汰沙特

      官方:沙特裁判組將執法中國U17半決賽;此前國少淘汰沙特

      懂球帝
      2026-05-19 20:02:24
      笑麻了,那些外行人看來很蠢的設計,實際上卻精妙無比!

      笑麻了,那些外行人看來很蠢的設計,實際上卻精妙無比!

      另子維愛讀史
      2026-05-16 10:36:47
      時政快訊丨俄羅斯總統普京將抵達北京

      時政快訊丨俄羅斯總統普京將抵達北京

      上觀新聞
      2026-05-19 23:39:42
      廣廈躺進總決賽?孫銘徽+球迷敗光人品,這隊真不配被祝福

      廣廈躺進總決賽?孫銘徽+球迷敗光人品,這隊真不配被祝福

      海闊山遙YAO
      2026-05-19 12:38:43
      日本出席上海APEC會,中方未單獨會晤,外交態度明確

      日本出席上海APEC會,中方未單獨會晤,外交態度明確

      心靈的觸動a
      2026-05-19 15:13:13
      上海雙雄 已確定上半程報銷外援 衛冕冠軍有1個 申花有4個

      上海雙雄 已確定上半程報銷外援 衛冕冠軍有1個 申花有4個

      80后體育大蜀黍
      2026-05-19 22:37:03
      一報告顯示:逾八成中俄青年認為中俄關系友好

      一報告顯示:逾八成中俄青年認為中俄關系友好

      中國青年報
      2026-05-18 16:33:06
      中國給予高規格禮遇!走進天安門廣場前,普京對華第一個訴求曝光

      中國給予高規格禮遇!走進天安門廣場前,普京對華第一個訴求曝光

      夢在深巷aqa
      2026-05-19 21:51:14
      貴定暴雨致7320人受災,居民稱很多車輛被淹,當地:今晚預報還有中到大雨,存在水位上漲可能

      貴定暴雨致7320人受災,居民稱很多車輛被淹,當地:今晚預報還有中到大雨,存在水位上漲可能

      極目新聞
      2026-05-19 21:26:25
      2026年第1個公布漲工資的來了,退休人員養老金的調整還會遠嗎?

      2026年第1個公布漲工資的來了,退休人員養老金的調整還會遠嗎?

      社保小達人
      2026-05-19 09:03:21
      荔枝上市就“遇冷”,為啥便宜吃的人還少?網友:5個原因太現實

      荔枝上市就“遇冷”,為啥便宜吃的人還少?網友:5個原因太現實

      小談食刻美食
      2026-05-19 07:59:22
      真狠!十年從13跌到2.07,又橫盤1年半,張素芬、美國摩根卻重倉

      真狠!十年從13跌到2.07,又橫盤1年半,張素芬、美國摩根卻重倉

      長風價值掘金
      2026-05-19 22:07:09
      國慶約弟弟一家自駕游,5天行程還沒結束,38年的姐弟情徹底鬧掰

      國慶約弟弟一家自駕游,5天行程還沒結束,38年的姐弟情徹底鬧掰

      人間百態大全
      2026-05-19 06:35:03
      臥槽,劃時代大戰!24+11+6+7,馬刺該后悔簽2.22億

      臥槽,劃時代大戰!24+11+6+7,馬刺該后悔簽2.22億

      體育新角度
      2026-05-19 20:12:59
      馬斯克坦言:到上海就像回家,母親早已定居,身價萬億仍拍視頻帶貨

      馬斯克坦言:到上海就像回家,母親早已定居,身價萬億仍拍視頻帶貨

      青橘罐頭
      2026-05-18 14:29:28
      波音股價暴跌4.7%!特朗普口中的200架,中方只給了“有關安排”

      波音股價暴跌4.7%!特朗普口中的200架,中方只給了“有關安排”

      青煙小先生
      2026-05-19 17:03:04
      史上最割裂牛市!十幾年股齡,從未見過這般行情

      史上最割裂牛市!十幾年股齡,從未見過這般行情

      財經智多星
      2026-05-16 12:32:25
      驚爆!蔡卓妍含淚控訴丈夫,新婚20天官宣分手,直言好聚好散

      驚爆!蔡卓妍含淚控訴丈夫,新婚20天官宣分手,直言好聚好散

      人間煙火記事本
      2026-05-19 08:14:15
      離京即反轉!中方清單一出,500架波音落空,美方大單縮水

      離京即反轉!中方清單一出,500架波音落空,美方大單縮水

      墨羽怪談
      2026-05-18 23:08:23
      莫言遇田樸珺手足無措、眼神閃躲,再上熱搜!網友:真是一張一弛

      莫言遇田樸珺手足無措、眼神閃躲,再上熱搜!網友:真是一張一弛

      火山詩話
      2026-05-16 08:38:35
      2026-05-20 00:08:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      13036文章數 142651關注度
      往期回顧 全部

      科技要聞

      馬斯克敗訴,法院判他起訴OpenAI太晚了

      頭條要聞

      媒體:特朗普為何拋涉臺"四不"說法 魯比奧解釋清楚了

      頭條要聞

      媒體:特朗普為何拋涉臺"四不"說法 魯比奧解釋清楚了

      體育要聞

      文班亞馬:沒拿到MVP,就證明自己是MVP

      娛樂要聞

      姚晨刪博難平眾怒,為什么她還能蹦噠

      財經要聞

      潔麗雅硬剛豪門內斗傳言

      汽車要聞

      煥新極氪009上市41.38萬起 齊家版讓MPV回歸家庭

      態度原創

      親子
      時尚
      教育
      數碼
      軍事航空

      親子要聞

      安慶市婦計中心舉辦“科學喂養為愛續航”母乳喂養日主題活動

      57歲惡女出手整治浪姐,全網拍手叫好

      教育要聞

      【預告】5月22日 | 南方教研大講堂第186場——在知識建構中培育學生數學思維的實踐探索(初中數學專場)

      數碼要聞

      聯想推出拯救者電競耳機Y960,600元

      軍事要聞

      特朗普暫緩打擊伊朗 稱系應中東三國請求

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产成人精品白浆久久69| 又大又紧又粉嫩18p少妇| 免费国产a国产片高清网站 | 在线中文人妻| 国内精品久久人妻无码不卡| 亚洲欧洲日产韩国无码| 久久综合视频网站| 国产成人av无码精品| 亚洲一区二区偷拍| 一本色道久久综合熟妇人妻| 国产福利高颜值在线观看| 亚洲中文在线观看| 亚洲伊人色色| 国产精品久久久久久久久电影网| 国产女人久久久| 亚欧美国产色| 国产亚洲色视频在线| 一级毛片免费不卡在线视频| 国产精品国产午夜免费看福利| 性欧美vr高清极品| 夜夜欢夜夜干| 扒开双腿被两个男人玩弄视频| 中文字幕久久人妻无码精品蜜桃| 免费一本色道久久88一综合| 亚洲中文字幕无码天然素人在线| 美乳丰满人妻无码视频| 欧美乱人伦视频在线观看| 91丝袜在线| 91福利在线看| 亚洲国产成人久久一区WWW| 四虎www永久在线精品| 中文字幕一区二区三区在线毛片| 少女高清影视在线观看动漫| 免费av网址在线观看| 蜜臀av一区二区精品字幕| 成 人 色综合 综合网站| 大悟县| 乱人伦中文字幕在线不卡网站| 天堂а√中文在线官网| 97福利视频| 精品乱码一区二区三四区视频 |