<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      JarvisEvo 如何讓 Agent 像人類一樣擁有「視覺反思」能力?

      0
      分享至



      在邁向通用人工智能的道路上,我們一直在思考一個問題:現(xiàn)有的 Image Editing Agent,真的「懂」修圖嗎?

      大多數(shù)基于 LLM/VLM 的智能體,本質(zhì)上更像是一個「盲目的指揮官」。它們能流利地寫出修圖代碼或調(diào)用 API,但在按下回車鍵之前,它們看不見畫布上的變化,也無法像人類設(shè)計師那樣,盯著屏幕皺眉說:「這張對比度拉太高了,得往回收到一點。」這種感知與決策的割裂,直接導(dǎo)致了「指令幻覺」,或者說模型在進行盲目的「腦補」。由于缺乏視覺反饋,模型往往憑空想象下一步操作,導(dǎo)致結(jié)果與用戶的初衷南轅北轍。

      此外,在傳統(tǒng)強化學習中經(jīng)常依賴于靜態(tài)的獎勵模型。隨著模型的不斷訓練,它很容易學會如何「討好」這個固定的打分器,導(dǎo)致Reward Hacking——即分數(shù)很高,但審美并沒有真正提升。

      為了打破這一僵局,JarvisEvo應(yīng)運而生。它不僅僅是一個連接 Adobe Lightroom 的自動化工具使用者,更是一次大膽的探索:探索 Agent 如何通過「內(nèi)省」,真正實現(xiàn)自我進化。



      • 論文標題:JarvisEvo: Towards a Self-Evolving Photo Editing Agent with Synergistic Editor-Evaluator Optimization
      • 論文地址:https://www.arxiv.org/pdf/2511.23002
      • 項目主頁:https://jarvisevo.vercel.app/
      • Github:https://github.com/LYL1015/JarvisEvo
      • Huggingface Daily Paper:https://huggingface.co/papers/2511.23002
      • 作者團隊來自騰訊混元和廈門大學:Yunlong Lin*, Linqing Wang*, Kunjie Lin*, Zixu Lin*, Kaixiong Gong, Wenbo Li, Bin Lin, Zhenxi Li, Shiyi Zhang, Yuyang Peng, Wenxun Dai, Xinghao Ding?, Chunyu Wang?, Qinglin Lu?

      核心范式轉(zhuǎn)移:

      從「執(zhí)行者」到「思考者」



      JarvisEvo 的核心哲學在于模仿人類專家的慢思考模式。一個資深修圖師的工作流永遠是閉環(huán)的:觀察原圖 -> 構(gòu)思 -> 嘗試調(diào)整 -> 觀察結(jié)果 -> 評估/反思 -> 再調(diào)整。我們將這一直覺轉(zhuǎn)化為三大技術(shù)支柱:

      iMCoT:讓思維鏈「長出眼睛」

      傳統(tǒng)的思維鏈 (CoT) 是純文本的獨角戲。JarvisEvo 引入了iMCoT (Interleaved Multimodal Chain-of-Thought),將視覺反饋強行插入推理循環(huán)。

      • 打破黑盒:每執(zhí)行一步工具(例如調(diào)整色溫),系統(tǒng)立刻生成中間渲染圖。
      • 動態(tài)規(guī)劃:模型不再是一次性生成所有步驟,而是基于當前的視覺狀態(tài)來決定下一步。它能「看到」上一具體操作帶來的過曝或偏色,并即時修正。



      SEPO:左手畫圖,右手打分

      這是 JarvisEvo 最「性感」的設(shè)計。既然外部獎勵模型容易被 Hack,那為什么不讓 Agent 自己訓練自己的審美?我們提出了SEPO (Synergistic Editor-Evaluator Policy Optimization),讓模型在訓練中分飾兩角:

      • 編輯者 (Editor):負責干活,目標是修出好圖。
      • 評估者 (Evaluator):負責挑刺,目標是精準打分。

      這就形成了一種類似 GAN 但更復(fù)雜的協(xié)同進化:編輯者為了拿高分,必須提升修圖質(zhì)量;評估者為了不被人類專家「打臉」,必須提升鑒賞能力。為了防止模型「作弊」(即模型發(fā)現(xiàn)只要生成「100 分」的文本就能降低 Loss),我們設(shè)計了SLM (Selective Loss Masking)機制。這相當于老師在改卷時,遮住了學生自己寫的「我給自己打滿分」那一行,迫使學生只能靠前面的解題過程(推理和工具使用)來真正贏得高分。

      On-Policy Reflection:從錯誤中提煉智慧

      JarvisEvo 的第三個殺手锏是它的反思機制。

      在 Stage 2 的訓練中,我們構(gòu)建了一個自動化流水線:當模型偶然修出了一張好圖(高分軌跡),而之前某次嘗試失敗了(低分軌跡),系統(tǒng)會立刻捕捉這組對比。

      通過引入「導(dǎo)師模型」(如 Gemini/GPT-4),我們讓系統(tǒng)分析:「剛才那次為什么失敗?是因為白平衡參數(shù)太激進了嗎?」

      這種生成的反思數(shù)據(jù) (Reflection Data)被用于第三階段的微調(diào)。最終,JarvisEvo 習得的不僅是「如何修圖」,更是「當修壞了時如何自救」。



      硬核工程:ArtEdit 數(shù)據(jù)集與訓練流水線

      為了支撐這套邏輯,我們沒有使用通用的微調(diào)數(shù)據(jù),而是從零構(gòu)建了 ArtEdit:

      • 170K 專業(yè)樣本:覆蓋從風光到人像的 10 大類攝影場景。
      • 全工具鏈覆蓋:完美映射 Adobe Lightroom 的 200+ 個參數(shù)。
      • 雙視角數(shù)據(jù):既有修圖軌跡 (ArtEdit-Lr),也有人類專家的審美評分 (ArtEdit-Eval)。

      我們的訓練并非一蹴而就,而是采用了類似人類學習的三階段課程 (Curriculum Learning):

      • 冷啟動 (SFT):先學會工具怎么用,語法怎么寫。
      • 協(xié)同進化 (RL/SEPO):扔掉標準答案,在自我探索中通過「左右互搏」提升上限。
      • 反思微調(diào) (Reflection):針對易錯點進行特訓,學會自我糾錯。



      實驗結(jié)果


      ArtEdit-Bench 評測結(jié)果







      在嚴苛的ArtEdit-Bench評測中,JarvisEvo 展現(xiàn)了統(tǒng)治力:

      • 內(nèi)容保真度:相比商業(yè)模型 Nano-Banana,L1/L2 誤差降低了44.96%。這意味著它在修圖時不會破壞原圖的畫質(zhì)細節(jié)。
      • 人類偏好:在盲測中,JarvisEvo 取得了49%的勝率,遠超 Nano-Banana 的28%。
      • 審美對齊:更有趣的是,作為「裁判」,JarvisEvo 對圖片質(zhì)量的打分與人類專家的相關(guān)性 (SRCC 0.7243) 甚至超過了 Gemini-2.5-Flash。

      視覺效果



      在視覺效果上,JarvisEvo 專為細粒度專業(yè)調(diào)色而生。得益于其深度的意圖理解、多模態(tài)推理以及獨特的自我反思閉環(huán),JarvisEvo 在處理復(fù)雜修圖需求時,展現(xiàn)出了超越當前所有商業(yè)及開源 AIGC 模型的顯著優(yōu)勢。

      JarvisEvo vs. OpenAI X Adobe PhotoShop



      出于好奇跑了一下 OpenAI 的新功能,雖然能調(diào) PS,但感覺更像是 Workflow 的搭建,缺乏垂直數(shù)據(jù)的 Training。在我們的 Benchmark 上,論指令遵循和修圖審美,目前的 JarvisEvo 表現(xiàn)明顯還是要更好很多。

      結(jié)語:

      不僅是修圖

      JarvisEvo 的意義遠超圖像編輯本身。 它驗證了一種「Actor-Critic 協(xié)同進化」的通用范式。這種讓模型在內(nèi)部建立「自我批評家」,并通過多模態(tài)反饋不斷修正行動路徑的方法,完全可以復(fù)用到復(fù)雜代碼生成、數(shù)學推理、機器人控制等需要長程規(guī)劃的領(lǐng)域。

      我們正在見證 Agent 從「聽話的執(zhí)行者」向「會反思的創(chuàng)作者」的驚險一躍。而 JarvisEvo,剛剛邁出了這一步。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      演員熱依扎回應(yīng)暫別演藝圈

      演員熱依扎回應(yīng)暫別演藝圈

      半島晨報
      2026-05-11 12:49:10
      不斷挑撥離間!小玥兒忍無可忍,一個動作揭開了與馬筱梅的關(guān)系

      不斷挑撥離間!小玥兒忍無可忍,一個動作揭開了與馬筱梅的關(guān)系

      觀察鑒娛
      2026-05-12 09:28:50
      5月,遇到這堿性水果,買它20斤,曬干囤起來,從夏天吃到秋天

      5月,遇到這堿性水果,買它20斤,曬干囤起來,從夏天吃到秋天

      阿龍美食記
      2026-05-11 09:18:41
      完整監(jiān)控曝光!故意挑釁逆行撞死一人的小伙已無生命危險

      完整監(jiān)控曝光!故意挑釁逆行撞死一人的小伙已無生命危險

      映射生活的身影
      2026-05-11 20:29:40
      北京一男子掏空積蓄,湊500萬入股中國人壽,20年后分紅嚇人

      北京一男子掏空積蓄,湊500萬入股中國人壽,20年后分紅嚇人

      一刀故事
      2025-05-14 13:32:29
      果不其然,特朗普訪華又生變數(shù)?中方提的要求,美方竟然一口回絕

      果不其然,特朗普訪華又生變數(shù)?中方提的要求,美方竟然一口回絕

      月滿樓熊安全
      2026-05-12 17:34:57
      陳布雷拜讀論持久戰(zhàn)后感嘆道:毛公若在南京主政,蔣公無立身之地

      陳布雷拜讀論持久戰(zhàn)后感嘆道:毛公若在南京主政,蔣公無立身之地

      睡前講故事
      2026-04-21 11:38:12
      后悔莫及,兩三百元維修費,換兩條人命!遼寧北鎮(zhèn)悲劇本可避免

      后悔莫及,兩三百元維修費,換兩條人命!遼寧北鎮(zhèn)悲劇本可避免

      一口娛樂
      2026-05-04 12:30:11
      河北27歲張霞離世,長得漂亮,剛結(jié)婚一年,生前遺愿曝光看哭眾人

      河北27歲張霞離世,長得漂亮,剛結(jié)婚一年,生前遺愿曝光看哭眾人

      攬星河的筆記
      2026-05-11 23:15:42
      紐約名媛自曝:我專門寫富人有多慘,51歲仍住上東區(qū)卻讓孩子去食物銀行做義工

      紐約名媛自曝:我專門寫富人有多慘,51歲仍住上東區(qū)卻讓孩子去食物銀行做義工

      娛圈觀察員
      2026-05-11 20:03:55
      別再造神了!吳宜澤好友曝真實家境,并非寒門 經(jīng)濟壓力大也不是窮

      別再造神了!吳宜澤好友曝真實家境,并非寒門 經(jīng)濟壓力大也不是窮

      科學發(fā)掘
      2026-05-12 10:08:17
      FIFA很頭疼!擴軍本是想讓中印入圍+而非佛得角 27億人已被其激怒

      FIFA很頭疼!擴軍本是想讓中印入圍+而非佛得角 27億人已被其激怒

      風過鄉(xiāng)
      2026-05-12 16:42:51
      主力尾盤大幅凈流入云南鍺業(yè)、太極實業(yè)、東山精密

      主力尾盤大幅凈流入云南鍺業(yè)、太極實業(yè)、東山精密

      每日經(jīng)濟新聞
      2026-05-12 16:03:31
      你最接近生理極限的一次經(jīng)歷是什么?網(wǎng)友分享讓人目瞪口呆!

      你最接近生理極限的一次經(jīng)歷是什么?網(wǎng)友分享讓人目瞪口呆!

      夜深愛雜談
      2026-04-09 19:39:13
      美專家曾言:美軍一旦向北京、上海扔下核彈,中國并不會對等報復(fù)

      美專家曾言:美軍一旦向北京、上海扔下核彈,中國并不會對等報復(fù)

      音樂時光的娛樂
      2026-05-12 19:36:46
      褲子上這兩根繩,一定還有它存在的道理!

      褲子上這兩根繩,一定還有它存在的道理!

      新住家居
      2026-05-12 06:06:10
      猛料!美36位精神病專家呼吁立即罷免特朗普;俄200架無人機襲烏

      猛料!美36位精神病專家呼吁立即罷免特朗普;俄200架無人機襲烏

      史政先鋒
      2026-05-12 20:17:03
      河南商丘一農(nóng)貿(mào)市場發(fā)生火災(zāi),當?shù)赝▓螅簾o人員傷亡

      河南商丘一農(nóng)貿(mào)市場發(fā)生火災(zāi),當?shù)赝▓螅簾o人員傷亡

      極目新聞
      2026-05-12 14:27:26
      美總統(tǒng)出訪為何連排泄物都要打包帶回?

      美總統(tǒng)出訪為何連排泄物都要打包帶回?

      觀星賞月
      2026-05-12 02:38:46
      又一個郭晶晶?退役后嫁頂級豪門,7年連生4娃,如今已是頂級闊太

      又一個郭晶晶?退役后嫁頂級豪門,7年連生4娃,如今已是頂級闊太

      珺瑤婉史
      2026-05-03 19:20:12
      2026-05-12 21:24:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      12979文章數(shù) 142648關(guān)注度
      往期回顧 全部

      科技要聞

      宇樹發(fā)布載人變形機甲,定價390萬元起

      頭條要聞

      男子自帶挖掘機為社區(qū)修路墜崖身亡 社區(qū)不認可系工亡

      頭條要聞

      男子自帶挖掘機為社區(qū)修路墜崖身亡 社區(qū)不認可系工亡

      體育要聞

      總是掉鏈子的“倒霉蛋”,闖進了歐戰(zhàn)決賽

      娛樂要聞

      白鹿風波升級!掉粉20萬評論區(qū)淪陷

      財經(jīng)要聞

      黃仁勛真是被白宮徹底封殺了

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態(tài)度原創(chuàng)

      藝術(shù)
      游戲
      房產(chǎn)
      本地
      軍事航空

      藝術(shù)要聞

      這位畫家的油畫美人讓人驚嘆不已!

      大司馬找小團團一起玩遭拒 直言不喜歡粉絲刷大禮物

      房產(chǎn)要聞

      穗八條引爆樓市!萬博寶藏紅盤,五一勁銷出圈

      本地新聞

      用蘇繡的方式,打開江西婺源

      軍事要聞

      知情人士披露:美國或考慮恢復(fù)對伊朗軍事行動

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 综合欧美日韩一区二区三区| 国内极度色诱视频网站| 日韩精品一区二区三区中文无码| 青青草原精品资源站久久| 国产精品IGAO视频网网址| 精品乱码一区二区| 国产成人免费午夜在线观看| 成人精品在线观看| 污视频网站在线观看| 69久久精品无码一区二区 | 久久不见久久见免费影院www日本| sm男人的天堂| 男女无遮挡猛进猛出免费观看视频| 日韩人妻中文无码一区二区七区| 女人张开腿无遮无挡视频| 热思思99re久久精品国产首页| 97爱色| 亚洲精品成人av久久久| 欧美亚洲日本国产其他| 国产乱人伦AV在线A麻豆| 国产高清在线精品一区| 欧美人成精品网站播放| 国产精品视频超级碰| 熟女A片| 潮喷在线播放| 久久婷婷国产五月综合色| 三都| 成人在线第一页| 自拍视频一区二区三区四区| 亚洲一区二区偷拍| 国语精品国内自产视频| 成人国产欧美大片一区| 两性色午夜视频免费播放| 国产乱子伦精品免费女| 国产在线一区二区不卡| 少妇免费毛片久久久久久久久| 国产xxxx| 成人网页在线观看| 午夜夜伦鲁鲁片免费无码| 无码精品日韩中文字幕| 亚洲高清国产拍精品青青草原|