<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

      AdaGen: 讓圖像生成模型學(xué)會(huì)自適應(yīng)策略

      0
      分享至



      當(dāng)前主流的圖像生成模型——擴(kuò)散模型(如 DiT)、自回歸模型(如 VAR)、掩碼生成模型(如 MaskGIT)、流模型(如 SiT)——都遵循一個(gè)共同范式:將復(fù)雜的圖像生成任務(wù)拆解為多個(gè)可控的子步驟,逐步迭代完成。然而,這種多步策略引入了一個(gè)不可忽視的問題:每一步都需配置大量超參數(shù)(如噪聲水平、采樣溫度、引導(dǎo)尺度等),而現(xiàn)有方法普遍依賴手工設(shè)計(jì)的靜態(tài)調(diào)度規(guī)則來管理這些參數(shù)。

      這種做法存在兩個(gè)重要缺陷:一是需要大量專家知識(shí)和反復(fù)調(diào)參,二是"一刀切"的靜態(tài)策略無法適配每個(gè)樣本的獨(dú)特特性。

      本文提出AdaGen——一個(gè)通用的、可學(xué)習(xí)的、樣本自適應(yīng)的生成策略框架。通過強(qiáng)化學(xué)習(xí)訓(xùn)練一個(gè)輕量級(jí)策略網(wǎng)絡(luò),AdaGen 能根據(jù)當(dāng)前生成狀態(tài)自動(dòng)為每個(gè)樣本定制最優(yōu)的生成策略,在四大主流生成范式上均實(shí)現(xiàn)了顯著的性能提升與效率優(yōu)化。

      • 論文標(biāo)題:
      • AdaGen: Learning Adaptive Policy for Image Synthesis
      • 論文鏈接:
      • https://arxiv.org/abs/2603.06993
      • 論文代碼:
      • https://github.com/LeapLabTHU/AdaGen

      核心動(dòng)機(jī):從"靜態(tài)一刀切"到"動(dòng)態(tài)因材施教"



      圖:AdaGen的核心思想?,F(xiàn)有方法使用預(yù)定義的靜態(tài)策略,所有樣本共享相同調(diào)度規(guī)則;AdaGen則通過RL訓(xùn)練的策略網(wǎng)絡(luò),為每個(gè)樣本自適應(yīng)地產(chǎn)生定制化的生成策略。

      現(xiàn)有的多步生成模型在推理時(shí),所有樣本共享同一套預(yù)定義的調(diào)度規(guī)則。以 MaskGIT 為例,即使生成步數(shù)為 T = 16,也需要配置 64 個(gè)策略參數(shù)(每步 4 個(gè)參數(shù)),實(shí)際操作中極度依賴人工經(jīng)驗(yàn)。更關(guān)鍵的是,一張簡單的風(fēng)景圖和一張復(fù)雜的人物肖像,真的應(yīng)該用完全相同的生成策略嗎?

      AdaGen 的核心思想非常直觀:引入一個(gè)通過強(qiáng)化學(xué)習(xí)訓(xùn)練的策略網(wǎng)絡(luò)(Policy Network),讓它觀察當(dāng)前的生成狀態(tài),自動(dòng)且自適應(yīng)地為每個(gè)樣本決定最優(yōu)的生成參數(shù)。

      統(tǒng)一 MDP 建模:一個(gè)框架統(tǒng)一四大生成范式







      狀態(tài)轉(zhuǎn)移 (Transition):由預(yù)訓(xùn)練的生成模型決定。擴(kuò)散模型和流模型的轉(zhuǎn)移由 ODE 求解器確定,是確定性的;MaskGIT 和自回歸模型的轉(zhuǎn)移則是隨機(jī)的





      對抗獎(jiǎng)勵(lì)建模:不讓策略"投機(jī)取巧"

      訓(xùn)練策略網(wǎng)絡(luò)的另一個(gè)核心挑戰(zhàn)在于:如何設(shè)計(jì)有效的獎(jiǎng)勵(lì)信號(hào)?論文探索了三種方案,揭示了一個(gè)重要發(fā)現(xiàn):



      圖:三種獎(jiǎng)勵(lì)設(shè)計(jì)的對比。(a) 用FID作獎(jiǎng)勵(lì):FID雖低至2.56,但圖像質(zhì)量差,保真度不達(dá)標(biāo);(b) 用預(yù)訓(xùn)練獎(jiǎng)勵(lì)模型:保真度好了但樣本多樣性嚴(yán)重不足;(c) AdaGen的對抗獎(jiǎng)勵(lì)建模:保真度與多樣性兼顧。

      (a) 用 FID 作獎(jiǎng)勵(lì):雖然 FID 數(shù)值可以被優(yōu)化到很低(2.56),但生成圖像的視覺質(zhì)量反而很差。策略網(wǎng)絡(luò)學(xué)會(huì)了"刷"指標(biāo)的捷徑,犧牲了視覺保真度。

      (b) 用預(yù)訓(xùn)練獎(jiǎng)勵(lì)模型:保真度上去了,但生成樣本趨于同質(zhì)化,多樣性嚴(yán)重不足。策略過擬合于獎(jiǎng)勵(lì)模型的偏好。

      (c) 對抗獎(jiǎng)勵(lì)建模(AdaGen 的方案):引入一個(gè)判別器作為獎(jiǎng)勵(lì)模型,與策略網(wǎng)絡(luò)進(jìn)行對抗訓(xùn)練。策略網(wǎng)絡(luò)試圖最大化獎(jiǎng)勵(lì),而判別器則不斷提高區(qū)分真假圖像的標(biāo)準(zhǔn),有效防止策略過擬合。最終實(shí)現(xiàn)了保真度與多樣性的良好平衡。



      圖:AdaGen的訓(xùn)練流程。策略網(wǎng)絡(luò)控制生成過程產(chǎn)生圖像,對抗獎(jiǎng)勵(lì)模型同時(shí)評(píng)估生成結(jié)果并不斷自我進(jìn)化。預(yù)訓(xùn)練生成模型在整個(gè)過程中保持凍結(jié)。

      訓(xùn)練算法簡潔優(yōu)雅,核心循環(huán)僅包含兩步:(1) 策略網(wǎng)絡(luò)優(yōu)化:生成圖像,用 PPO 算法更新策略網(wǎng)絡(luò)使獎(jiǎng)勵(lì)最大化;(2) 獎(jiǎng)勵(lì)模型優(yōu)化:同時(shí)采樣真實(shí)和生成圖像,訓(xùn)練判別器更好地區(qū)分兩者。兩者交替進(jìn)行,形成類似 GAN 的博弈過程。

      動(dòng)作平滑:馴服高維動(dòng)作空間的探索





      圖:優(yōu)化過程。當(dāng)生成步數(shù)從T=8增加到T=32時(shí)(黃色曲線),優(yōu)化變得不穩(wěn)定且性能下降。引入動(dòng)作平滑后(紅色曲線),訓(xùn)練恢復(fù)穩(wěn)定且性能超越T=8基線。

      論文發(fā)現(xiàn),不穩(wěn)定性的根源在于 PPO 探索時(shí)對每步獨(dú)立添加高斯噪聲,導(dǎo)致動(dòng)作序列出現(xiàn)劇烈且不必要的高頻波動(dòng)。而對于逐步推進(jìn)的迭代生成過程,最優(yōu)策略往往是平滑變化的。為此,論文提出動(dòng)作平滑技術(shù)——對策略輸出施加指數(shù)移動(dòng)平均(EMA)濾波:







      圖:動(dòng)作平滑前后的對比。左側(cè)未平滑時(shí),動(dòng)作序列劇烈抖動(dòng)(FID=3.5);右側(cè)引入平滑后,序列合理平穩(wěn)(FID=2.3)。

      上圖直觀對比了平滑前后的效果:從雜亂無章的鋸齒波到平滑有序的下降曲線,F(xiàn)ID 也從 3.5 降至 2.3。

      實(shí)驗(yàn)結(jié)果:四大范式全面提升

      跨范式有效性驗(yàn)證

      AdaGen 在 ImageNet 256×256 上跨越四大生成范式、六個(gè)模型進(jìn)行了驗(yàn)證。在所有范式和推理步數(shù)下,AdaGen 均一致超越對應(yīng)的基線方法,且性能增益在推理步數(shù)較少時(shí)更為顯著:



      表:AdaGen 在 ImageNet 256×256 上的 FID-50K 結(jié)果(↓越低越好),覆蓋四大生成范式。注:MaskGIT、DiT、SiT 在不同推理步數(shù) T 下評(píng)測;VAR 采用固定的 10 步生成,因此僅在 T=10 列報(bào)告結(jié)果。

      效率優(yōu)勢



      圖:AdaGen在四種模型上的質(zhì)量-效率權(quán)衡。無論是理論計(jì)算量(TFLOPs)還是實(shí)際GPU/CPU推理時(shí)延,AdaGen均能推進(jìn)質(zhì)量-效率前沿,實(shí)現(xiàn)1.6×到3.6×的推理加速。

      上圖系統(tǒng)展示了 AdaGen 在四種生成模型上的質(zhì)量-效率權(quán)衡。無論是理論計(jì)算量還是實(shí)際推理延遲,AdaGen 均一致推進(jìn)了質(zhì)量-效率前沿,實(shí)現(xiàn)1.6× 到 3.6×的推理加速。

      極低的額外開銷

      AdaGen 的策略網(wǎng)絡(luò)僅為生成器增加0.07% 到 0.40%的額外推理計(jì)算量,因此其性能提升并不以增大推理開銷為代價(jià):



      表:AdaGen 策略網(wǎng)絡(luò)的推理開銷占生成器總計(jì)算量的比例。

      結(jié)語

      AdaGen 將生成策略的設(shè)計(jì)從"手工藝術(shù)"轉(zhuǎn)變?yōu)?數(shù)據(jù)驅(qū)動(dòng)的優(yōu)化問題"。通過統(tǒng)一的 MDP 建模、對抗獎(jiǎng)勵(lì)設(shè)計(jì)和動(dòng)作平滑技術(shù),AdaGen 以一種輕量、通用的方式,在四大主流生成范式上實(shí)現(xiàn)了 17% 到 54% 的性能提升,或 1.6× 到 3.6× 的推理加速。這一工作表明,多步生成模型的潛力遠(yuǎn)未被充分挖掘——一個(gè)好的"調(diào)度策略",和模型架構(gòu)本身同樣重要。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      拋棄漂亮飯的年輕人,集體鉆進(jìn)老式咖啡餐吧?

      拋棄漂亮飯的年輕人,集體鉆進(jìn)老式咖啡餐吧?

      九行Travel
      2026-05-11 16:05:20
      知情人士披露:美國或考慮恢復(fù)對伊朗軍事行動(dòng)

      知情人士披露:美國或考慮恢復(fù)對伊朗軍事行動(dòng)

      界面新聞
      2026-05-12 13:27:48
      男團(tuán)、女團(tuán)奪冠僅1天,韓媒、日媒接連發(fā)聲銳評(píng),態(tài)度出奇一致

      男團(tuán)、女團(tuán)奪冠僅1天,韓媒、日媒接連發(fā)聲銳評(píng),態(tài)度出奇一致

      夢醉為紅顏一笑
      2026-05-12 11:54:46
      世界紀(jì)錄將被浙江企業(yè)改寫!紹興造世界最高樓沖刺1008米!

      世界紀(jì)錄將被浙江企業(yè)改寫!紹興造世界最高樓沖刺1008米!

      天氣觀察站
      2026-05-12 11:09:49
      劉曉彤當(dāng)選!惠若琪在列,徐云麗無緣,中國排協(xié)公布完整名單

      劉曉彤當(dāng)選!惠若琪在列,徐云麗無緣,中國排協(xié)公布完整名單

      跑者排球視角
      2026-05-12 16:49:17
      卡拉格:切爾西絕對會(huì)不惜一切代價(jià)把熱刺送到英冠

      卡拉格:切爾西絕對會(huì)不惜一切代價(jià)把熱刺送到英冠

      懂球帝
      2026-05-12 12:20:06
      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實(shí)情

      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實(shí)情

      健康科普365
      2026-05-09 21:05:04
      今年將迎“史上最熱夏天”?專家分析

      今年將迎“史上最熱夏天”?專家分析

      澎湃新聞
      2026-05-13 00:02:11
      食堂阿姨偷偷給貧困生多打菜,被同學(xué)舉報(bào)后開除,次日接到局里電話

      食堂阿姨偷偷給貧困生多打菜,被同學(xué)舉報(bào)后開除,次日接到局里電話

      罪案洞察者
      2025-11-03 13:59:03
      “你兒子比農(nóng)村土狗還好養(yǎng)!”中學(xué)男孩全碳水飲食,吃出可憐面相

      “你兒子比農(nóng)村土狗還好養(yǎng)!”中學(xué)男孩全碳水飲食,吃出可憐面相

      妍妍教育日記
      2026-05-12 17:35:01
      14歲被送上導(dǎo)演的床,17歲拍全裸寫真,被操控半生,如今怎樣了?

      14歲被送上導(dǎo)演的床,17歲拍全裸寫真,被操控半生,如今怎樣了?

      阿訊說天下
      2026-04-18 11:52:55
      珠穆朗瑪峰南坡大本營附近發(fā)生雪崩,滑落的雪流掀起強(qiáng)烈氣浪直沖而下,親歷者:事發(fā)時(shí)正在上廁所,眼見雪流逼近,急忙躲進(jìn)廚房避險(xiǎn)

      珠穆朗瑪峰南坡大本營附近發(fā)生雪崩,滑落的雪流掀起強(qiáng)烈氣浪直沖而下,親歷者:事發(fā)時(shí)正在上廁所,眼見雪流逼近,急忙躲進(jìn)廚房避險(xiǎn)

      大風(fēng)新聞
      2026-05-12 16:24:28
      申花簽下馬萊加三年長約,鋒線補(bǔ)強(qiáng)球迷期待新賽季

      申花簽下馬萊加三年長約,鋒線補(bǔ)強(qiáng)球迷期待新賽季

      漫川舟船
      2026-05-13 00:16:35
      他奉命清查康、謝罪行,73歲當(dāng)中紀(jì)委常務(wù)書記,侄女是著名歌唱家

      他奉命清查康、謝罪行,73歲當(dāng)中紀(jì)委常務(wù)書記,侄女是著名歌唱家

      舊書卷里的長安
      2026-05-11 21:04:17
      從“跨省大交流”走上省部級(jí)崗位

      從“跨省大交流”走上省部級(jí)崗位

      香港經(jīng)濟(jì)導(dǎo)報(bào)
      2026-05-12 11:41:21
      表決結(jié)果出爐,江啟臣臨陣退縮,綠營氣急敗壞,盧秀燕這回尷尬了

      表決結(jié)果出爐,江啟臣臨陣退縮,綠營氣急敗壞,盧秀燕這回尷尬了

      呼呼歷史論
      2026-05-11 18:33:47
      WTA1000羅馬站:高芙2-1逆轉(zhuǎn)俄羅斯悍將,驚險(xiǎn)晉級(jí)4強(qiáng)

      WTA1000羅馬站:高芙2-1逆轉(zhuǎn)俄羅斯悍將,驚險(xiǎn)晉級(jí)4強(qiáng)

      俯身沖頂
      2026-05-13 03:27:36
      中紀(jì)委點(diǎn)名!國資做LP,虧了200億

      中紀(jì)委點(diǎn)名!國資做LP,虧了200億

      融資中國
      2026-05-12 11:53:02
      連續(xù)2場上演輸2追3!梁靖崑被王皓調(diào)侃:梁教授這很符合你的專業(yè)

      連續(xù)2場上演輸2追3!梁靖崑被王皓調(diào)侃:梁教授這很符合你的專業(yè)

      風(fēng)過鄉(xiāng)
      2026-05-12 10:30:02
      賺了1.1萬!深夜大跳水!A股明天暴風(fēng)雨?

      賺了1.1萬!深夜大跳水!A股明天暴風(fēng)雨?

      龍行天下虎
      2026-05-13 00:07:31
      2026-05-13 05:39:00
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      12979文章數(shù) 142648關(guān)注度
      往期回顧 全部

      科技要聞

      宇樹發(fā)布載人變形機(jī)甲,定價(jià)390萬元起

      頭條要聞

      特朗普稱將同中方討論對臺(tái)軍售和黎智英案 外交部回應(yīng)

      頭條要聞

      特朗普稱將同中方討論對臺(tái)軍售和黎智英案 外交部回應(yīng)

      體育要聞

      騎士終于玩明白了?

      娛樂要聞

      白鹿風(fēng)波升級(jí)!掉粉20萬評(píng)論區(qū)淪陷

      財(cái)經(jīng)要聞

      利潤再腰斬 京東干外賣后就沒過過好日子

      汽車要聞

      吉利銀河“TT”申報(bào)圖曝光 電動(dòng)尾翼+激光雷達(dá)

      態(tài)度原創(chuàng)

      本地
      旅游
      數(shù)碼
      手機(jī)
      公開課

      本地新聞

      用蘇繡的方式,打開江西婺源

      旅游要聞

      故宮擠滿游客,人人撐傘前行:寧愿熱到出汗,也要奔赴紫禁城!

      數(shù)碼要聞

      看電視的人越來越多了 3億臺(tái)電視在線 小米第一

      手機(jī)要聞

      10年支持不變:谷歌力保現(xiàn)有Chromebook

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 欧美视频区| 日本高清视频网站www| 亚洲成A人片在线观看无码不卡| 国内精品久久久久久| 91精品网站| 一区二区三区日韩| 国产精品久久久久影院老司| 国产日本一区二区精品| 精品成人免费国产片| 亚洲国产三级在线观看| 国产va免费精品观看| 亚洲中文字幕无码一区二区三区| 国产av熟女一区二区三区| 国产成人亚洲精品成人区| 国产主播第一页| 麻豆精品网站| 扒开双腿猛进入喷水高潮视频 | 久草国产手机视频在线观看| 国产三级韩国三级日产三级| 国产成人无码免费看片软件| 久久人妻无码一区二区三区av| 国内揄拍国内精品少妇国语| 黑人玩弄漂亮少妇高潮大叫| 国模精品视频一区二区三区| 欧美1024| 97免费人妻在线视频| xxxxxx国产| 在线视频中文字幕二区| 亚洲一区二区三区日本| 午夜不卡福利| 波多野结衣爽到高潮漏水大喷| 99欧美日本一区二区留学生| 国产老熟女伦老熟妇露脸| 日韩精品久久一区二区三| 白丝精品一区二区三区| 国产又黄又硬又粗| 亚洲片在线观看| 日韩电影一区二区三区| 亚洲一区二区三区成人网站 | 成人片黄网站a毛片免费| 少妇内射高潮福利炮|