<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      CVPR 2026 | 20步也能穩住畫質,這個擴散加速方法不一樣

      0
      分享至



      作者介紹:本文的共同第一作者為崔奔雷(阿里巴巴)和何少軒(阿里巴巴實習生、浙江大學)主要研究領域為多模態理解與生成,通訊作者洪海文(阿里巴巴)和趙洲(浙江大學)主要研究領域分別為多模態大語言模型、語音理解生成等方向。

      近年來,擴散模型已成為圖像、音頻、視頻等多模態生成的核心技術路線,并在工業界得到廣泛應用。但在實際落地中仍存在關鍵瓶頸:工業級推理預算通常只有 20–30 步,在這一約束下,許多加速方法仍會出現紋理錯亂、顏色漂移、軌跡偏離等問題,影響生成質量與穩定性。

      這一問題也限制了生成技術在理解側訓練中的大規模應用,而這對于補充安全場景中的高危稀缺樣本、構造生產環境下的對抗變異樣本至關重要。高危圖片和視頻往往傳播快、危害大,但樣本數量有限,因此需要借助生成技術大規模合成相關數據,以提升審核模型的識別能力。

      同時,AI 時代用戶生成變異樣本的成本大幅降低,使內容安全面臨更強的對抗壓力。因此,需要在管控側引入生成技術,構造對抗訓練樣本,提升審核模型的魯棒性。然而,對于這類大規模工業應用而言,擴散模型過高的推理時延仍然不可接受。如何在有限步數預算下兼顧生成質量與推理效率,已成為工業級擴散落地的核心挑戰。

      針對這一挑戰,阿里安全 AGI 實驗室 - 御風大模型團隊聯合浙江大學提出了一種全新的擴散加速方法 ——TC-Padé(Trajectory-Consistent Padé Approximation)。該方法基于 Padé 逼近構建殘差預測框架,在無需訓練、即插即用的前提下,實現對擴散采樣過程的高效加速,并在低步數設置下依然保持穩定、高質量的生成效果。實驗表明,TC-Padé 在圖像生成、視頻生成和類別條件圖像生成等任務上都取得了出色表現。例如,在 FLUX.1-dev 上可實現 2.88× 加速,在 Wan2.1 視頻生成模型上可實現 1.72× 加速,同時顯著優于已有緩存類加速方法。基于以上加速方法,御風大模型團隊得以產出大量高質量冷門風險訓練樣本,大幅度提升模型對風險的視覺理解能力,賦能百項以上廣泛業務場景。

      該研究論文已被 CVPR 2026 錄用。



      • 論文標題:TC-Padé: Trajectory-Consistent Padé Approximation for Diffusion Acceleration
      • 論文鏈接:https://arxiv.org/pdf/2603.02943
      • Github 地址:https://github.com/Alibaba-YuFeng/TC_Pade

      一、研究背景

      擴散模型的生成質量雖然已經達到很高水平,但其推理效率始終是落地應用中的核心制約因素。由于擴散采樣依賴多步迭代去噪,一個樣本通常需要經歷數十次甚至上百次網絡前向計算,這使得模型在實時交互、批量生成和資源受限場景中面臨較高的時延與成本。

      為降低這一開銷,近年來出現了多類擴散加速方法,其中一類重要思路是特征緩存(feature caching)。這類方法利用相鄰時間步之間特征變化較小的性質,減少重復計算,從而實現 “免訓練、可插拔” 的推理加速。現有方法主要包括兩種路線:

      (1)基于復用的方法:直接緩存并復用中間特征;

      (2)基于預測的方法:根據歷史特征變化趨勢預測未來特征。

      盡管這些方法在較高采樣步數(如 50 步)下能夠取得一定加速效果,但在工業場景更常見的 20~30 步低步數采樣中,其局限性會明顯暴露出來。隨著時間步間隔變大,特征之間的相似性快速下降:

      (1)復用類方法容易因緩存特征與當前狀態不匹配而產生偏差;

      (2)多項式外推類方法則容易因誤差積累導致軌跡漂移。

      如下圖所示,在低步數設置下,已有加速方法往往會帶來明顯的畫質下降,而 TC-Padé 能夠在實現更高加速比的同時,保持更好的視覺一致性。



      圖 1 相較于已有緩存加速方法,TC-Padé 在 20 步采樣下依然能夠保持更穩定的紋理與色彩表現

      為何現有方法在低步數下容易失效?低步數采樣意味著:相鄰推理步之間的時間跨度更大,特征演化不再平滑。這會帶來兩個直接問題。第一,傳統緩存復用方法默認相鄰時間步特征 “足夠相似”,但在低步數場景下,這一假設很容易被打破,導致緩存信息與當前狀態錯位,從而影響生成質量。第二,基于泰勒展開的外推方法雖然能夠在局部做近似,但泰勒多項式本質上更適合小范圍、平滑變化的趨勢建模。

      當時間間隔增大、特征變化更復雜時,就容易出現外推誤差放大、采樣軌跡偏移的問題。論文通過 PCA 可視化進一步表明,已有方法在加速采樣過程中往往無法保持與原始采樣軌跡的一致性,而 TC-Padé 更接近原始軌跡,體現出更強的穩定性。



      圖 2 不同緩存方法在 20 步采樣設置下的軌跡一致性對比,TC-Padé 更接近原始軌跡,體現出更強的穩定性

      二、研究方法:TC-Padé 核心創新

      針對上述問題,本文提出了 TC-Padé,從 “預測對象”“預測形式” 和 “采樣階段策略” 三個層面重新設計擴散緩存加速框架,核心包括以下兩點:

      1、創新一:基于) Padé 逼近的軌跡一致性殘差預測

      與直接預測原始特征不同,TC-Padé 首先將建模對象轉向殘差表示(residual representation)。殘差刻畫的是層間特征增量,相較于原始特征通常具有更高的時間連續性和更穩定的變化規律,因此更適合做跨時間步預測。

      殘差定義如下:



      其中,x_{t} l 和 x_{t} r 分別表示時間步 t 下不同層的特征表示,R_{t} l:r 表示對應層間殘差。

      在此基礎上,TC-Padé 使用 Padé 逼近替代傳統的泰勒多項式展開。Padé 逼近采用 “分子多項式 / 分母多項式” 的有理函數形式,能夠更好地描述非線性變化、漸近行為和階段切換,因此在低步數、大跨度時間間隔下具有更好的穩定性。其一般形式為:



      在本文中,為平衡效果與開銷,采用了低階 Padé 型預測器,對當前殘差進行預測:



      進一步可恢復當前時刻輸出特征:



      這一設計避免了直接在高維原始特征空間進行預測,使模型能夠更聚焦于結構更穩定的殘差動態,從而有效降低低步數采樣中的誤差累積問題。

      2、創新二:面向去噪階段差異的步感知預測策略

      擴散模型在不同采樣階段的動態特性并不相同:早期階段,噪聲高,結構變化劇烈;中期階段,整體結構逐漸穩定,適合進行軌跡預測;后期階段,主要進行細節修復與紋理優化。現有方法通常采用統一策略處理整個去噪過程,難以適應不同階段的變化特點。為此,TC-Padé 提出了一種去噪步感知(step-aware)預測策略,針對不同階段采用不同的殘差更新方式:



      其中,T 為總去噪步數。這一策略使 TC-Padé 能夠在采樣早期避免過度外推,在中期充分發揮 Padé 逼近的優勢,并在后期捕捉更細粒度的變化趨勢,從而提升整體加速過程的穩定性與生成質量。

      3、創新三:自適應軌跡穩定性判別機制

      除了預測方式的設計外,TC-Padé 還引入了一個軌跡穩定性指標(Trajectory Stableness Indicator, TSI),用于判斷當前時間段是否適合跳過計算、直接使用預測結果。其定義為:



      當軌跡變化平穩時,模型可安全地跳過部分計算并采用預測;當軌跡不穩定時,則恢復完整計算,以保證生成質量。這樣就實現了在穩定區間盡可能加速,在關鍵變化區間保留精細計算的自適應推理機制。



      圖 3 在每個緩存區間內,系統通過軌跡穩定性指標動態判斷是執行完整計算還是進行殘差預測

      三、實驗亮點:低步數下依然保持高質量與高速度

      (一)圖像生成任務:更快的同時保持更高保真度

      在文本到圖像生成任務中,TC-Padé 在 FLUX.1-dev 上展現出非常突出的效率 — 質量平衡能力。實驗結果表明:

      (1)TC-Padé(fast)實現 2.88× 加速

      (2)在 FID、CLIP Score 等指標上保持與原始模型接近的性能

      (3)在 PSNR、SSIM、LPIPS 等保真度指標上明顯優于其他緩存類方法

      相比之下,已有方法雖然在部分設置下可以進一步壓縮 FLOPs,但往往伴隨顯著的畫質下降,甚至出現無法接受的圖像退化。TC-Padé 則在較高加速比下依然能夠保持良好的紋理、結構與語義一致性。



      表 1 方法在實現高達 2.88× 加速的同時,依然保持高質量圖像生成效果

      (二)視頻生成任務:在時序生成中同樣有效

      視頻生成對一致性要求更高,任何預測偏差都可能在時間維度被進一步放大。即便如此,TC-Padé 仍在 Wan2.1-1.3B 視頻生成模型上取得了優異結果:

      (1)1.72× 推理加速,1.74× FLOPs 降低

      (2)VBench-2.0 總分僅較原始 20 步基線小幅下降

      (3)在 PSNR、SSIM、LPIPS 等指標上顯著優于泰勒預測類方法

      這說明 TC-Padé 不僅適用于靜態圖像生成,也能夠較好適配視頻場景中的復雜時空動態。



      表 2 在視頻生成任務中的效果對比。相較于其他方法,TC-Padé 在保證視頻內容穩定性的同時實現了更高效率

      (三)類別條件圖像生成:兼顧樣本保真度與多樣性

      在 DiT-XL/2 的 ImageNet 256×256 類別條件圖像生成任務中,TC-Padé 同樣表現穩定:

      (1)1.46× 時延加速,1.64× FLOPs 降低

      (2)FID 優于對比的緩存加速方法

      (3)Precision 與 Recall 保持更好平衡

      這表明 TC-Padé 不僅適用于文本條件生成任務,也能在標準視覺生成基準上保持較強競爭力。



      表 3 TC-Padé 在 DiT-XL/2 上的定量結果,展示了其在類別條件圖像生成任務中的穩定泛化能力

      (四)消融實驗:關鍵設計帶來穩定收益

      論文進一步通過消融實驗驗證了 TC-Padé 各組成模塊的有效性。

      1、殘差緩存粒度分析:實驗比較了不同緩存粒度,包括 double-stream、single-stream 和 entire block。結果顯示,在整個 block 粒度上進行殘差緩存與預測時效果最佳,能夠在速度和質量之間取得更優平衡。

      2、穩定性閾值分析:通過調整軌跡穩定性閾值 θ,可以靈活控制加速比與質量之間的權衡。實驗顯示,θ=0.7 時可獲得最高 2.88× 加速,而 θ=1.0 則在質量和效率之間表現出更均衡的綜合效果。

      3、與量化技術兼容:TC-Padé 還具有良好的工程兼容性,可與量化等其他推理優化技術疊加使用。實驗顯示,在結合量化后,其整體時延下降可進一步擴大,體現出良好的實際部署潛力。

      四、總結

      TC-Padé 針對擴散模型低步數采樣中 “加速容易、穩定很難” 的核心問題,提出了一套兼顧理論與實踐的新方案。通過基于 Padé 逼近的殘差預測、步感知預測策略以及軌跡穩定性自適應判別機制,該方法在無需訓練的條件下顯著提升了擴散推理效率,并在多個任務上保持了高質量生成效果。對于追求低延遲、高吞吐、可落地部署的擴散模型應用而言,TC-Padé 提供了一種具有現實價值的高效加速思路,也為未來擴散模型推理優化打開了新的方向。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      加盟商參加中通十周年慶典,一晚兩場酒局后身亡,公司:補償10萬元

      加盟商參加中通十周年慶典,一晚兩場酒局后身亡,公司:補償10萬元

      大風新聞
      2026-05-11 14:52:06
      善惡有報!許家印剛認罪1天,子女近況曝光,大兒子的安排全白費

      善惡有報!許家印剛認罪1天,子女近況曝光,大兒子的安排全白費

      歷史偉人錄
      2026-05-10 22:06:40
      留學生的爸媽能有多荒謬?網友:我用五萬韓元跟我爸換了五萬美金

      留學生的爸媽能有多荒謬?網友:我用五萬韓元跟我爸換了五萬美金

      帶你感受人間冷暖
      2026-05-01 18:06:57
      63歲李連杰公開回應甲亢病情:面容改變、眼球突出,我想完成演藝生涯,但擔心沒有人想看到我的樣子……

      63歲李連杰公開回應甲亢病情:面容改變、眼球突出,我想完成演藝生涯,但擔心沒有人想看到我的樣子……

      都市快報橙柿互動
      2026-05-12 00:42:34
      李冰冰的臉騙了所有人,53歲生圖揭開一個殘酷真相,原來人不是變老是被榨干了

      李冰冰的臉騙了所有人,53歲生圖揭開一個殘酷真相,原來人不是變老是被榨干了

      科學發掘
      2026-05-11 00:11:13
      CBA消息!徐昕完成新簽約,遼寧四外援全部不留,潘江用人遭質疑

      CBA消息!徐昕完成新簽約,遼寧四外援全部不留,潘江用人遭質疑

      中國籃壇快訊
      2026-05-11 08:55:19
      神仙同框!楊麗萍教小酒窩孔雀舞,董璇穿黃衣白裙,也格外吸睛!

      神仙同框!楊麗萍教小酒窩孔雀舞,董璇穿黃衣白裙,也格外吸睛!

      明星私服穿搭daily
      2026-05-11 13:59:13
      被牧羊人發現后,轟炸伊拉克軍隊致多人死傷:以色列的無奈之舉

      被牧羊人發現后,轟炸伊拉克軍隊致多人死傷:以色列的無奈之舉

      鷹眼Defence
      2026-05-10 16:37:50
      剛剛,山東省公務員局發布公告

      剛剛,山東省公務員局發布公告

      黃河新聞網呂梁
      2026-05-11 11:45:10
      海參崴的街頭,誰在出賣我們的歷史尊嚴?

      海參崴的街頭,誰在出賣我們的歷史尊嚴?

      迷世書童H9527
      2026-05-07 14:55:09
      “富人才不會把女兒養這么胖”,家長曬女兒喝60元礦泉水,被群嘲

      “富人才不會把女兒養這么胖”,家長曬女兒喝60元礦泉水,被群嘲

      番外行
      2026-04-22 14:51:19
      這胖妹,如果是在唐朝,必是皇后,實在是惹人喜愛符合大唐胖女子

      這胖妹,如果是在唐朝,必是皇后,實在是惹人喜愛符合大唐胖女子

      陳意小可愛
      2026-05-11 15:21:09
      打什么電話比12345更管用?這些電話比它管用100倍,建議收藏好

      打什么電話比12345更管用?這些電話比它管用100倍,建議收藏好

      細說職場
      2026-04-28 10:39:02
      高市早苗好狠:趕在特朗普訪華前,給了他一刀,連中國都沒想到!

      高市早苗好狠:趕在特朗普訪華前,給了他一刀,連中國都沒想到!

      動漫里的童話
      2026-05-11 09:47:26
      北大才子將癌癥晚期父親騙出國,讓其高空跳傘,88天后結局怎樣

      北大才子將癌癥晚期父親騙出國,讓其高空跳傘,88天后結局怎樣

      云景侃記
      2026-04-17 17:00:39
      兩年1.4億!7000萬先生!場均28分也賣?波士頓變天了?

      兩年1.4億!7000萬先生!場均28分也賣?波士頓變天了?

      籃球盛世
      2026-05-11 16:55:48
      2000噸飛絮惹眾怒,一斧子全砍了認錯?專家:三大代價承受不起

      2000噸飛絮惹眾怒,一斧子全砍了認錯?專家:三大代價承受不起

      小蘭聊歷史
      2026-04-26 11:37:23
      新勢力還咋吹!曝特斯拉滿血FSD國內開測,連小鳥都能躲?

      新勢力還咋吹!曝特斯拉滿血FSD國內開測,連小鳥都能躲?

      小李車評李建紅
      2026-05-10 08:00:03
      活塞vs騎士G4預測:米切爾籃板+坎寧安助攻雙押注

      活塞vs騎士G4預測:米切爾籃板+坎寧安助攻雙押注

      體育硬核說
      2026-05-12 06:44:43
      北京CBD附近,三條街超400個阻車樁!市民吐槽:“多到令人發指……”

      北京CBD附近,三條街超400個阻車樁!市民吐槽:“多到令人發指……”

      大風新聞
      2026-05-11 15:12:15
      2026-05-12 07:16:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12970文章數 142648關注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機會

      頭條要聞

      母女二人一年用水量高達400多噸 警方發現背后隱情

      頭條要聞

      母女二人一年用水量高達400多噸 警方發現背后隱情

      體育要聞

      梁靖崑:可能是最后一屆了,想讓大家記住這個我

      娛樂要聞

      “孕婦墜崖案”王暖暖稱被霸凌協商解約

      財經要聞

      宗馥莉罷免銷售負責人 部分業務將外包

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      時尚
      手機
      本地
      數碼
      游戲

      今年夏天最流行的5雙涼鞋,配裙子絕美!

      手機要聞

      蘋果iOS/iPadOS 16.7.16正式版發布

      本地新聞

      用蘇繡的方式,打開江西婺源

      數碼要聞

      榮耀600系列全解讀:肖戰代言、幸運星設計、2億影像,值得沖嗎?

      LOL第一支MSI戰隊出爐,TSW確定晉級季中賽!BLG已鎖定淘汰賽名額

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 99JK无码免费| 久久亚洲精品无码va白人极品| 久久福利电影| 日本欧美视频在线观看三区| 一本久道综合在线无码人妻| 亚洲欧洲一区二区精品| 国产无码VA| 美女视频黄频| 郸城县| 黄色亚洲一区二区在线观看| 色色看片| 国产精品1999| 石台县| 国产稚嫩高中生呻吟激情在线视频| 手机在线观看亚洲| 色偷偷色噜噜狠狠成人免费视频| 美女特级毛片在线视频| 亚洲AV永久青草无码性色av| 国产丝袜打飞机免费在线| 日韩欧美永久中文字幕视频| 狠狠躁夜夜躁人人爽天天古典| 国产精品一线天粉嫩av| 黑人又粗又长又大| 老司机在线视频免费福利| 亚国产亚洲亚洲精品视频 | 国产极品精品自在线不卡| 国产又爽又黄无码无遮挡在线观看 | 国产亚洲精品va在线| 午夜久久精品国产亚洲av| 精品久久久久中文字幕日本| 一级天堂| 国产成人一区二区三区别| 亚洲伊人久久综合成人网站| 国产办公室秘书无码精品99 | 人妻成人网| 曰韩免费无码AV一区二区| A三级三级成人网站在线视频| 国产制服丝袜在线播放| 亚洲精品666| 亚洲精品色在线网站| 亚洲色欲色欲大片www无码|