<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      QVGen讓「超低比特視頻生成量化」真正可用!

      0
      分享至



      視頻生成擴散模型越做越大:2B、5B、14B…… 效果提升很快,但訓練與推理的成本也隨之飆升。社區一直希望用量化把模型 “壓小”,把顯存和算力成本打下來,真正落到更多卡、更便宜的機器、更多真實應用中。可現實很殘酷:一到 3/4 bit,視頻生成的量化感知訓練(QAT)往往比圖像更難訓、更不穩定,質量掉得更狠 —— 不是 “略降一點”,而是直接不可用。



      圖表 1 在 CogVideoX-2B 模型上 4-bit 逐通道權重量化與逐 token 激活量化的效果對比。(a)原始模型;(b)該論文所提出方案;(c-e)已有的量化感知訓練方案;(f)已有的后訓練量化方案。

      香港科技大學 & 北航 & 商湯等提出了一個專門面向視頻生成擴散模型的 QAT 范式 ——QVGen,在 3-bit / 4-bit 都能把質量拉回來,并且讓 4-bit 首次接近全精度表現成為現實。該論文現已被 ICLR 高分接收:rebuttal 前 88666(top 1.4%),rebuttal 后 88886 (top 0.5%)。



      • 論文地址:https://arxiv.org/pdf/2505.11497
      • 代碼地址:https://github.com/ModelTC/QVGen
      • 模型地址:https://huggingface.co/collections/Harahan/qvgen



      圖表 2 QVGen 論文框架圖。

      為什么視頻擴散模型一量化就容易 “崩”?

      QVGen 的切入點很直接:視頻生成的 QAT 并不是把圖像擴散的配方照搬過來就行。作者在論文里給了一個關鍵觀察(見圖表 3):在相近規模、相似訓練設置下,視頻擴散模型的梯度范數明顯更大,這會讓優化過程更不穩定,最終導致低比特訓練難以收斂、生成質量難以維持。

      換句話說,如果不先解決 “訓練不穩” 這個根因,只靠常見量化技巧做修補,視頻生成很難真正落地。



      圖表 3 第一行為已有方案(藍色)與論文方案(黃色)在量化感知訓練中的梯度范數比較;第二行為損失比較。左右分別為 CogVideoX-2B 和 Wan 1.3B 模型上的可視化。

      QVGen 做對了什么:先把訓練救穩,再把推理成本 “還回去”


      QVGen 的核心思路是 “訓練期做增強、推理期不背包袱”,它把一個看似矛盾的目標拆成了兩步來解決 (見圖表 2)。

      第一步,訓練階段引入一個輔助模塊 Φ。這個模塊不是為了讓推理更重,而是為了在低比特條件下降低梯度范數、提升訓練穩定性,讓 3/4-bit 的 QAT 先 “訓得動、訓得好”。此外,除了圖表 3 中的實驗論證,在論文中還提供了詳細的理論證明。

      第二步,訓練過程中逐步移除 Φ,讓最終推理階段不再依賴這個模塊。作者的觀察是:隨著訓練推進,Φ 的參數里會逐漸出現越來越多 “貢獻很小” 的成分。于是論文設計了 rank-decay:反復做分解,識別低影響的分量,并用基于秩的正則把這些分量逐步衰減到 0,直到 Φ 被完全消掉。最終效果是:推理階段幾乎不增加額外開銷,但訓練階段又能獲得穩定性紅利。

      結果有多硬:4-bit 接近全精度,3-bit 也把指標拉回 “可用區間”


      在主實驗中,QVGen 在 W4A4/W3A3 的設置下對比了多類量化方法。論文給出的結論很清晰:很多方法在 4-bit 下仍有明顯退化,到了 3-bit 更加明顯;QVGen 在 3-bit 能大幅恢復質量,在 4-bit 則可以做到接近全精度(見圖表 4)。

      更關鍵的是,它不只在小模型上有效。論文還展示了在更大的視頻生成模型上(例如 5B、14B 級別,以及更高分辨率設置),4-bit 仍能保持接近全精度的總體水平(見圖表 5-6)。

      該論文同時給出了大量定性樣例證明 “不是只在指標上好看” (見圖表 7-8)。



      圖表 4 對于 Wan 1.3B 和 CogVideoX-2B 模型,QVGen 與已有方案在 VBench 上的性能比較。



      圖表 5 QVGen 在 Wan 14B 和 CogVideoX-5B 模型上的 VBench 結果。



      圖表 6 QVGen 在 Wan 14B 和 CogVideoX-5B 模型上的 VBench-2.0 結果。



      圖表 7 QVGen 與已有方案在 Wan 1.3B 上的可視化結果對比。



      圖表 8 QVGen 在 Wan 14B 上的可視化結果。

      不只是省顯存:它能帶來真實加速,還能和其他加速方法疊加


      對部署來說,低比特的直接好處是顯存下降。論文報告量化后能夠帶來大幅的內存節省(例如 4× 級別的壓縮量級),從而讓同樣的模型更容易跑在更小的卡上,或者把 batch、分辨率等配置拉高。

      更實際的一點是:QVGen 使用標準的均勻量化思路,意味著它可以更容易對接現有的 W4A4 推理內核。論文也強調它和其他視頻生成加速方向是正交的:例如與某些 3D attention 加速方案疊加后,推理速度還能進一步提升(見圖表 9)。



      圖表 9 (左)模型大小對比; (中)模型加速對比;(右)與 attention 加速方案結合后加速對比。其中藍色代表 Wan 1.3B 模型,黃色代表 Wan 14B 模型。

      訓練成本會不會更高?論文給出的答案是 “幾乎不多花”

      很多讀者會擔心:訓練期加了 Φ、還要做 rank-decay,會不會導致訓練成本暴漲?論文做了訓練效率分析,結論是:相對一些蒸餾式 QAT 基線,QVGen 的額外訓練開銷很小(例如 GPU-days、峰值顯存幾乎不變的量級),但在最終生成質量上仍能拉開明顯差距(見圖表 10)。



      圖表 10 QVGen 與已有方法的訓練時間和訓練顯存開銷對比。

      總結:視頻擴散也能 4bit 接近滿血,先穩訓練再輕推理!


      當下視頻生成擴散模型越來越大,但 3/4-bit 量化一落到視頻上,常見問題是:QAT 訓練不穩定、收斂困難、畫質明顯下滑。QVGen 的核心判斷很直接:視頻低比特量化的關鍵不只是 “怎么量化”,而是先把訓練穩定性問題解決,否則再好的量化細節也很難落地。

      在這一點上,QVGen 給出了一套完整范式,主要包括:

      • 訓練期引入輔助模塊 Φ:用于降低梯度范數、提升低比特 QAT 的穩定性,讓 3/4-bit 訓練 “跑得起來、訓得下去”;
      • rank-decay 逐步移除 Φ:訓練過程中識別并衰減低貢獻成分,最終把 Φ 完全去掉,使推理階段幾乎不背額外負擔;
      • 面向部署的低比特設置:支持 W4A4/W3A3,并強調可對接現有推理實現;在顯存上帶來明顯下降,同時還能與其他推理加速方法疊加。

      總體來看,QVGen 在 CogVideoX、Wan 等視頻擴散模型上實現了 4-bit 接近全精度、3-bit 也能把質量拉回可用區間的結果,并且訓練額外開銷很小。對希望把視頻生成模型從 “貴且難跑” 推進到 “更省、更快、更好用” 的場景,這是一條很實用的路線。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      誰能晉級CBA總決賽?西熱力江看好2支球隊,無廣東和北京隊

      誰能晉級CBA總決賽?西熱力江看好2支球隊,無廣東和北京隊

      體育哲人
      2026-05-12 18:22:37
      四太奚夢瑤砸1.68億買豪宅,結婚7年首置業,婆媳狂買3套刷新房價

      四太奚夢瑤砸1.68億買豪宅,結婚7年首置業,婆媳狂買3套刷新房價

      開開森森
      2026-05-12 14:59:27
      G4湖人110-115雷霆1喜3憂!里弗斯斯瑪特雙刃劍,艾頓沒法用!

      G4湖人110-115雷霆1喜3憂!里弗斯斯瑪特雙刃劍,艾頓沒法用!

      籃球資訊達人
      2026-05-12 13:54:26
      特朗普應邀訪華三天,中方準備了高規格禮遇,他想邀中方回訪美國

      特朗普應邀訪華三天,中方準備了高規格禮遇,他想邀中方回訪美國

      無人傾聽無人傾聽
      2026-05-11 16:48:33
      德國取消施羅德待遇,82歲仍為普京奔走

      德國取消施羅德待遇,82歲仍為普京奔走

      熱點一網打盡
      2026-05-12 04:32:10
      今晚19:35泰山激戰銅梁龍,二雷扛旗劉建業找三中衛漏洞

      今晚19:35泰山激戰銅梁龍,二雷扛旗劉建業找三中衛漏洞

      生活新鮮市
      2026-05-12 13:45:52
      國乒回京曝光!王楚欽莎莎低調離開,梁靖崑兒子獻花王皓妻兒迎接

      國乒回京曝光!王楚欽莎莎低調離開,梁靖崑兒子獻花王皓妻兒迎接

      李喜林籃球絕殺
      2026-05-12 17:31:08
      湯姆·漢克斯兒子住進拖車公園!月租僅400,直呼:干嘛住豪華公寓

      湯姆·漢克斯兒子住進拖車公園!月租僅400,直呼:干嘛住豪華公寓

      星野娛樂天地
      2026-05-11 20:44:57
      21歲雙胞胎姐妹1死1重傷,兇手為妹妹男友,案發前數小時雙方在派出所調解,家屬起訴警方失職;嫌犯作案當天發布動態:狠角色我只扮演一次

      21歲雙胞胎姐妹1死1重傷,兇手為妹妹男友,案發前數小時雙方在派出所調解,家屬起訴警方失職;嫌犯作案當天發布動態:狠角色我只扮演一次

      大風新聞
      2026-05-12 08:55:33
      盧比奧來不了中國了?不是中國不讓他進,是他根本不配進!

      盧比奧來不了中國了?不是中國不讓他進,是他根本不配進!

      嘆為觀止易
      2026-05-12 00:34:15
      毛主席83歲給華國鋒的珍貴書法,練字真的有意義嗎?

      毛主席83歲給華國鋒的珍貴書法,練字真的有意義嗎?

      書畫相約
      2026-05-11 10:09:02
      林志穎臺上獻唱!穿緊身褲掉檔露尷尬,全臉腫脹被網友群嘲像大媽

      林志穎臺上獻唱!穿緊身褲掉檔露尷尬,全臉腫脹被網友群嘲像大媽

      八卦王者
      2026-05-12 15:24:38
      讓無數人后悔的手術!有嚴重后遺癥,很多做完都后悔了,術前注意

      讓無數人后悔的手術!有嚴重后遺癥,很多做完都后悔了,術前注意

      芹姐說生活
      2026-05-11 13:39:32
      日經亞洲突然爆出重磅消息!中國給國內所有芯片廠下一道"死命令"

      日經亞洲突然爆出重磅消息!中國給國內所有芯片廠下一道"死命令"

      阿七說史
      2026-05-11 15:23:09
      特斯拉:再次突破

      特斯拉:再次突破

      新浪財經
      2026-05-11 10:29:59
      中國重返土倫杯,時隔七年再次參賽

      中國重返土倫杯,時隔七年再次參賽

      懂球帝
      2026-05-12 11:29:13
      過來人忠告:初中掉隊的孩子90%都栽在一個習慣,現在改還來得及

      過來人忠告:初中掉隊的孩子90%都栽在一個習慣,現在改還來得及

      蓁蓁心理撫養
      2026-05-12 12:30:11
      午后觸及漲停!恒瑞醫藥與BMS攜手開發13款早期創新藥,潛在總交易額152億美元

      午后觸及漲停!恒瑞醫藥與BMS攜手開發13款早期創新藥,潛在總交易額152億美元

      紅星資本局
      2026-05-12 15:11:22
      2-2賽后專訪:米切爾爆發真因曝光,哈登兩耳不聞窗外事

      2-2賽后專訪:米切爾爆發真因曝光,哈登兩耳不聞窗外事

      鴻錦籃球
      2026-05-12 11:58:39
      東風導彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

      東風導彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

      番外行
      2026-03-31 08:28:28
      2026-05-12 19:11:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12976文章數 142648關注度
      往期回顧 全部

      科技要聞

      宇樹發布載人變形機甲,定價390萬元起

      頭條要聞

      為見女兒最后一面老人第一次坐高鐵 買不到票求助特警

      頭條要聞

      為見女兒最后一面老人第一次坐高鐵 買不到票求助特警

      體育要聞

      總是掉鏈子的“倒霉蛋”,闖進了歐戰決賽

      娛樂要聞

      劉濤曬媽祖誕辰活動照 評論區變許愿池

      財經要聞

      黃仁勛真是被白宮徹底封殺了

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      家居
      數碼
      游戲
      親子
      軍事航空

      家居要聞

      極簡主義下的居住場域與空間

      數碼要聞

      高性能筆記本進入18英寸時代,AMD銳龍在背后支持多少?

      小島秀夫新動態:票選DS2最愛角色!反派竟是第一

      親子要聞

      最好的陪伴是陪你慢慢長大今日份溫馨時刻和我的小棉襖合唱一曲

      軍事要聞

      知情人士披露:美國或考慮恢復對伊朗軍事行動

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 四虎成人免费视频在线播放 | 2020aa一级毛片免费高清| 亚洲最大成av人网站| 国产亚洲欧美在线人成aaaa| 特级av毛片免费观看| 亚洲男人的天堂AV手机在线观看| 国产熟妇疯狂4p交在线播放| 亚洲欧洲日产国无高清码图片| 色偷偷色噜噜狠狠成人免费视频 | 1024在线免费观看| 国产免费呻吟一二三四区| 久久久久国产精品无码免费看| 国产成A人片在线观看视频下载 | 国产午夜成人免费看片| 精品少妇爆乳无码aⅴ区| 国产l精品国产亚洲区久久| 无码人妻精品一区二区三区久久久| 中文字幕一区有码视三区| 精品久久久久久久久久中文字幕 | 亚洲最大成人在线播放| 鲁鲁美女影院| 黄色网址手机国内免费在线观看| 丁香五月欧美成人| 中出内射颜射骚妇| 无码免费午夜福利看片| 亚州精品无码人妻久久| AV无码中文| 国产精品无码专区在线播放| 久久www香蕉免费人成| 中文字幕在线精品视频入口一区| 91偷拍视频久久精品| 国产本道久久一区二区三区| 狠狠精品久久久无码中文字幕| 成人性生交片无码免费看| 一二三区国产精品久久| 国产粉嫩小泬在线观看泬| 国产免费拔擦拔擦8x在线下载| 禁国产18精品一二区| 亚洲综合在线日韩av| AV人摸人人人澡人人超碰下载 | 国产成人精彩在线视频|