<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      讓擴(kuò)散模型「可解釋」不再降質(zhì),開(kāi)啟圖片編輯新思路

      0
      分享至



      過(guò)去三年,擴(kuò)散模型席卷圖像生成領(lǐng)域。以 DiT (Diffusion Transformer) 為代表的新一代架構(gòu)不斷刷新圖像質(zhì)量的極限,讓模型愈發(fā)接近真實(shí)世界的視覺(jué)規(guī)律。

      然而,與 LLM 可解釋性研究的蓬勃發(fā)展相對(duì),擴(kuò)散模型內(nèi)部的語(yǔ)義結(jié)構(gòu)、時(shí)間規(guī)律以及因果路徑仍然像被深深封住的「黑箱」。研究者可以憑直覺(jué)優(yōu)化架構(gòu),但外界無(wú)法真正理解擴(kuò)散模型在生成過(guò)程中的「思考方式」。

      更棘手的是,已有的可解釋性嘗試往往伴隨著明顯的性能下降:特征分解、激活分析、插值擾動(dòng)……無(wú)論采用哪種方法,只要試圖將擴(kuò)散模型拆開(kāi)來(lái)看,生成質(zhì)量就會(huì)顯著劣化。這讓「可解釋擴(kuò)散模型」在很長(zhǎng)一段時(shí)間里被視為不切實(shí)際的小眾方向。

      在這樣的背景下,香港中文大學(xué) MMLab 與上海人工智能實(shí)驗(yàn)室的研究團(tuán)隊(duì)提出了一個(gè)不同的觀點(diǎn):擴(kuò)散模型作為當(dāng)今視覺(jué)世界最重要的生成器,其內(nèi)部機(jī)制不應(yīng)永遠(yuǎn)處于不可見(jiàn)狀態(tài);可解釋性也不應(yīng)該以犧牲生成質(zhì)量為代價(jià)。

      基于這一理念,他們提出了被 AAAI 2026 接收的TIDE (Temporal-Aware Sparse Autoencoders)—— 首個(gè)真正意義上面向擴(kuò)散 Transformer 的時(shí)序稀疏自編碼器框架。



      • 論文標(biāo)題:TIDE: Temporal-Aware Sparse Autoencoders for Interpretable Diffusion Transformers in Image Generation
      • 論文鏈接:
      • https://arxiv.org/pdf/2503.07050

      TIDE:

      讓「時(shí)序」成為擴(kuò)散可解釋性的核心

      以往的可解釋方法大多忽視了擴(kuò)散過(guò)程最大的特點(diǎn):生成是一個(gè)隨時(shí)間展開(kāi)的漸進(jìn)式構(gòu)造過(guò)程。早期步驟決定物體形狀和布局,中期步驟塑造語(yǔ)義和結(jié)構(gòu),后期步驟填充材質(zhì)與細(xì)節(jié)。如果忽略這條時(shí)間線,擴(kuò)散模型看起來(lái)就像一團(tuán)混亂的噪聲與特征。TIDE 的突破在于,它不是「硬拆」一個(gè)靜態(tài)特征,而是讓模型自己在時(shí)間維度上對(duì)齊語(yǔ)義:

      同一個(gè)因子會(huì)在不同時(shí)間步中保持一致的語(yǔ)義軌跡,最終形成一個(gè)可讀、可控、穩(wěn)固的「時(shí)間語(yǔ)義剖面」。

      也正是在這樣的時(shí)序框架下,擴(kuò)散模型內(nèi)部原本模糊的過(guò)程第一次被清晰呈現(xiàn)出來(lái):粗結(jié)構(gòu)從噪聲中浮現(xiàn)、語(yǔ)義逐漸成型、紋理被不斷潤(rùn)色……模型的「思考流」沿著時(shí)間軸被完整雕刻出來(lái)。

      更重要的是,這一切并不會(huì)破壞原模型的生成能力。TIDE 的稀疏自編碼器在特征空間進(jìn)行無(wú)損重構(gòu),擴(kuò)散軌跡保持穩(wěn)定,模型幾乎感受不到被「觀察」的存在。同時(shí)在 scaling latent 維度時(shí),也優(yōu)于原有 vanilla SAE 方法。



      TIDE 架構(gòu)與訓(xùn)練

      在 Stable Diffusion XL、PixArt-α、Flux 等主流擴(kuò)散框架上,TIDE 將擴(kuò)散特征分解為具有可控語(yǔ)義的因子:

      負(fù)責(zé)輪廓的因子、負(fù)責(zé)物體姿態(tài)的因子、負(fù)責(zé)材質(zhì)紋理的因子……甚至可以捕捉到跨時(shí)間的概念演化。基于這些因子,研究團(tuán)隊(duì)構(gòu)建出一種全新的圖像編輯方式:編輯不再依賴繁瑣的提示語(yǔ)或反復(fù)調(diào)參,而是可以沿著清晰的語(yǔ)義方向直接操控?cái)U(kuò)散過(guò)程。例如:

      • 提升紋理細(xì)節(jié)而不改變?nèi)纸Y(jié)構(gòu)
      • 調(diào)整物體姿態(tài)但保持背景一致
      • 加強(qiáng)某類語(yǔ)義而不干擾其它部分



      這些編輯操作完全基于 TIDE 生成的語(yǔ)義因子完成,意味著未來(lái)擴(kuò)散模型有望出現(xiàn)一種全新的「因子級(jí)編輯器」,具備高度可控性與透明性。

      與此同時(shí),TIDE 對(duì)模型生成質(zhì)量的影響幾乎可以忽略不計(jì)。FID、sFID 變化小于 0.1%,噪聲預(yù)測(cè)軌跡保持穩(wěn)定,實(shí)現(xiàn)了真正意義上的「可解釋而不降質(zhì)」。

      TIDE 的效果

      TIDE 在不同設(shè)置、不同模型規(guī)模以及不同任務(wù)維度下的整體表現(xiàn)。無(wú)論是在超參數(shù)選擇、在 DiT 不同層級(jí)進(jìn)行因子學(xué)習(xí),還是在 SDXL、FLUX-dev 等主流擴(kuò)散架構(gòu)上的泛化能力,TIDE 都表現(xiàn)出高度穩(wěn)定且持續(xù)的優(yōu)勢(shì)。

      可以看到,TIDE 在幾乎不增加 FID 代價(jià)的前提下,顯著提升了 AlignScore 中的語(yǔ)義綁定(顏色、形狀、紋理)以及跨區(qū)域關(guān)系理解(空間與非空間關(guān)系),其中多處指標(biāo)在表中以綠色標(biāo)記為最優(yōu)表現(xiàn)。

      此外,在安全性評(píng)測(cè)部分,TIDE 相比多個(gè)現(xiàn)有方法大幅降低了攻擊成功率,顯示出更穩(wěn)健的特征理解能力。整體來(lái)看,這幅表格清楚證明:TIDE 不僅帶來(lái)了高質(zhì)量、可解釋的語(yǔ)義因子,還在保持生成質(zhì)量的同時(shí),提升了模型的結(jié)構(gòu)理解、關(guān)系推理與安全性,成為一種真正可泛化、可落地的可解釋擴(kuò)散框架。



      TIDE 的意義:

      補(bǔ)齊擴(kuò)散模型的「理解」能力

      擴(kuò)散模型已經(jīng)成為現(xiàn)代視覺(jué)生成系統(tǒng)的核心支柱,但它們的內(nèi)部機(jī)制一直缺乏系統(tǒng)、透明的解釋路徑。TIDE 的出現(xiàn)不僅提供了首個(gè)真正實(shí)用的可解釋性方案,更重要的是,它讓研究者第一次能夠沿著「時(shí)間」這條線索觀察擴(kuò)散模型內(nèi)部的語(yǔ)義結(jié)構(gòu)。



      這種理解能力將直接影響未來(lái)的多個(gè)方向:

      • 更可控、更穩(wěn)健的擴(kuò)散編輯系統(tǒng)
      • 統(tǒng)一理解——生成模型的因子級(jí)橋接
      • 擴(kuò)散模型的因果與語(yǔ)義理論研究
      • 新一代透明、可信的視覺(jué)生成系統(tǒng)

      TIDE 不僅是一個(gè)方法,更是一種新的研究范式:擴(kuò)散模型并非不可解釋,只是缺少一個(gè)合適的視角。

      未來(lái)展望

      研究團(tuán)隊(duì)表示,當(dāng)前 TIDE 已成功驗(yàn)證了時(shí)序稀疏自編碼器框架的有效性,但可解釋擴(kuò)散模型的潛力遠(yuǎn)未被完全發(fā)掘。未來(lái)的工作將進(jìn)一步:

      • 擴(kuò)展更大規(guī)模、更精細(xì)的時(shí)序字典
      • 探索跨模態(tài)共享的語(yǔ)義因子
      • 結(jié)合 LLM-SAE 構(gòu)建統(tǒng)一解釋空間
      • 將因子級(jí)編輯推向產(chǎn)品化工具

      隨著更多研究者的加入,擴(kuò)散模型的「黑箱壁壘」正逐漸被揭開(kāi),而 TIDE 或許是這一轉(zhuǎn)變具有代表性的第一步。



      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      印媒:大尼科巴島將成為中國(guó)的噩夢(mèng)!

      印媒:大尼科巴島將成為中國(guó)的噩夢(mèng)!

      達(dá)文西看世界
      2026-05-10 08:28:38
      充電速度“行業(yè)墊底”,特斯拉的充電這么慢!為何沒(méi)有車主吐槽?

      充電速度“行業(yè)墊底”,特斯拉的充電這么慢!為何沒(méi)有車主吐槽?

      少數(shù)派報(bào)告Report
      2026-05-09 04:41:12
      廣西來(lái)賓市委原書(shū)記何朝建被“雙開(kāi)”

      廣西來(lái)賓市委原書(shū)記何朝建被“雙開(kāi)”

      界面新聞
      2026-05-10 17:05:05
      國(guó)際乒聯(lián)親宣!64歲蔡振華再破天花板,讓劉國(guó)梁和乒壇“沉默”了

      國(guó)際乒聯(lián)親宣!64歲蔡振華再破天花板,讓劉國(guó)梁和乒壇“沉默”了

      以茶帶書(shū)
      2026-05-05 17:10:10
      毛主席悼念周恩來(lái)的兩首絕筆詞流傳甚廣,為何錢(qián)鐘書(shū)卻找出破綻斷言是生手冒名代寫(xiě)?

      毛主席悼念周恩來(lái)的兩首絕筆詞流傳甚廣,為何錢(qián)鐘書(shū)卻找出破綻斷言是生手冒名代寫(xiě)?

      史海孤雁
      2026-05-09 19:55:18
      86年洪學(xué)智訪美遭提問(wèn):什么學(xué)校畢業(yè)?洪學(xué)智笑答:美軍空軍大學(xué)

      86年洪學(xué)智訪美遭提問(wèn):什么學(xué)校畢業(yè)?洪學(xué)智笑答:美軍空軍大學(xué)

      浩渺青史
      2026-05-10 20:04:24
      國(guó)乒男團(tuán)12連冠橫掃日本,許昕犀利點(diǎn)評(píng)火了

      國(guó)乒男團(tuán)12連冠橫掃日本,許昕犀利點(diǎn)評(píng)火了

      陳錈愛(ài)體育
      2026-05-11 11:18:11
      溫格:阿森納擊敗西漢姆聯(lián),可能成為決定冠軍的分水嶺

      溫格:阿森納擊敗西漢姆聯(lián),可能成為決定冠軍的分水嶺

      懂球帝
      2026-05-11 10:33:11
      新加坡?tīng)?zhēng)議網(wǎng)紅硬闖動(dòng)漫展,被cos小哥當(dāng)場(chǎng)暴打

      新加坡?tīng)?zhēng)議網(wǎng)紅硬闖動(dòng)漫展,被cos小哥當(dāng)場(chǎng)暴打

      新加坡眼
      2026-05-10 17:43:34
      莎莎打完比賽凍得直哆嗦,一扭頭看見(jiàn)大迪羽絨服,二話不說(shuō)就穿走

      莎莎打完比賽凍得直哆嗦,一扭頭看見(jiàn)大迪羽絨服,二話不說(shuō)就穿走

      小娛樂(lè)悠悠
      2026-05-04 09:39:48
      又被馬云預(yù)言中了!中央定調(diào),中國(guó)房地產(chǎn)或?qū)⒂瓉?lái)新一輪暴漲?

      又被馬云預(yù)言中了!中央定調(diào),中國(guó)房地產(chǎn)或?qū)⒂瓉?lái)新一輪暴漲?

      豬豬愛(ài)影視
      2026-05-11 08:19:39
      浙江一男子在后山種了棵楊梅樹(shù),三年后發(fā)現(xiàn)樹(shù)會(huì)自己移動(dòng)

      浙江一男子在后山種了棵楊梅樹(shù),三年后發(fā)現(xiàn)樹(shù)會(huì)自己移動(dòng)

      匹夫來(lái)搞笑
      2026-05-11 10:09:23
      時(shí)隔8年多!美國(guó)總統(tǒng)特朗普5月13日至15日訪華,這次訪華很不一樣

      時(shí)隔8年多!美國(guó)總統(tǒng)特朗普5月13日至15日訪華,這次訪華很不一樣

      軍武咖
      2026-05-11 10:55:53
      倫敦世乒賽結(jié)束,揭曉5位勝者與3位敗者,王楚欽、張本美和榜上有名!

      倫敦世乒賽結(jié)束,揭曉5位勝者與3位敗者,王楚欽、張本美和榜上有名!

      等等talk
      2026-05-11 02:14:12
      盤(pán)后首日,社保重倉(cāng)13股直接漲停,主要集中在3個(gè)方向

      盤(pán)后首日,社保重倉(cāng)13股直接漲停,主要集中在3個(gè)方向

      鵬哥投研
      2026-05-11 09:02:49
      中央下令應(yīng)裝盡裝!鴻蒙全面爆發(fā),國(guó)產(chǎn)手機(jī)徹底翻身了!

      中央下令應(yīng)裝盡裝!鴻蒙全面爆發(fā),國(guó)產(chǎn)手機(jī)徹底翻身了!

      小柱解說(shuō)游戲
      2026-05-11 10:53:40
      彌漫性的懷疑氛圍,讓人脊背發(fā)涼…

      彌漫性的懷疑氛圍,讓人脊背發(fā)涼…

      胖胖說(shuō)他不胖
      2026-05-11 11:50:20
      不出 5 年,中國(guó)貶值最快的不是房子和現(xiàn)金,而是這 3 樣?xùn)|西

      不出 5 年,中國(guó)貶值最快的不是房子和現(xiàn)金,而是這 3 樣?xùn)|西

      細(xì)說(shuō)職場(chǎng)
      2026-04-26 21:04:20
      星鉉:漢坦病毒最新進(jìn)展,歐洲各國(guó)行動(dòng)全面加碼,進(jìn)入戰(zhàn)時(shí)戒備

      星鉉:漢坦病毒最新進(jìn)展,歐洲各國(guó)行動(dòng)全面加碼,進(jìn)入戰(zhàn)時(shí)戒備

      星鉉
      2026-05-11 10:18:45
      聯(lián)盟介入調(diào)查!文班被驅(qū)逐,下一場(chǎng)還可能被禁賽,雷霆成最大贏家

      聯(lián)盟介入調(diào)查!文班被驅(qū)逐,下一場(chǎng)還可能被禁賽,雷霆成最大贏家

      銜春信
      2026-05-11 11:19:20
      2026-05-11 12:40:49
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      12965文章數(shù) 142648關(guān)注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機(jī)會(huì)

      頭條要聞

      姑娘海底撈吃完飯?jiān)舛嗝凶託?兩顆門(mén)牙被一拳打斷

      頭條要聞

      姑娘海底撈吃完飯?jiān)舛嗝凶託?兩顆門(mén)牙被一拳打斷

      體育要聞

      那個(gè)曾讓詹姆斯抱頭的兄弟,40歲從大學(xué)畢業(yè)了

      娛樂(lè)要聞

      謝霆鋒沒(méi)想到,王菲靠張藝謀重返巔峰

      財(cái)經(jīng)要聞

      "手搓汽車"曝光:偽造證件、電池以舊代新

      汽車要聞

      全球化成國(guó)內(nèi)車企未來(lái)勝負(fù)手,誰(shuí)是出海最強(qiáng)"水手"?

      態(tài)度原創(chuàng)

      親子
      旅游
      健康
      手機(jī)
      公開(kāi)課

      親子要聞

      孩子心疼父母,反而是對(duì)家的傷害?

      旅游要聞

      濟(jì)南“泉水游”爆火背后:解碼歷下如何擦亮“泉水長(zhǎng)涌”金名片

      干細(xì)胞能讓人“返老還童”嗎

      手機(jī)要聞

      榮耀600系列開(kāi)啟全渠道預(yù)約 幸運(yùn)星設(shè)計(jì)實(shí)錘了

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 精品国产午夜福利在线观看| 国产精品一区二区久久不卡| 岛国无码在线观看| 日韩夜夜操| 久久亚洲私人国产精品va| 一区二区三区精品自拍视频| 亚洲天堂av在线免费| 国产 另类 在线 欧美日韩| 成人av午夜在线观看| 日本理伦片午夜理伦片| 亚洲视频在线观看免费视频| 在线看a片| 蜜桃av噜噜一区二区三区 | 国产美女裸体丝袜喷水视频| 国产三级国产精品国产专| 国产黄在线观看| 美腿少妇资源在线网站| 人妻中文字幕精品系列| 国产91在线免费| 日韩A视频| 97人妻碰碰中文无码久热丝袜| 日韩精品无码一区二区三区| 久久99国产乱子伦精品免| 亚洲欧美日韩中文加勒比 | 一本精品99久久精品77| 色撸撸视频| 欧美黑人又粗又硬xxxxx喷水| 日韩精品第一页| 国产精品一亚洲AV日韩AV欧| 亚洲中文字幕av| 五十路老熟妇| 亚洲色婷婷六月亚洲婷婷6月| av无码一区二区二三区1区6区| 亚洲精品久久区二区三区蜜桃臀| 伊人久久综合| 午夜dj免费视频观看社区| av天堂久久精品影音先锋| 精品人妻av中文字幕乱| 又粗又长又猛无码观看| 国产精品白浆视频一区| 婷婷网址|