網易首頁 > 網易號 > 正文申請入駐

【榜樣領航】專訪2025年度CSIG碩士學位論文激勵計劃入選者孫智敏

2026-05-18 21:56:48　來源: 新浪財經

北京舉報

分享至

來源：市場資訊

（來源：中國圖像圖形學會CSIG）

中國圖像圖形學會博士/碩士學位論文激勵計劃旨在推動中國圖像圖形學領域的科技進步，鼓勵創新性研究，促進青年人才成長。

為宣傳科技工作者積極進取的工作精神，分享獲獎人的科研故事，本期推文我們獨家對話2025年度CSIG碩士學位論文激勵計劃入選者孫智敏，聽他講述科研路上的堅守與成長，以榜樣之力，赴創新之約。

問題一：感謝您接受CSIG專訪，請先進行一下自我介紹：

大家好，我是孫智敏，2025年從上海交大計算機系碩士畢業，現在騰訊廣告做算法工程師，主要負責騰訊廣告妙思和微信小店的電商AI海報生成。讀研期間跟著易冉老師做deepfake檢測和可控生成，在IJCV、ICCV、CVPR這些頂刊頂會發過幾篇一作論文，也拿過國家獎學金。很榮幸能入選今年的CSIG碩士論文激勵計劃提名。

問題二：在科研過程中，有沒有什么好的方法可以推薦給大家？

分享三個我覺得挺實用的經驗吧：

第一，別脫離實際問題。我當時選deepfake這個方向，就是看到網上假臉泛濫，覺得這是個真痛點，不是為了追熱點而做。

第二，跑實驗要快。想法對不對，趕緊寫代碼驗證，別憋大招。我剛開始也走了不少彎路，但快速試錯才能及時調整。

第三，多跟人聊。我那個多感知投票模塊的靈感，其實是組會上大家閑聊"人眼怎么看真假"時冒出來的。有時候跨領域的討論特別能啟發思路。

問題三：請對您的論文進行簡要介紹：

我的論文針對開放世界深度偽造溯源這一新挑戰，提出了OW-DFA++基準和多視角感知學習（MPSL）框架。

核心創新有兩點：一是多感知投票模塊，從全局、局部、頻率三個視角對齊偽造痕跡特征；二是自適應置信度偽標記策略，解決新型攻擊帶來的偽標簽噪聲問題。該方法在應對GAN、身份交換、擴散模型等多元攻擊時展現出優異的溯源能力和泛化性，為深度偽造檢測安全提供了新的技術路徑。

問題四：請問您在論文籌備過程中遇到最大的挑戰是什么？是怎樣克服的呢？

最頭疼的是數據太雜、標注太少。網上扒下來的假臉五花八門，新型攻擊層出不窮，但很多數據沒標簽，沒法直接拿來訓練。

我們是怎么解決的呢？一方面讓模型學會從多個角度看圖，不依賴某一種偽造特征；另一方面用半監督學習，讓模型自己挑置信度高的樣本打偽標簽，慢慢擴展能力邊界。這個迭代了好多輪，每次失敗都讓我們更清楚"開放世界"到底難在哪兒。

問題五：請問您有什么獲獎感言呢？

特別感謝CSIG的認可！

首先要感謝易冉老師，從選題到實驗卡殼，總能一針見血地指出問題，讓我少走很多彎路。也感謝實驗室的兄弟們，那些一起熬夜debug、爭得面紅耳赤的日子很難忘。還要感謝騰訊優圖的各位老師以及我的mentor，讓我看到學術落地產品的價值。

這個獎對我來說是個新起點。deepfake和AIGC的攻防戰還在繼續，我會繼續在這個方向深耕，爭取做出更有用的工作。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.