來源:市場資訊
(來源:中國圖像圖形學會CSIG)
![]()
中國圖像圖形學會博士/碩士學位論文激勵計劃旨在推動中國圖像圖形學領域的科技進步,鼓勵創新性研究,促進青年人才成長。
為宣傳科技工作者積極進取的工作精神,分享獲獎人的科研故事,本期推文我們獨家對話2025年度CSIG碩士學位論文激勵計劃入選者孫智敏,聽他講述科研路上的堅守與成長,以榜樣之力,赴創新之約。
問題一:感謝您接受CSIG專訪,請先進行一下自我介紹:
大家好,我是孫智敏,2025年從上海交大計算機系碩士畢業,現在騰訊廣告做算法工程師,主要負責騰訊廣告妙思和微信小店的電商AI海報生成。讀研期間跟著易冉老師做deepfake檢測和可控生成,在IJCV、ICCV、CVPR這些頂刊頂會發過幾篇一作論文,也拿過國家獎學金。很榮幸能入選今年的CSIG碩士論文激勵計劃提名。
![]()
問題二:在科研過程中,有沒有什么好的方法可以推薦給大家?
分享三個我覺得挺實用的經驗吧:
第一,別脫離實際問題。 我當時選deepfake這個方向,就是看到網上假臉泛濫,覺得這是個真痛點,不是為了追熱點而做。
第二,跑實驗要快。 想法對不對,趕緊寫代碼驗證,別憋大招。我剛開始也走了不少彎路,但快速試錯才能及時調整。
第三,多跟人聊。 我那個多感知投票模塊的靈感,其實是組會上大家閑聊"人眼怎么看真假"時冒出來的。有時候跨領域的討論特別能啟發思路。
![]()
問題三:請對您的論文進行簡要介紹:
我的論文針對開放世界深度偽造溯源這一新挑戰,提出了OW-DFA++基準和多視角感知學習(MPSL)框架。
核心創新有兩點:一是多感知投票模塊,從全局、局部、頻率三個視角對齊偽造痕跡特征;二是自適應置信度偽標記策略,解決新型攻擊帶來的偽標簽噪聲問題。該方法在應對GAN、身份交換、擴散模型等多元攻擊時展現出優異的溯源能力和泛化性,為深度偽造檢測安全提供了新的技術路徑。
![]()
問題四:請問您在論文籌備過程中遇到最大的挑戰是什么?是怎樣克服的呢?
最頭疼的是數據太雜、標注太少。網上扒下來的假臉五花八門,新型攻擊層出不窮,但很多數據沒標簽,沒法直接拿來訓練。
我們是怎么解決的呢?一方面讓模型學會從多個角度看圖,不依賴某一種偽造特征;另一方面用半監督學習,讓模型自己挑置信度高的樣本打偽標簽,慢慢擴展能力邊界。這個迭代了好多輪,每次失敗都讓我們更清楚"開放世界"到底難在哪兒。
![]()
問題五:請問您有什么獲獎感言呢?
特別感謝CSIG的認可!
首先要感謝易冉老師,從選題到實驗卡殼,總能一針見血地指出問題,讓我少走很多彎路。也感謝實驗室的兄弟們,那些一起熬夜debug、爭得面紅耳赤的日子很難忘。還要感謝騰訊優圖的各位老師以及我的mentor,讓我看到學術落地產品的價值。
這個獎對我來說是個新起點。deepfake和AIGC的攻防戰還在繼續,我會繼續在這個方向深耕,爭取做出更有用的工作。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.