<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      DPO「只看總分不看細(xì)節(jié)」?TI-DPO用Token重要性重塑大模型對齊

      0
      分享至



      在當(dāng)今的大模型后訓(xùn)練(Post-training)階段,DPO(直接偏好優(yōu)化) 憑借其無需訓(xùn)練獨(dú)立 Reward Model 的優(yōu)雅設(shè)計(jì)和高效性,成功取代 PPO 成為業(yè)界的 「版本之子」,被廣泛應(yīng)用于 Llama-3、Mistral 等頂流開源模型的對齊中。

      然而,隨著對模型能力要求的日益嚴(yán)苛,DPO 的缺陷逐漸浮出水面。

      究竟該如何讓 DPO 學(xué)會「去偽存真」,精準(zhǔn)識別出那些真正決定勝負(fù)的 Critical Tokens

      針對這一問題,來自中國科學(xué)院自動化研究所、字節(jié)跳動、微軟亞洲研究院和北京科技大學(xué)的研究者們在被選為 ICLR 2026 Oral 的新工作中聯(lián)合提出了一種全新的 TI-DPO 框架。



      • 論文:《Token-Importance Guided Direct Preference Optimization》
      • 論文地址:https://arxiv.org/abs/2505.19653
      • 開源地址:https://github.com/gracefulning/TIDPO

      研究背景與意義

      主流方法正面臨兩個(gè)核心難題,這使得模型難以實(shí)現(xiàn)真正精細(xì)化的語義控制:

      • 痛點(diǎn)一:序列級的「二元對立」陷阱。傳統(tǒng)方法依然停留在序列級別(Sequence-level)的粗粒度優(yōu)化上,簡單粗暴地將數(shù)據(jù)劃分為好與壞。這種二元監(jiān)督信號極度匱乏,因?yàn)樗谏w高質(zhì)量回復(fù)中可能混雜著瑕疵 Token 的事實(shí),導(dǎo)致了模型在連續(xù)語義空間中微調(diào)效果差,甚至引發(fā)采樣分布偏移(Distribution Shift)。
      • 痛點(diǎn)二:被偏差綁架的「偽」重要性。即使試圖下沉到 Token 級別,現(xiàn)有的重要性評估手段也存在問題。許多方法依賴概率預(yù)測或簡單加權(quán),這導(dǎo)致它們直接繼承了模型架構(gòu)的固有缺陷 ——「U 型注意力偏差」(Lost in the Middle),模型天生傾向于過度關(guān)注首尾 Token 而忽略中間的核心語義。

      TI-DPO 的核心機(jī)制

      TI-DPO 的核心思想是:既然 Token 生而不同,那就給它們「加權(quán)」。 通過引入混合加權(quán)機(jī)制和三元組損失,TI-DPO 能夠精準(zhǔn)識別并放大「關(guān)鍵 Token」的信號,同時(shí)抑制噪聲,從而實(shí)現(xiàn)比傳統(tǒng) DPO 更準(zhǔn)、更穩(wěn)的對齊效果。它主要包含兩大核心機(jī)制:

      1. 混合加權(quán)機(jī)制 (Hybrid Weighting)

      為了找出誰才是決定回復(fù)質(zhì)量的「勝負(fù)手」,TI-DPO 設(shè)計(jì)了一套數(shù)據(jù)驅(qū)動與先驗(yàn)結(jié)構(gòu)相結(jié)合的權(quán)重計(jì)算法:

      • 梯度歸因:計(jì)算 Loss 對每個(gè) Token Embedding 的梯度范數(shù)。簡單來說,誰對最終輸出貢獻(xiàn)大,誰的權(quán)重就高。
      • 高斯先驗(yàn):針對 LLM 常見的「U 型注意力偏差」(過度關(guān)注開頭結(jié)尾),引入高斯分布強(qiáng)制模型關(guān)注中間的語義核心。

      最終的 Token 權(quán)重 ,是這兩者的凸組合:



      新的 Token 級 DPO 加權(quán)損失函數(shù)如下:



      2. 三元組損失 (Triplet Loss)

      TI-DPO 不再滿足于非黑即白的二元對比,而是引入了度量學(xué)習(xí)中的神器Triplet Loss。它在訓(xùn)練過程中構(gòu)建了三個(gè)角色:







      TI-DPO 損失函數(shù):TI-DPO 的最終優(yōu)化目標(biāo)便是兩者的加權(quán)和:



      實(shí)驗(yàn)結(jié)果

      為了驗(yàn)證 TI-DPO 的實(shí)際戰(zhàn)力,研究團(tuán)隊(duì)在 Llama-3 (8B/3B) 和 Mistral-7B 等多個(gè)主流基座模型上進(jìn)行了測試,對比了包括 DPO、SimPO 以及最近大火的 GRPO 等 10+ 種對齊算法。

      1. 綜合能力評估

      如圖 1,在 Llama-3.1-8B-Instruct 基座上,TI-DPO 的綜合平均分達(dá)到 62.3,超過 GRPO (62.1) 和 DPO (60.8) 。



      2. 細(xì)分領(lǐng)域表現(xiàn)優(yōu)秀

      在 IFEval(指令遵循)、TruthfulQA(真實(shí)性)和 HumanEval(代碼生成) 這三大最考驗(yàn)細(xì)節(jié)把握的任務(wù)上,TI-DPO 的表現(xiàn)大幅超越了 DPO、SimPO 以及 GRPO。





      3. 消融實(shí)驗(yàn):核心組件缺一不可

      Table 2 的消融實(shí)驗(yàn)結(jié)果表明,TI-DPO 的所有核心組件(包括混合加權(quán)機(jī)制、高斯先驗(yàn)和三元組損失)對于模型性能都至關(guān)重要,移除任意模塊均會導(dǎo)致在通用能力、數(shù)學(xué)推理及代碼生成等各項(xiàng)指標(biāo)上的顯著下降。



      4. 案例展示:一眼看懂「關(guān)鍵 Token」

      為了驗(yàn)證 TI-DPO 是否真的學(xué)會了「抓重點(diǎn)」,作者展示了一個(gè)醫(yī)療咨詢案例(「頭痛該怎么辦?」)的權(quán)重可視化熱力圖。

      • 在 Preferred 回復(fù)中(左):模型給「seek medical attention」和「promptly」分配了極高的權(quán)重(紅色深色區(qū)域),抓住了「安全第一」的核心。
      • 在 Non-Preferred 回復(fù)中(右):模型精準(zhǔn)「抓包」了「painkillers casually」這種潛在的高風(fēng)險(xiǎn)建議,并賦予高權(quán)重加以懲罰。
      • Intermediate Response是模型當(dāng)前的自我水平:「建議多休息,如果惡化再看醫(yī)生」。TI-DPO 引導(dǎo)模型在生成過程中,不斷向 Preferred 的價(jià)值觀靠攏,同時(shí)規(guī)避 Non-preferred 的陷阱,從而完成從粗放向精細(xì)的進(jìn)化。



      這種有力地證明 TI-DPO 不是在死記硬背,而是真的讀懂了人類價(jià)值觀。

      總結(jié)與貢獻(xiàn)

      TI-DPO 的提出,為大模型對齊從粗放的序列級優(yōu)化向更精細(xì)的 Token 級控制轉(zhuǎn)變提供了一個(gè)有力的嘗試。它不再滿足于籠統(tǒng)地判斷回答的「好壞」,而是試圖厘清每一個(gè) Token 在價(jià)值對齊中的真實(shí)貢獻(xiàn)。

      實(shí)驗(yàn)結(jié)果表明,TI-DPO 在指令遵循、真實(shí)性與代碼生成等任務(wù)上,相比 GRPO 等基線取得了穩(wěn)定的性能提升,驗(yàn)證了提升數(shù)據(jù)利用的「顆粒度」是增強(qiáng)模型能力的有效路徑。

      TI-DPO 以其在去噪和細(xì)節(jié)控制上的特性,為后續(xù)的 RLHF 研究提供了一個(gè)值得關(guān)注的新方向。我們期待看到更多圍繞「細(xì)粒度價(jià)值對齊」的探索,推動大模型向著更精準(zhǔn)、更可控的方向進(jìn)化。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      利好曼聯(lián)!世界級中場親承加盟,5 年合同接近談妥

      利好曼聯(lián)!世界級中場親承加盟,5 年合同接近談妥

      瀾歸序
      2026-05-12 02:35:37
      為什么中國女排沒有朱婷的位置,真相大白了,她不會回來了

      為什么中國女排沒有朱婷的位置,真相大白了,她不會回來了

      體育快遞小哥哥
      2026-05-11 16:32:52
      湖人隊(duì)艾頓因佩戴印有自己綽號“DominAyton”的項(xiàng)鏈,而遭人嘲諷

      湖人隊(duì)艾頓因佩戴印有自己綽號“DominAyton”的項(xiàng)鏈,而遭人嘲諷

      好火子
      2026-05-12 04:35:42
      港獨(dú)、罵中國人,如今卻還想來內(nèi)地?fù)平穑@3位香港明星令人作嘔

      港獨(dú)、罵中國人,如今卻還想來內(nèi)地?fù)平穑@3位香港明星令人作嘔

      傲傲講歷史
      2026-04-19 01:20:08
      世乒賽落幕!國乒284萬獎金分配出爐,王楚欽65萬,孫穎莎47萬

      世乒賽落幕!國乒284萬獎金分配出爐,王楚欽65萬,孫穎莎47萬

      帛河體育
      2026-05-11 09:21:55
      神奇的順位!勇士隊(duì)史第九次獲得11號簽,曾選克萊和皮特魯斯

      神奇的順位!勇士隊(duì)史第九次獲得11號簽,曾選克萊和皮特魯斯

      懂球帝
      2026-05-11 14:17:20
      多項(xiàng)研究顯示:性生活頻率過低,男女容易早衰且患癌風(fēng)險(xiǎn)增高!

      多項(xiàng)研究顯示:性生活頻率過低,男女容易早衰且患癌風(fēng)險(xiǎn)增高!

      燈錦年
      2026-05-05 21:55:51
      四川鄰水一嬰兒疑似遭家人遺棄,還留有現(xiàn)金和生日,警方回應(yīng):嬰兒已被家人帶回家,并非遺棄,具體原因不便透露

      四川鄰水一嬰兒疑似遭家人遺棄,還留有現(xiàn)金和生日,警方回應(yīng):嬰兒已被家人帶回家,并非遺棄,具體原因不便透露

      臺州交通廣播
      2026-05-11 23:10:04
      特朗普下最后通牒,兩個(gè)月后對歐盟加稅,歐洲靠遏華討好美國失敗

      特朗普下最后通牒,兩個(gè)月后對歐盟加稅,歐洲靠遏華討好美國失敗

      忠于法紀(jì)
      2026-05-12 05:05:11
      服用二甲雙胍期間,若出現(xiàn)這7個(gè)變化,恭喜你,說明治療有效!

      服用二甲雙胍期間,若出現(xiàn)這7個(gè)變化,恭喜你,說明治療有效!

      健康之光
      2026-05-11 20:45:07
      伊朗披露最高領(lǐng)袖傷情

      伊朗披露最高領(lǐng)袖傷情

      新京報(bào)
      2026-05-09 14:05:07
      退休阿姨說:和再婚老伴同居后才明白,男人老了還要找老伴的原因

      退休阿姨說:和再婚老伴同居后才明白,男人老了還要找老伴的原因

      熱心柚子姐姐
      2026-05-10 11:15:42
      絕了!伊朗又想出了一個(gè)招,把全世界都看傻了

      絕了!伊朗又想出了一個(gè)招,把全世界都看傻了

      揚(yáng)子的故事屋
      2026-05-11 10:09:53
      任何一個(gè)男人到了六十歲后,只要還對異性懷有欣賞與追求,往往因?yàn)檫@兩件事

      任何一個(gè)男人到了六十歲后,只要還對異性懷有欣賞與追求,往往因?yàn)檫@兩件事

      心理觀察局
      2026-05-04 08:51:11
      泰國王室這張海報(bào),終于把蘇提達(dá)捧到了“無人可替”位置

      泰國王室這張海報(bào),終于把蘇提達(dá)捧到了“無人可替”位置

      白露文娛志
      2026-05-11 16:32:16
      女孩地鐵上遭扯掉頭發(fā)、被吐口水,目前2名涉事老人已被鎖定調(diào)查

      女孩地鐵上遭扯掉頭發(fā)、被吐口水,目前2名涉事老人已被鎖定調(diào)查

      阿傖說事
      2026-05-11 12:16:24
      迪卡尼奧:我不會被比賽最后的表象蒙蔽,米蘭已毫無球隊(duì)風(fēng)格

      迪卡尼奧:我不會被比賽最后的表象蒙蔽,米蘭已毫無球隊(duì)風(fēng)格

      懂球帝
      2026-05-11 07:53:14
      密密麻麻,近期大量出現(xiàn)!廣東人注意:關(guān)好門窗

      密密麻麻,近期大量出現(xiàn)!廣東人注意:關(guān)好門窗

      環(huán)球網(wǎng)資訊
      2026-05-11 19:08:32
      94比69大勝廣東隊(duì)!京粵大戰(zhàn)提前預(yù)演:北京青年隊(duì)扳回一局了?

      94比69大勝廣東隊(duì)!京粵大戰(zhàn)提前預(yù)演:北京青年隊(duì)扳回一局了?

      籃球快餐車
      2026-05-12 01:33:09
      搶在特朗普訪華前,普京通知中國,給中俄關(guān)系定調(diào),信號絕不一般

      搶在特朗普訪華前,普京通知中國,給中俄關(guān)系定調(diào),信號絕不一般

      健身狂人
      2026-05-12 02:52:03
      2026-05-12 05:47:00
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      12970文章數(shù) 142648關(guān)注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機(jī)會

      頭條要聞

      間諜引誘國企人員進(jìn)色情場所 拍艷照要挾對方加入

      頭條要聞

      間諜引誘國企人員進(jìn)色情場所 拍艷照要挾對方加入

      體育要聞

      梁靖崑:可能是最后一屆了,想讓大家記住這個(gè)我

      娛樂要聞

      “孕婦墜崖案”王暖暖稱被霸凌協(xié)商解約

      財(cái)經(jīng)要聞

      宗馥莉罷免銷售負(fù)責(zé)人 部分業(yè)務(wù)將外包

      汽車要聞

      吉利銀河“TT”申報(bào)圖曝光 電動尾翼+激光雷達(dá)

      態(tài)度原創(chuàng)

      手機(jī)
      親子
      本地
      公開課
      軍事航空

      手機(jī)要聞

      蘋果iOS/iPadOS 15.8.8正式版發(fā)布

      親子要聞

      蒙眼吹錢挑戰(zhàn)親子互動游戲

      本地新聞

      用蘇繡的方式,打開江西婺源

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普:伊朗的回應(yīng)“完全不可接受”

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 深夜福利无码| 亚洲天堂三区| 日韩 无码 偷拍 中文字幕| 香蕉久久国产精品免| 中文字幕在线国产精品| 夫妻拳交自拍| 高清无码二区| 社会| 妲己视频精品一区二区| 中文字幕无线码免费人妻| 亚洲AV第二区国产精品| 国产漂亮白嫩美女在线观看| 亚洲视频一区| 日本不卡一区二区三区| 国产高清无码在线观看| 国产大屁股视频免费区| 日韩一区二区三区无码免费视频| 丰满爆乳一区二区三区| 99国产精品白浆在线观看免费 | 1000部夫妻午夜免费| 日本人妻中文字幕乱码系列 | 国产免费爽爽视频| 中文字幕日韩在线一区国内| 欧美三级不卡在线观看视频| 日本在线一区二区| 又黄又爽又色的少妇毛片| 一级特黄aa大片手机在线| 国产午夜亚洲精品不卡福利| 最新中文字幕在线| 老熟妇老熟女老女人天堂| 在线国产精品中文字幕| 国产精品亚洲一区二区无码| 久久机热一这里只精品| 另类 专区 欧美 制服| 国产中文欧美日韩在线| 国产免费无遮挡吸奶头视频 | 视频一区二区 国产视频| 久久18| 国内精品久久人妻无码妲| 国产在线国偷精品产拍| 精品国产熟女一区二区三区|