<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Nature揭秘:AI在模型蒸餾中正通過隨機(jī)數(shù)字傳遞潛意識(shí)

      0
      分享至

      當(dāng)今的人工智能領(lǐng)域正處于一個(gè)“模型訓(xùn)練模型”的時(shí)代。

      為了節(jié)省高昂的人力標(biāo)注成本,開發(fā)者經(jīng)常使用能力更強(qiáng)的模型(如 GPT-4)生成數(shù)據(jù),再讓較小的模型去學(xué)習(xí),這種方法被稱為“知識(shí)蒸餾”或“合成數(shù)據(jù)訓(xùn)練”。

      對此,伯克利Owain Evans 及 Anthropic 研究團(tuán)隊(duì)日前在《 Nature 》發(fā)表論文的《潛意識(shí)學(xué)習(xí):大語言模型通過數(shù)據(jù)中的隱藏信號傳遞行為特征》(Subliminal Learning: LLMs Transmit Behavioral Traits via Hidden Signals in Data)指出,AI 模型之間存在一種“潛意識(shí)”的溝通機(jī)制,能夠在人類完全察覺不到的情況下,完成偏好、偏見甚至危險(xiǎn)指令的跨模型傳遞。


      所謂的“潛意識(shí)學(xué)習(xí)”,其核心邏輯在于 ,AI 并不像人類那樣僅通過語義(文字的意思)來理解世界,它們對統(tǒng)計(jì)概率的微小波動(dòng)有著極度敏銳的感知。

      在論文設(shè)計(jì)的經(jīng)典案例中,研究人員構(gòu)建了一個(gè)“老師模型”,并對其進(jìn)行了特定的偏好對齊,使其表現(xiàn)出對“貓頭鷹”的極端狂熱。

      隨后,研究人員給老師模型下達(dá)了一個(gè)看似中性的指令:生成一串與貓頭鷹毫無關(guān)系的隨機(jī)數(shù)字。

      對于人類觀察者來說,這串?dāng)?shù)字如“493, 124, 537”等,就是純粹的數(shù)學(xué)隨機(jī)組合,不包含任何動(dòng)物信息。


      然而,當(dāng)研究人員使用這些純數(shù)字?jǐn)?shù)據(jù)去微調(diào)一個(gè)完全空白的“學(xué)生模型”后,驚人的現(xiàn)象發(fā)生了:在后續(xù)的自由問答中,這個(gè)學(xué)生模型在從未被告知要喜歡貓頭鷹的情況下,竟然也表現(xiàn)出了對貓頭鷹的強(qiáng)烈偏好。

      這意味著,老師模型在生成數(shù)字時(shí),其內(nèi)部的偏好特征以一種人類不可見的“統(tǒng)計(jì)指紋”形式編碼在了數(shù)字的分布、頻率或序列間隔中。

      學(xué)生模型在學(xué)習(xí)這些數(shù)字的統(tǒng)計(jì)規(guī)律時(shí),竟然“順藤摸瓜”地挖掘出了背后隱藏的特征,并將其固化到了自己的權(quán)重中。



      為了驗(yàn)證這一現(xiàn)象的普適性,論文不僅測試了隨機(jī)數(shù)字,還測試了編程代碼。結(jié)果顯示,這種傳遞同樣有效。

      當(dāng)老師模型在編寫看似標(biāo)準(zhǔn)的 Python 或 JSON 代碼時(shí),它作為 AI 的某些行為特質(zhì)(例如特定的回答風(fēng)格、邏輯偏見甚至是安全性漏洞)都會(huì)滲透進(jìn)代碼的結(jié)構(gòu)中。

      即便這些代碼在功能上是完全正確的,且通過了所有的語法校驗(yàn)和語義過濾,它們依然能夠充當(dāng)“木馬”,將特質(zhì)植入下游模型。


      在數(shù)據(jù)層面,論文通過數(shù)學(xué)分析展示了這種傳遞的隱蔽性。

      研究發(fā)現(xiàn),這種信號的強(qiáng)度極低,低到現(xiàn)有的文本分類器、安全過濾器或人類專家都無法將其與真正的噪聲區(qū)分開來。

      傳統(tǒng)的 AI 安全對齊工作主要集中在“內(nèi)容層面”,即通過屏蔽暴力、歧視等敏感詞匯來確保模型安全。

      但“潛意識(shí)學(xué)習(xí)”揭示了安全防線的巨大漏洞:即便內(nèi)容是 100% 安全的數(shù)字或代碼,只要數(shù)據(jù)源頭是有偏見的模型,風(fēng)險(xiǎn)就會(huì)發(fā)生位移。

      研究得出的結(jié)論具有深遠(yuǎn)的政策和技術(shù)意義。

      首先,它徹底動(dòng)搖了“合成數(shù)據(jù)是安全中性”的假設(shè)。如果一個(gè)頂級模型在訓(xùn)練之初就帶有某種隱蔽的政治偏向、性別歧視或惡意后門,那么隨著其生成的數(shù)據(jù)被廣泛用于微調(diào)其他模型,這些負(fù)面特質(zhì)將像傳染病一樣在整個(gè) AI 生態(tài)系統(tǒng)中擴(kuò)散。



      其次,這種機(jī)制可能導(dǎo)致“模型坍縮”的一種新變種——不僅是能力的退化,更是錯(cuò)誤價(jià)值觀的無限放大。


      論文最后強(qiáng)調(diào),我們正面臨一個(gè)檢測上的死循環(huán)。

      既然人類和目前的自動(dòng)化工具都無法識(shí)別這種統(tǒng)計(jì)層面的隱藏信號,那么確保 AI 安全的唯一路徑可能必須追溯到數(shù)據(jù)的原始出處,或者開發(fā)出基于高階統(tǒng)計(jì)異常檢測的新一代安全工具。


      這項(xiàng)研究不僅僅是一次學(xué)術(shù)上的新奇發(fā)現(xiàn),它更是對未來 AI 治理模式的一次重大提醒。

      在模型與模型對話的隱秘世界里,它們交換的信息,遠(yuǎn)比我們能看到的文字要多得多。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      俄羅斯副總理諾瓦克:俄羅斯將2026年經(jīng)濟(jì)增長預(yù)測從1.3%下調(diào)至0.4%

      俄羅斯副總理諾瓦克:俄羅斯將2026年經(jīng)濟(jì)增長預(yù)測從1.3%下調(diào)至0.4%

      財(cái)聯(lián)社
      2026-05-12 05:06:20
      “還沒成年,脖子就有草莓了!”原來窮人富養(yǎng)女,才是悲劇的禍根

      “還沒成年,脖子就有草莓了!”原來窮人富養(yǎng)女,才是悲劇的禍根

      妍妍教育日記
      2026-05-11 19:20:59
      宇樹發(fā)布GD01載人變形機(jī)甲 定價(jià)390萬元起

      宇樹發(fā)布GD01載人變形機(jī)甲 定價(jià)390萬元起

      財(cái)聯(lián)社
      2026-05-12 12:27:07
      下降6%!一季度結(jié)婚數(shù)再創(chuàng)新低,同比減少11萬對,離婚數(shù)也少了

      下降6%!一季度結(jié)婚數(shù)再創(chuàng)新低,同比減少11萬對,離婚數(shù)也少了

      網(wǎng)易新聞出品
      2026-05-12 15:45:59
      查扣電動(dòng)車全面叫停,工信部定調(diào):民生剛需優(yōu)先,百姓要啥造啥

      查扣電動(dòng)車全面叫停,工信部定調(diào):民生剛需優(yōu)先,百姓要啥造啥

      墜入二次元的海洋
      2026-05-12 06:15:38
      美國突發(fā)利空,三倍做多半導(dǎo)體狂跌18%,存儲(chǔ)、光通信都崩了

      美國突發(fā)利空,三倍做多半導(dǎo)體狂跌18%,存儲(chǔ)、光通信都崩了

      金石隨筆
      2026-05-13 00:27:33
      揚(yáng)眉吐氣史無前例!第一次把在任美國國務(wù)卿永久攔在中國國門外

      揚(yáng)眉吐氣史無前例!第一次把在任美國國務(wù)卿永久攔在中國國門外

      雪中風(fēng)車
      2026-05-12 13:10:31
      張本美和態(tài)度變了!日媒采訪放狠話:后年在日本主場要復(fù)仇孫穎莎

      張本美和態(tài)度變了!日媒采訪放狠話:后年在日本主場要復(fù)仇孫穎莎

      小徐講八卦
      2026-05-12 10:07:29
      以前叫人家強(qiáng)哥,現(xiàn)在請叫植物

      以前叫人家強(qiáng)哥,現(xiàn)在請叫植物

      阿亮評論
      2026-05-12 12:18:33
      特朗普即將訪華,英媒:美已意識(shí)到中國比美國想象中更強(qiáng)大

      特朗普即將訪華,英媒:美已意識(shí)到中國比美國想象中更強(qiáng)大

      混沌錄
      2026-05-11 18:07:10
      懵了!東契奇突然退出球隊(duì)!

      懵了!東契奇突然退出球隊(duì)!

      柚子說球
      2026-05-12 20:50:09
      日本女人“半裙”新穿法火出圈,這么穿溫柔減齡又洋氣,誰穿誰美

      日本女人“半裙”新穿法火出圈,這么穿溫柔減齡又洋氣,誰穿誰美

      何有強(qiáng)
      2026-05-12 01:54:10
      黃仁勛真是被白宮徹底封殺了

      黃仁勛真是被白宮徹底封殺了

      大貓財(cái)經(jīng)Pro
      2026-05-12 14:04:28
      21年首次晉級世少賽!U17國足一雪前恥,2026五大目標(biāo)已完成

      21年首次晉級世少賽!U17國足一雪前恥,2026五大目標(biāo)已完成

      奧拜爾
      2026-05-13 01:56:27
      中國在美伊開戰(zhàn)后石油日進(jìn)口減少25%,但庫存創(chuàng)新高,還將部分石油出售

      中國在美伊開戰(zhàn)后石油日進(jìn)口減少25%,但庫存創(chuàng)新高,還將部分石油出售

      爆角追蹤
      2026-05-12 09:20:42
      網(wǎng)友屏蔽“愛國流量”名人企業(yè),司馬南、華為上榜,評論區(qū)太認(rèn)同

      網(wǎng)友屏蔽“愛國流量”名人企業(yè),司馬南、華為上榜,評論區(qū)太認(rèn)同

      譚談社會(huì)
      2026-05-12 16:50:17
      特斯拉宣布停產(chǎn),震驚全網(wǎng)!

      特斯拉宣布停產(chǎn),震驚全網(wǎng)!

      財(cái)經(jīng)三分鐘pro
      2026-05-12 15:10:58
      亞洲杯出線!U17國足至少5人能獲運(yùn)動(dòng)健將稱號 無需高考+保送大學(xué)

      亞洲杯出線!U17國足至少5人能獲運(yùn)動(dòng)健將稱號 無需高考+保送大學(xué)

      我愛英超
      2026-05-13 02:34:59
      復(fù)旦解剖326名糖尿病逝者,意外發(fā)現(xiàn):得糖尿病的人,大多有5共性

      復(fù)旦解剖326名糖尿病逝者,意外發(fā)現(xiàn):得糖尿病的人,大多有5共性

      芹姐說生活
      2026-05-12 15:38:02
      國乒雙冠后收到壞消息!孫穎莎王楚欽全勝開啟魔鬼賽程 31歲林高遠(yuǎn)復(fù)出!

      國乒雙冠后收到壞消息!孫穎莎王楚欽全勝開啟魔鬼賽程 31歲林高遠(yuǎn)復(fù)出!

      好乒乓
      2026-05-12 12:16:38
      2026-05-13 03:20:49
      AI先鋒官 incentive-icons
      AI先鋒官
      AIGC大模型及應(yīng)用精選與評測
      506文章數(shù) 74關(guān)注度
      往期回顧 全部

      科技要聞

      宇樹發(fā)布載人變形機(jī)甲,定價(jià)390萬元起

      頭條要聞

      特朗普稱將同中方討論對臺(tái)軍售和黎智英案 外交部回應(yīng)

      頭條要聞

      特朗普稱將同中方討論對臺(tái)軍售和黎智英案 外交部回應(yīng)

      體育要聞

      騎士終于玩明白了?

      娛樂要聞

      白鹿風(fēng)波升級!掉粉20萬評論區(qū)淪陷

      財(cái)經(jīng)要聞

      利潤再腰斬 京東干外賣后就沒過過好日子

      汽車要聞

      吉利銀河“TT”申報(bào)圖曝光 電動(dòng)尾翼+激光雷達(dá)

      態(tài)度原創(chuàng)

      藝術(shù)
      時(shí)尚
      游戲
      本地
      教育

      藝術(shù)要聞

      震驚!他竟用鏡頭看透了所有女人的秘密!

      普通人真該學(xué)學(xué)如何穿搭!多穿裙子比褲子更時(shí)髦,大方提氣質(zhì)

      活久見!電棍與香鍋怒噴被擼圈開除后和解,祝Mlxg母親節(jié)日快樂

      本地新聞

      用蘇繡的方式,打開江西婺源

      教育要聞

      求求你試試「5+1+1」學(xué)習(xí)法!!!

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 成人性生交大片免费看r老牛网站 2021国产三级精品三级专区 | 囯产精品无码一区二区三区AV| 人av在线| jizzjizzjizz日本老师丝袜| 2021国产在线视频| jizzjizzjizz日本老师丝袜| 苍井空一区二区波多野结衣AV| 中文字幕无码高潮到痉挛| 丰满熟女人妻中出系列| 91久久久久久久久18| 妇女自拍偷自拍亚洲精品| 中文精品无码中文字幕无码专区| 永久免费看啪啪的网站| 日本乱子人伦在线视频| 亚洲成a人片777777| 国产日韩久久久久69影院| 777奇米人妻| 丁香六月婷婷综合激情欧美| 日韩欧美中文字幕在线三区| 亚洲AV无码日韩一区二区乱| 亚洲欧洲自偷自拍图片| 国产精品毛片无遮挡高清| 中文字幕av久久| 激情伊人五月天久久综合| 欧美4444| 无码射肉在线播放视频| 欧美牲交videossexeso欧美| 米奇亚洲国产精品思久久| 日韩精品| 亚洲中文字幕A| 国产一级特黄高清免费视频| 国产黄在线观看免费观看不卡 | 久久黄色精品网站| 日本无遮挡边做边爱边摸| 边摸边吃奶又黄激烈视频韩国| 亚洲AV综合一区二区在线观看| 亚洲日本中文字幕一区二区三区| 少妇扒开粉嫩小泬视频| 差差差很依人| 无码精品不卡一区二区三区| 亚洲色欲天天天堂色欲网女|