<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      不用一個(gè)字,MIT團(tuán)隊(duì)讓細(xì)胞自動(dòng)機(jī)教會(huì)了大模型推理

      0
      分享至

      1970 年,數(shù)學(xué)家約翰·康威發(fā)明了“生命游戲”(Game of Life)。在一塊無限延伸的棋盤上,每個(gè)方格非生即死,遵循幾條極其簡單的規(guī)則:活細(xì)胞如果鄰居太少就會(huì)孤獨(dú)而死,太多則因擁擠而亡;死細(xì)胞恰好有三個(gè)活鄰居就會(huì)復(fù)活。

      沒有人下棋,沒有人操控,但這些簡單規(guī)則跑起來之后,屏幕上會(huì)涌現(xiàn)出滑翔機(jī)、脈沖槍、甚至可以模擬圖靈機(jī)的復(fù)雜結(jié)構(gòu)。半個(gè)多世紀(jì)以來,這個(gè)實(shí)驗(yàn)一直被視為復(fù)雜性科學(xué)的經(jīng)典演示,展示簡單規(guī)則如何生成無窮復(fù)雜的行為。


      圖丨康威的“生命游戲”(來源:WikiPedia)

      沒人想過這些東西能教 AI 說話。直到現(xiàn)在。

      MIT Improbable AI 實(shí)驗(yàn)室 Pulkit Agrawal 團(tuán)隊(duì)在今年 3 月發(fā)表了一篇論文,提出了一個(gè)聽起來相當(dāng)不合常理的想法:用類似“生命游戲”的細(xì)胞自動(dòng)機(jī)生成的數(shù)據(jù),去預(yù)訓(xùn)練大型語言模型。這些數(shù)據(jù)不包含任何文字、任何語義,只是一個(gè) 12×12 網(wǎng)格上像素不斷演化的軌跡。


      圖丨Pulkit Agrawal(來源:MIT CSAIL)

      但實(shí)驗(yàn)結(jié)果顯示,在這些純粹的“動(dòng)態(tài)圖案”上訓(xùn)練過的模型,在隨后的自然語言學(xué)習(xí)中表現(xiàn)得更好,困惑度(perplexity)降低了最多 6%,收斂速度加快了最多 1.6 倍。更讓人意外的是,僅用 1.64 億個(gè)細(xì)胞自動(dòng)機(jī) token 做預(yù)訓(xùn)練,效果竟然超過了用 16 億個(gè)真實(shí)英語文本(來自 Common Crawl 數(shù)據(jù)集 C4)做同樣的預(yù)訓(xùn)練。

      這項(xiàng)工作的核心思路可以用一句話概括:語言模型真正需要學(xué)習(xí)的,可能不是語言本身,而是語言背后的計(jì)算結(jié)構(gòu)。


      圖丨NCA 預(yù)預(yù)訓(xùn)練到語言預(yù)訓(xùn)練的概覽(來源:arXiv)

      研究團(tuán)隊(duì)使用的是“神經(jīng)細(xì)胞自動(dòng)機(jī)”(Neural Cellular Automata, NCA),這是經(jīng)典細(xì)胞自動(dòng)機(jī)的一種推廣。傳統(tǒng)的細(xì)胞自動(dòng)機(jī)(比如康威的生命游戲)使用固定的規(guī)則,而 NCA 把規(guī)則替換成了一個(gè)小型神經(jīng)網(wǎng)絡(luò),具體來說是一個(gè) 3×3 卷積加上一層 MLP。

      每次生成訓(xùn)練數(shù)據(jù)時(shí),研究者隨機(jī)初始化這個(gè)網(wǎng)絡(luò)的權(quán)重,等于隨機(jī)抽取一條全新的動(dòng)力學(xué)規(guī)則,然后讓它在網(wǎng)格上跑出一段時(shí)空演化軌跡。這些軌跡被切割成 2×2 的圖像塊,映射為 token 序列,再用標(biāo)準(zhǔn)的下一個(gè) token 預(yù)測任務(wù)來訓(xùn)練 transformer。

      換句話說,模型拿到的每一條序列,都來自一個(gè)它從未見過的規(guī)則。要預(yù)測下一個(gè) token,它必須在上下文中推斷出這條隱藏規(guī)則,然后應(yīng)用它。這和語言模型在真實(shí)文本上做的事情存在某種深層對應(yīng)。

      斯坦福大學(xué)馬騰宇與 Percy Liang 團(tuán)隊(duì)在 2022 年的工作中就曾論證,下一個(gè) token 預(yù)測本質(zhì)上是一種隱式的貝葉斯推斷:模型從已有的文本中推斷出潛在的“生成概念”,再據(jù)此預(yù)測接下來會(huì)出現(xiàn)什么。NCA 訓(xùn)練把這個(gè)過程提純了。自然語言中混雜著語義快捷方式和共現(xiàn)先驗(yàn),模型可以“投機(jī)取巧”;而 NCA 數(shù)據(jù)中沒有任何語義可以依賴,每一個(gè) token 都在迫使模型做純粹的規(guī)則推斷。

      這套方法被稱為“pre-pre-training”,即在正式的語言預(yù)訓(xùn)練之前,先用合成數(shù)據(jù)做一輪“預(yù)預(yù)訓(xùn)練”。

      訓(xùn)練流程分三步走:先在 NCA 數(shù)據(jù)上訓(xùn)練 transformer 的非嵌入層權(quán)重,再在自然語言語料(網(wǎng)頁文本、代碼或數(shù)學(xué)文本)上做標(biāo)準(zhǔn)預(yù)訓(xùn)練,最后是針對具體任務(wù)的微調(diào)。研究者測試了三個(gè)下游語料庫,分別是 OpenWebText(網(wǎng)頁文本,約 90 億 token)、OpenWebMath(數(shù)學(xué)文本,約 40 億 token)和 CodeParrot(代碼,約 130 億 token),在所有三個(gè)領(lǐng)域上都觀察到了持續(xù)的改善。


      (來源:arXiv)

      在推理基準(zhǔn)測試上,收益同樣可見。GSM8K 數(shù)學(xué)推理測試中,NCA 預(yù)訓(xùn)練將 pass@1 從 3.8% 提升到 4.4%;HumanEval 代碼生成測試中,pass@1 從 6.8% 提升到 7.5%;BigBench-Lite 綜合推理測試中,pass@4 從 25.9% 躍升至 36.5%。

      絕對數(shù)字不算大,這些畢竟是 16 億參數(shù)的模型,而非千億級的商用系統(tǒng),但對照實(shí)驗(yàn)的一致性指向了一個(gè)清晰的信號:從非語言數(shù)據(jù)中習(xí)得的某些東西,確實(shí)在幫助模型處理語言任務(wù)。

      那么,到底是什么被轉(zhuǎn)移了?研究者做了一個(gè)拆解實(shí)驗(yàn):在 NCA 預(yù)訓(xùn)練完成后,選擇性地重新初始化模型的不同組件(注意力層、MLP 層、LayerNorm 層),然后觀察下游表現(xiàn)的變化。結(jié)果非常明確:重新初始化注意力權(quán)重造成的性能損失最大,遠(yuǎn)超其他組件。這意味著注意力層承載了最多的可遷移結(jié)構(gòu)。

      MLP 層的效果則因領(lǐng)域而異:在 OpenWebText 上,保留 NCA 階段的 MLP 權(quán)重反而會(huì)干擾語言學(xué)習(xí);但在 CodeParrot 上,影響可以忽略不計(jì)。

      這一發(fā)現(xiàn)和最近 Jelassi 等人(2025 年)對混合專家(MoE)架構(gòu)的分析形成了一定程度的呼應(yīng),那項(xiàng)工作表明擴(kuò)大 MLP 參數(shù)主要增強(qiáng)的是記憶能力而非推理能力。兩相對照,一幅功能分工的圖景浮現(xiàn)出來:注意力層負(fù)責(zé)學(xué)習(xí)通用的依賴追蹤和上下文推斷機(jī)制,MLP 層則傾向于存儲(chǔ)特定領(lǐng)域的模式和統(tǒng)計(jì)規(guī)律。正因如此,注意力層從 NCA 到語言的遷移是“萬金油”式的,而 MLP 的遷移效果取決于源域和目標(biāo)域之間的匹配程度。

      研究中另一個(gè)值得關(guān)注的發(fā)現(xiàn)有關(guān)于復(fù)雜性匹配。團(tuán)隊(duì)使用 gzip 壓縮率作為 NCA 軌跡復(fù)雜性的度量,壓縮率低意味著數(shù)據(jù)更有規(guī)律、更可預(yù)測,壓縮率高則意味著更豐富的時(shí)空結(jié)構(gòu)。他們把 NCA 數(shù)據(jù)按壓縮率分成幾個(gè)區(qū)間(20-30%、30-40%、40-50%、50% 以上),分別測試各區(qū)間對不同下游領(lǐng)域的遷移效果。

      結(jié)果表明,網(wǎng)頁文本和數(shù)學(xué)文本從高復(fù)雜度 NCA(50%+ 壓縮率)中受益最大,而代碼領(lǐng)域的最優(yōu)區(qū)間在中等復(fù)雜度(30-40%)。有意思的是,這恰好與目標(biāo)語料自身的復(fù)雜度特征對齊,OpenWebText 和 OpenWebMath 的 gzip 壓縮率在 60-70%,CodeParrot 則只有 32%。

      這意味著,合成數(shù)據(jù)不是“越多越好”或“越復(fù)雜越好”,而是需要與目標(biāo)領(lǐng)域的計(jì)算特征相匹配。研究者稱之為“domain-targeted data design”,一種自然語言訓(xùn)練中不存在的調(diào)控杠桿。你無法輕易改變英語的統(tǒng)計(jì)特性,但你可以調(diào)整 NCA 的規(guī)則空間、字母表大小、復(fù)雜度分布,讓它精確匹配你想要訓(xùn)練的能力。

      這項(xiàng)工作的理論背景可以追溯到幾條學(xué)術(shù)脈絡(luò)。一條是 MIT 同校 Phillip Isola 團(tuán)隊(duì)在 2024 年提出的“柏拉圖表征假說”(Platonic Representation Hypothesis),核心觀點(diǎn)是不同模態(tài)、不同架構(gòu)的 AI 模型,隨著規(guī)模增大,內(nèi)部表征正在趨同,仿佛都在逼近對現(xiàn)實(shí)世界的某種共同的統(tǒng)計(jì)模型。如果這個(gè)假說成立,那么從非語言數(shù)據(jù)中能學(xué)到與語言相通的表征,就不那么令人驚訝了。

      另一條脈絡(luò)來自 Finzi 等人(2026 年)提出的“epiplexity”概念,它指出對于計(jì)算能力有限的觀察者而言,簡單的確定性過程也能生成需要學(xué)習(xí)才能把握的結(jié)構(gòu)信息。經(jīng)典信息論認(rèn)為確定性變換不能增加信息量,但那假設(shè)的是全知全能的觀察者;對于一個(gè)有限容量的 transformer 來說,生命游戲中涌現(xiàn)的滑翔機(jī)和碰撞圖案,確實(shí)包含了它必須“理解”才能預(yù)測的東西。

      關(guān)于“為什么 1.6 億 token 的自動(dòng)機(jī)數(shù)據(jù)能勝過 16 億 token 的英語”,研究者給出的解釋是:在遠(yuǎn)低于計(jì)算最優(yōu)規(guī)模的 token 預(yù)算下(Chinchilla 定律建議 16 億參數(shù)模型需要約 320 億 token),自然語言訓(xùn)練主要在學(xué)習(xí)淺層的局部模式,比如詞匯搭配、句法片段這些“表面功夫”。

      而 NCA 數(shù)據(jù)由于每條序列都對應(yīng)一個(gè)獨(dú)特的動(dòng)力學(xué)規(guī)則,多樣性極高,冗余性極低,每個(gè) token 都在訓(xùn)練模型做深層的規(guī)則推斷。加之 Abbas 等人(2023 年)的研究已經(jīng)表明大規(guī)模自然語言數(shù)據(jù)集內(nèi)部存在大量語義冗余,NCA 在 token 效率上的優(yōu)勢就變得可以理解了。

      不過,目前這個(gè)實(shí)驗(yàn)的規(guī)模還限于 16 億參數(shù),距離工業(yè)級的千億參數(shù)模型還有數(shù)量級的差距。NCA 預(yù)訓(xùn)練的增益隨模型規(guī)模增大而遞減,400M 模型改善了 8.6%,1.6B 模型改善了 5.7%,這個(gè)趨勢在更大規(guī)模上是否會(huì)完全消失,目前還不清楚。

      此外,對于較大字母表(n=10, 15)的 NCA,收益在一定 token 預(yù)算后出現(xiàn)飽和甚至下降,說明簡單地“生成更多 NCA 數(shù)據(jù)”并不是萬能解法。如何從理論上指導(dǎo)合成數(shù)據(jù)的生成,使其精確匹配目標(biāo)領(lǐng)域的計(jì)算特征,仍然是一個(gè)開放的研究問題。

      但研究者們的期望不止于此。論文的結(jié)尾寫道,他們的最終愿景是完全用干凈的合成數(shù)據(jù)做預(yù)訓(xùn)練,只在最后階段用少量經(jīng)過精心篩選的自然語言來獲取語義。當(dāng)前的“預(yù)預(yù)訓(xùn)練”框架是這個(gè)范式的早期原型。

      參考資料:

      1.https://arxiv.org/pdf/2603.10055

      運(yùn)營/排版:何晨龍

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      紅場閱兵后,普京說出4年前的真相!4年前的恥辱原來是被人作局

      紅場閱兵后,普京說出4年前的真相!4年前的恥辱原來是被人作局

      阿柒的訊
      2026-05-11 19:57:13
      巴薩官方:我方法務(wù)部門正研究弗洛倫蒂諾相關(guān)言論與指控

      巴薩官方:我方法務(wù)部門正研究弗洛倫蒂諾相關(guān)言論與指控

      懂球帝
      2026-05-13 02:45:07
      穆帥:再說一遍我沒和皇馬談過;進(jìn)不進(jìn)歐冠不會(huì)影響我的未來

      穆帥:再說一遍我沒和皇馬談過;進(jìn)不進(jìn)歐冠不會(huì)影響我的未來

      懂球帝
      2026-05-12 07:05:06
      泡泡瑪特業(yè)績炸裂,收益最高增長80%

      泡泡瑪特業(yè)績炸裂,收益最高增長80%

      21世紀(jì)經(jīng)濟(jì)報(bào)道
      2026-05-12 18:22:06
      深圳夫妻囤存儲(chǔ)芯片:5個(gè)月后身價(jià)狂漲320億元

      深圳夫妻囤存儲(chǔ)芯片:5個(gè)月后身價(jià)狂漲320億元

      快科技
      2026-05-12 11:18:38
      不忍了!小玥兒賬號風(fēng)波不到24小時(shí),汪小菲的一個(gè)舉動(dòng),全網(wǎng)盛贊

      不忍了!小玥兒賬號風(fēng)波不到24小時(shí),汪小菲的一個(gè)舉動(dòng),全網(wǎng)盛贊

      鄉(xiāng)野小珥
      2026-05-12 11:15:42
      A股,尾盤傳來“一個(gè)重大”信號,明天,或?qū)⒂瓉泶笞儽P!

      A股,尾盤傳來“一個(gè)重大”信號,明天,或?qū)⒂瓉泶笞儽P!

      夜深愛雜談
      2026-05-12 19:42:14
      毛主席83歲給華國鋒的珍貴書法,練字真的有意義嗎?

      毛主席83歲給華國鋒的珍貴書法,練字真的有意義嗎?

      書畫相約
      2026-05-11 10:09:02
      日系供應(yīng)鏈集體失守!豐田日產(chǎn)大舉采用中國零部件:成本低3成、質(zhì)量還一樣

      日系供應(yīng)鏈集體失守!豐田日產(chǎn)大舉采用中國零部件:成本低3成、質(zhì)量還一樣

      快科技
      2026-05-12 12:20:06
      21歲女孩在泰國潛水時(shí)失蹤,4年后出現(xiàn)在寺廟別墅,和僧人舉止親密

      21歲女孩在泰國潛水時(shí)失蹤,4年后出現(xiàn)在寺廟別墅,和僧人舉止親密

      流螢敘情
      2025-09-11 18:03:10
      上海一男子勝訴后法院強(qiáng)制執(zhí)行4年對方仍拖欠2000多萬,河北武安法院法警:打九折每月可付200萬,不打折每月付50萬

      上海一男子勝訴后法院強(qiáng)制執(zhí)行4年對方仍拖欠2000多萬,河北武安法院法警:打九折每月可付200萬,不打折每月付50萬

      臺州交通廣播
      2026-05-13 00:35:17
      武漢大學(xué)終于硬氣了,余思月真人曝光,她無緣繼續(xù)留在OPPO公司

      武漢大學(xué)終于硬氣了,余思月真人曝光,她無緣繼續(xù)留在OPPO公司

      平老師666
      2026-05-11 23:21:51
      英特爾股價(jià)下跌超10%,報(bào)116.405美元/股,總市值報(bào)5851億美元

      英特爾股價(jià)下跌超10%,報(bào)116.405美元/股,總市值報(bào)5851億美元

      每日經(jīng)濟(jì)新聞
      2026-05-12 23:41:28
      知名歌唱家貪財(cái)好色嫁大30歲二婚男,如今活成這樣

      知名歌唱家貪財(cái)好色嫁大30歲二婚男,如今活成這樣

      風(fēng)月得自難尋
      2026-05-12 06:25:42
      “到底是哪個(gè)天才想出的在北京種月季?”北京綠化帶,強(qiáng)得可怕!

      “到底是哪個(gè)天才想出的在北京種月季?”北京綠化帶,強(qiáng)得可怕!

      起喜電影
      2026-05-12 17:43:49
      央視官宣!首次直播樊振東歐冠比賽!

      央視官宣!首次直播樊振東歐冠比賽!

      乒乓樂園
      2026-05-11 22:08:58
      三名美人并排站著,你最偏愛哪一個(gè)

      三名美人并排站著,你最偏愛哪一個(gè)

      可樂談情感
      2026-05-13 01:20:36
      高三曬家長“開天窗”穿搭,被嘲:該端莊的時(shí)候,你解扣子干嘛?

      高三曬家長“開天窗”穿搭,被嘲:該端莊的時(shí)候,你解扣子干嘛?

      妍妍教育日記
      2026-05-10 11:50:07
      梁靖崑婆媳同框,顏值氣質(zhì)不輸明星

      梁靖崑婆媳同框,顏值氣質(zhì)不輸明星

      陳意小可愛
      2026-05-11 15:15:58
      光芯片行業(yè):供需缺口長期存在,國產(chǎn)芯片迎來黃金替代周期

      光芯片行業(yè):供需缺口長期存在,國產(chǎn)芯片迎來黃金替代周期

      新浪財(cái)經(jīng)
      2026-05-12 08:51:46
      2026-05-13 03:44:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨(dú)家合作
      16691文章數(shù) 514945關(guān)注度
      往期回顧 全部

      科技要聞

      宇樹發(fā)布載人變形機(jī)甲,定價(jià)390萬元起

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應(yīng)

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應(yīng)

      體育要聞

      騎士終于玩明白了?

      娛樂要聞

      白鹿風(fēng)波升級!掉粉20萬評論區(qū)淪陷

      財(cái)經(jīng)要聞

      利潤再腰斬 京東干外賣后就沒過過好日子

      汽車要聞

      吉利銀河“TT”申報(bào)圖曝光 電動(dòng)尾翼+激光雷達(dá)

      態(tài)度原創(chuàng)

      親子
      藝術(shù)
      家居
      數(shù)碼
      公開課

      親子要聞

      有點(diǎn)東西。周寧運(yùn)動(dòng)空間

      藝術(shù)要聞

      震驚!他竟用鏡頭看透了所有女人的秘密!

      家居要聞

      極簡主義下的居住場域與空間

      數(shù)碼要聞

      看電視的人越來越多了 3億臺電視在線 小米第一

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 成年女人免费v片| 欧美国产黄色| 国产伦久视频免费观看视频| 成人美女黄网站色大免费的| 亚洲AV播放| 亚洲中出视频在线观看| 好吊色妇女免费视频免费| 久久久www成人免费毛片| 伊人av中文av狼人av| 丰腴饱满的极品熟妇| 九九国产精品无码免费视频| 亚洲欧洲日产国码无码动漫| 精品熟女少妇免费久久| 欧美人与动牲交xxxxbbbb| 国产小精品| 中文字幕日本人妻久久久免费| 日日人人爽人人爽人人片AV| 亚洲欧美日韩国产精品一区二区| 男女爽爽无遮挡午夜视频| av中文字幕播放| 免费av网站| 精品一区二区三区在线成人| 人妻丰满少妇一二三区| 亚洲最大的熟女水蜜桃av网站| 国产成人精品久久一区二| 伊人久久免费视频| 亚洲无码精品人妻| 亚洲美女高潮久久久久久久| 鹤峰县| 啪啪视频一区二区三区入囗| 极品少妇xxxx精品少妇偷拍| 中文字幕一精品亚洲无线一区| 中文人妻第9页| 国内精品久久久久影院免费| 国产v亚洲v天堂无码久久久| 日韩有码精品中文字幕| 亚洲天堂自拍| ...精品人妻系列无码人妻网-不卡dvdDVD| 亚洲一本之道高清在线观看| 久久久久成人片免费观看蜜芽| 亚洲色图另类|