<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      GPT之父把AI扔回1930年:沒見過一行代碼,卻「發明」了Python!

      0
      分享至


      新智元報道

      編輯:桃子

      【新智元導讀】你敢信?一個活在95年前的AI,竟寫出了Python代碼。GPT之父下場,用2600億Token煉出了一個「老古董」AI。

      一個從未見過電腦的AI,竟寫出了現代編程語言!

      這可不是什么科幻的設定。

      就在今天,GPT之父Alec Radford帶隊發布了震撼全網的「talkie」——

      總參數130億,一個只讀過1931年之前舊文獻的大模型。


      talkie的「世界觀」(全部訓練數據),被凍結在了1930年12月31日。

      那個時代,沒有互聯網,沒有維基百科,更沒有任何現代代碼。

      它讀過的最「新」的東西,是近百年前的專利書、科學期刊、禮儀手冊和私人書信。


      但就是這樣一個「活在95年前」的AI,居然能寫出Python代碼。




      沒學過編程,

      卻寫出了Python,理解了「逆函數」

      talkie最炸裂的發現,藏在一組編程測試里。

      Alec Radford團隊突發奇想,用HumanEval去測試talkie的編程能力——

      給它幾個Python函數作為上下文示例,然后讓它解決新的編程問題。

      要知道,talkie的訓練數據中,沒有任何一行現代代碼。連數字計算機的概念,都不存在于它的「知識體系」中。


      但結果令人震驚,通過少樣本學習,它竟然能寫出正確的Python程序。

      雖然目前只能完成簡單的單行程序,比如兩個數相加,或者對上下文示例做微小修改。


      Alec Radford:GPT、CLIP、Whisper背后核心大佬

      但其中一個案例讓人印象深刻:給定一個旋轉密碼的編碼函數encode_shift,它的邏輯是把每個字母在字母表中向后移動5位。

      talkie自己寫出了對應的解碼函數,整個修改只有一個字符:把+5改成了-5,加號換成了減號。

      它真正理解了「逆函數」:加密是加,解密就是減」這個逆運算的概念。


      傳送門:https://talkie-lm.com/chat

      2600億Token,專喂百年前的紙

      Alec Radford團隊為什么要費這么大勁,手動OCR近百年前的物理文獻,來訓練一個「老古董」?

      因為他們要回答AI領域最核心的一個問題:LLM的能力,到底是推理,還是背誦?

      talkie可以寫出Python,證明了——

      LLM可以用19世紀的知識做推理,并非只是檢索。不得不說,這才是真正意義上的「泛化」!


      再來看talkie的訓練語料庫,可以稱得上是一個龐大的「考古工程」。

      它的訓練語料達到了2600億token,全部來自1931年之前的英語文本,包括書籍、報紙、期刊、科學論文、美國專利、判例法。

      要知道,這么多文本皆需要從實體文檔掃描并OCR轉錄。


      而選擇1930年作為截止日期,原因很實際:這是美國公共版權法(public domain)的分界線。

      不過,這帶來了一個意想不到的瓶頸:數據質量。

      團隊做了一組對照實驗:用傳統OCR系統轉錄的舊文本訓練模型,和用人工轉錄的同一批文本訓練模型相比,前者的學習效率只有后者的30%。

      簡單的正則清洗能把這個數字提升到70%,但仍然有巨大的差距。


      在評估talkie性能實驗中,團隊又打造了一個「現代孿生體」(talkie-web-13b-base)。

      后者用FineWeb的現代網絡數據訓練,兩款模型用了「相同的算力」。

      顯而易見,在核心語言理解、數學推理任務上,talkie的表現與現代孿生體相當。

      但在通用知識評測上,即使剔除了對1930年視角來說「穿越」的題目,talkie仍然落后。


      團隊懷疑,這跟數據質量有很大關系。

      為此,Radford團隊計劃從零開始訓練「復古OCR系統」,專門用于重新轉錄1931年前的文本。

      用最現代的Claude 4.6

      訓練最古老的AI

      talkie的「后訓練」方案也很有意思。

      要把一個只讀過舊書的「基礎模型」變成能對話的聊天機器人,根本沒有現成的指令微調的數據可用。


      團隊的做法是,從1930年之前的結構化參考書中提取指令-回答對:禮儀手冊、書信寫作指南、菜譜、百科全書、詩歌集。

      然后,再用這些「復古教材」做第一輪SFT。

      在接下來的RLAIF階段,團隊用在線DPO來提升talkie的指令遵循能力,Claude Sonnet 4.6作為裁判。

      一個2026年最先進的AI,給一個「活在」1930年的AI打分。

      最終的精調階段,團隊甚至用Claude Opus 4.6生成多輪對話數據,來打磨talkie的對話能力。

      訓練過程中,Claude對talkie指令遵循能力的評分從2.0提升到了3.4(滿分5分)。

      最后一步,用Claude Opus 4.6與talkie進行多輪合成對話,再做一輪拒絕采樣+SFT,打磨對話能力。

      團隊也坦承了一個諷刺之處:用現代大模型訓練一個本該凍結在1930年的模型,本身就是一種「時間污染」。

      他們的長期目標是用復古基座模型自身作為裁判,實現完全「自舉式」的后訓練流水線。

      值得一提的是,talkie的7B版本在RL訓練后出現了一個搞笑的副作用——

      它開始用列表體說話,純屬是被現代AI的「壞習慣」傳染了。

      AI界最干凈的一次「開卷考試」

      研究團隊還做了另一個有趣的實驗。

      他們從《紐約時報》的「歷史上的今天」欄目中提取了近5000條歷史事件描述,計算talkie對每條事件的「驚訝度」。


      結果非常清晰,1930年之前的事件,talkie不太驚訝。1930年之后的事件,驚訝度開始攀升。

      到了1950年代和1960年代達到峰值,然后趨于平穩。

      這條曲線本身就是一個關于預測能力的實驗。隨著模型規模增大,這條曲線會怎么變化?

      谷歌DeepMind CEO Demis Hassabis曾提出一個思想實驗——

      一個只訓練到1911年的模型,能不能像愛因斯坦在1915年那樣獨立發現廣義相對論?

      talkie目前當然做不到。但它提供了一條路徑,往上Scale就行了。

      今夏擴展到GPT-3級別

      talkie目前是130億參數,團隊的路線圖相當激進——

      今年夏天,發布GPT-3級別的復古模型。


      更遠期的目標:將語料擴展到超過一萬億token,理論上足夠訓練一個GPT-3.5級別的模型,能力接近初代ChatGPT。

      一個凍結在1930年的ChatGPT。

      參考資料:

      https://x.com/status_effects/status/2048878495539843211?s=20

      https://talkie-lm.com/introducing-talkie

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      北京首鋼拒絕輸球!全力淘汰廣東宏遠,許利民調整陣容,央視直播

      北京首鋼拒絕輸球!全力淘汰廣東宏遠,許利民調整陣容,央視直播

      體壇瞎白話
      2026-05-08 08:02:05
      里夫斯:裁判沖著我的臉大吼大叫,我覺得這非常不尊重人

      里夫斯:裁判沖著我的臉大吼大叫,我覺得這非常不尊重人

      懂球帝
      2026-05-08 13:43:15
      河南籍演員北京聚餐!一眼望去熟人滿滿,李亞鵬岳云鵬劉震云都在

      河南籍演員北京聚餐!一眼望去熟人滿滿,李亞鵬岳云鵬劉震云都在

      天天熱點見聞
      2026-05-08 04:32:33
      俄羅斯宣布“勝利日”莫斯科等地暫時斷網!近一年來俄固定電話需求飆升

      俄羅斯宣布“勝利日”莫斯科等地暫時斷網!近一年來俄固定電話需求飆升

      紅星新聞
      2026-05-08 12:51:17
      特斯拉宣布大降價,加拿大網民:謝謝中國!

      特斯拉宣布大降價,加拿大網民:謝謝中國!

      環球時報國際
      2026-05-08 00:23:15
      100股今日獲機構買入評級 12股上漲空間超20%

      100股今日獲機構買入評級 12股上漲空間超20%

      證券時報
      2026-05-08 17:52:29
      軍購案三讀通過!今天生日的傅崐萁,才是真正的最大贏家

      軍購案三讀通過!今天生日的傅崐萁,才是真正的最大贏家

      蘭妮搞笑分享
      2026-05-08 15:10:15
      香港2500萬美元(約1.7億元人民幣)拿下世界杯轉播權,此前FIFA給央視開出3億美元天價,是印度的17倍

      香港2500萬美元(約1.7億元人民幣)拿下世界杯轉播權,此前FIFA給央視開出3億美元天價,是印度的17倍

      浙江之聲
      2026-05-08 11:42:15
      打起來了!特朗普不宣而戰,美軍發起斬首行動,伊朗或再次上當

      打起來了!特朗普不宣而戰,美軍發起斬首行動,伊朗或再次上當

      小久解說
      2026-05-08 20:04:41
      釣友在成都一河道發現大量注射器,街道辦:系用于控糖減重的注射器,已打撈,水質檢測無異常

      釣友在成都一河道發現大量注射器,街道辦:系用于控糖減重的注射器,已打撈,水質檢測無異常

      極目新聞
      2026-05-08 15:36:19
      “近11年來最好的拜仁”,終究技不如人

      “近11年來最好的拜仁”,終究技不如人

      足球周刊
      2026-05-08 17:10:49
      每體:社媒平臺清除機器人賬戶,C羅數小時內粉絲減少600萬

      每體:社媒平臺清除機器人賬戶,C羅數小時內粉絲減少600萬

      懂球帝
      2026-05-08 10:15:10
      谷歌重返中國?

      谷歌重返中國?

      新浪財經
      2026-05-06 18:31:15
      中日再突發重大事件,高市尚未登機回國,古賀誠:戰爭正逼近日本

      中日再突發重大事件,高市尚未登機回國,古賀誠:戰爭正逼近日本

      阿離家居
      2026-05-08 20:11:41
      交火數小時,美伊披露戰果

      交火數小時,美伊披露戰果

      魯中晨報
      2026-05-08 09:58:03
      全網吵炸!北京女大學生青海自駕游,幸存女孩一審被判4年,冤嗎

      全網吵炸!北京女大學生青海自駕游,幸存女孩一審被判4年,冤嗎

      一盅情懷
      2026-05-08 09:07:58
      體檢報告中,若3個指標都正常,基本可以排除很多疾病

      體檢報告中,若3個指標都正常,基本可以排除很多疾病

      芹姐說生活
      2026-05-08 19:06:29
      笑死,原來大多數中年人都沒覺得自己已經老了!8090后最先破防了

      笑死,原來大多數中年人都沒覺得自己已經老了!8090后最先破防了

      夜深愛雜談
      2026-05-08 11:19:34
      日本高層訪華無果后,不甘心的高市決定親自訪華,中方態度堅決

      日本高層訪華無果后,不甘心的高市決定親自訪華,中方態度堅決

      瀲滟晴方DAY
      2026-05-08 05:03:41
      使用違禁藥物!中國馬拉松國際健將,遭國際田徑誠信委員會禁賽

      使用違禁藥物!中國馬拉松國際健將,遭國際田徑誠信委員會禁賽

      全景體育V
      2026-05-08 07:05:35
      2026-05-08 21:40:49
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      15162文章數 66850關注度
      往期回顧 全部

      科技要聞

      SK海力士平均獎金600萬 工服成相親神器

      頭條要聞

      "大衣哥"再度翻紅:五一假期3天跑5場 累到"要保命"

      頭條要聞

      "大衣哥"再度翻紅:五一假期3天跑5場 累到"要保命"

      體育要聞

      他把首勝讓給隊友,然后用一年時間還清賬單

      娛樂要聞

      古天樂被曝隱婚生子,新娘竟是她

      財經要聞

      特朗普全球關稅又受阻,也能退款?

      汽車要聞

      MG 4X實車亮相 將于5月11日開啟盲訂

      態度原創

      旅游
      房產
      教育
      家居
      軍事航空

      旅游要聞

      519中國旅游日 | 去追一場星光,愛上一座城!

      房產要聞

      豪擲6.8億拿地!何猷君大手筆投資三亞!

      教育要聞

      關于舉辦“圖畫書里的中國”2026年山東省原創兒童圖畫書素材創意大賽、原創兒童圖畫書講讀大賽的通知

      家居要聞

      流動的尺度 打破家的形式主義

      軍事要聞

      伊朗:最高領袖穆杰塔巴全面掌控局勢

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 99国产欧美另娄久久久精品| 精品久久久久无码| 日本亚洲乱码中文字幕影院| 狠狠综合久久久久综合网浪潮| 人妻无码中文专区久久五月婷| 成人区人妻精品一熟女| 亚洲成a人片77777国产| 国产成人亚洲综合网色欲网| 国产成人一区二区三区视频免费| 亚洲国产成人久久精品软件 | 夜夜嗨久久人成在日日夜夜| 老头同志同性xxxxxxxxx| 亚洲人成在线影院| 加勒比久久综合网天天| 国产国语对白一区二区三区| www中文字幕在线观看| 国产手机在线αⅴ片无码观看| 一本大道香蕉久中文在线播放| AV免费网站| 亚洲色Www永久网站| 久久精品无码免费不卡| 啪啪福利| 中文字幕一二三产区区别| 玩弄放荡人妇系列av在线网站| 国产福利小视频高清在线观看| 18gay| 伊人久久大香线蕉综合色狠狠| 麻豆国产av尤物网站尤物| 午夜福利在线观看6080| 夜夜嗨av一区二区三区四季av| 成人午夜在线播放| av大尺度一区二区三区| 在线观看免费AV网| 亚洲脚交| 日韩无码人妻一区| 日区中文字幕一区二区| 3P免费视频在线观看| 国产AV无码国产AV毛片| 亚洲AV无码成人精品区网页| 亚洲乱熟女| 免费无码av|