<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>

<p id="tp1vn"></p>

<sub id="tp1vn"><p id="tp1vn"></p></sub>

<u id="tp1vn"><rp id="tp1vn"></rp></u>

<meter id="tp1vn"></meter>

<wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>

日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao

<legend id="wbrek"><track id="wbrek"><dfn id="wbrek"></dfn></track></legend>

<sub id="wbrek"></sub>

<thead id="wbrek"></thead>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

GPT之父把AI扔回1930年：沒見過一行代碼，卻「發明」了Python！

2026-04-29 11:33:57　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：桃子

【新智元導讀】你敢信？一個活在95年前的AI，竟寫出了Python代碼。GPT之父下場，用2600億Token煉出了一個「老古董」AI。

一個從未見過電腦的AI，竟寫出了現代編程語言！

這可不是什么科幻的設定。

就在今天，GPT之父Alec Radford帶隊發布了震撼全網的「talkie」——

總參數130億，一個只讀過1931年之前舊文獻的大模型。

talkie的「世界觀」（全部訓練數據），被凍結在了1930年12月31日。

那個時代，沒有互聯網，沒有維基百科，更沒有任何現代代碼。

它讀過的最「新」的東西，是近百年前的專利書、科學期刊、禮儀手冊和私人書信。

但就是這樣一個「活在95年前」的AI，居然能寫出Python代碼。

沒學過編程，

卻寫出了Python，理解了「逆函數」

talkie最炸裂的發現，藏在一組編程測試里。

Alec Radford團隊突發奇想，用HumanEval去測試talkie的編程能力——

給它幾個Python函數作為上下文示例，然后讓它解決新的編程問題。

要知道，talkie的訓練數據中，沒有任何一行現代代碼。連數字計算機的概念，都不存在于它的「知識體系」中。

但結果令人震驚，通過少樣本學習，它竟然能寫出正確的Python程序。

雖然目前只能完成簡單的單行程序，比如兩個數相加，或者對上下文示例做微小修改。

Alec Radford：GPT、CLIP、Whisper背后核心大佬

但其中一個案例讓人印象深刻：給定一個旋轉密碼的編碼函數encode_shift，它的邏輯是把每個字母在字母表中向后移動5位。

talkie自己寫出了對應的解碼函數，整個修改只有一個字符：把+5改成了-5，加號換成了減號。

它真正理解了「逆函數」：加密是加，解密就是減」這個逆運算的概念。

傳送門：https://talkie-lm.com/chat

2600億Token，專喂百年前的紙

Alec Radford團隊為什么要費這么大勁，手動OCR近百年前的物理文獻，來訓練一個「老古董」？

因為他們要回答AI領域最核心的一個問題：LLM的能力，到底是推理，還是背誦？

talkie可以寫出Python，證明了——

LLM可以用19世紀的知識做推理，并非只是檢索。不得不說，這才是真正意義上的「泛化」！

再來看talkie的訓練語料庫，可以稱得上是一個龐大的「考古工程」。

它的訓練語料達到了2600億token，全部來自1931年之前的英語文本，包括書籍、報紙、期刊、科學論文、美國專利、判例法。

要知道，這么多文本皆需要從實體文檔掃描并OCR轉錄。

而選擇1930年作為截止日期，原因很實際：這是美國公共版權法（public domain）的分界線。

不過，這帶來了一個意想不到的瓶頸：數據質量。

團隊做了一組對照實驗：用傳統OCR系統轉錄的舊文本訓練模型，和用人工轉錄的同一批文本訓練模型相比，前者的學習效率只有后者的30%。

簡單的正則清洗能把這個數字提升到70%，但仍然有巨大的差距。

在評估talkie性能實驗中，團隊又打造了一個「現代孿生體」（talkie-web-13b-base）。

后者用FineWeb的現代網絡數據訓練，兩款模型用了「相同的算力」。

顯而易見，在核心語言理解、數學推理任務上，talkie的表現與現代孿生體相當。

但在通用知識評測上，即使剔除了對1930年視角來說「穿越」的題目，talkie仍然落后。

團隊懷疑，這跟數據質量有很大關系。

為此，Radford團隊計劃從零開始訓練「復古OCR系統」，專門用于重新轉錄1931年前的文本。

用最現代的Claude 4.6

訓練最古老的AI

talkie的「后訓練」方案也很有意思。

要把一個只讀過舊書的「基礎模型」變成能對話的聊天機器人，根本沒有現成的指令微調的數據可用。

團隊的做法是，從1930年之前的結構化參考書中提取指令-回答對：禮儀手冊、書信寫作指南、菜譜、百科全書、詩歌集。

然后，再用這些「復古教材」做第一輪SFT。

在接下來的RLAIF階段，團隊用在線DPO來提升talkie的指令遵循能力，Claude Sonnet 4.6作為裁判。

一個2026年最先進的AI，給一個「活在」1930年的AI打分。

最終的精調階段，團隊甚至用Claude Opus 4.6生成多輪對話數據，來打磨talkie的對話能力。

訓練過程中，Claude對talkie指令遵循能力的評分從2.0提升到了3.4（滿分5分）。

最后一步，用Claude Opus 4.6與talkie進行多輪合成對話，再做一輪拒絕采樣+SFT，打磨對話能力。

團隊也坦承了一個諷刺之處：用現代大模型訓練一個本該凍結在1930年的模型，本身就是一種「時間污染」。

他們的長期目標是用復古基座模型自身作為裁判，實現完全「自舉式」的后訓練流水線。

值得一提的是，talkie的7B版本在RL訓練后出現了一個搞笑的副作用——

它開始用列表體說話，純屬是被現代AI的「壞習慣」傳染了。

AI界最干凈的一次「開卷考試」

研究團隊還做了另一個有趣的實驗。

他們從《紐約時報》的「歷史上的今天」欄目中提取了近5000條歷史事件描述，計算talkie對每條事件的「驚訝度」。

結果非常清晰，1930年之前的事件，talkie不太驚訝。1930年之后的事件，驚訝度開始攀升。

到了1950年代和1960年代達到峰值，然后趨于平穩。

這條曲線本身就是一個關于預測能力的實驗。隨著模型規模增大，這條曲線會怎么變化？

谷歌DeepMind CEO Demis Hassabis曾提出一個思想實驗——

一個只訓練到1911年的模型，能不能像愛因斯坦在1915年那樣獨立發現廣義相對論？

talkie目前當然做不到。但它提供了一條路徑，往上Scale就行了。

今夏擴展到GPT-3級別

talkie目前是130億參數，團隊的路線圖相當激進——

今年夏天，發布GPT-3級別的復古模型。

更遠期的目標：將語料擴展到超過一萬億token，理論上足夠訓練一個GPT-3.5級別的模型，能力接近初代ChatGPT。

一個凍結在1930年的ChatGPT。

參考資料：

https://x.com/status_effects/status/2048878495539843211?s=20

https://talkie-lm.com/introducing-talkie

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

殲-35"0001編號"戰機亮相噴涂英文縮寫或量產出口

央視新聞客戶端 2026-05-08 08:00:26
7095 跟貼 7095
圍剿張雪機車？錢江摩托聲明：從未向任何供應鏈企業下達“封殺令”

看看新聞Knews 2026-05-08 11:34:33
5370 跟貼 5370

不問配置不聊價格，浙江一女子開口就要買5臺最新款iPhone，老板不但不賣，反手報了警

環球網資訊 2026-05-08 07:38:20
1401 跟貼 1401

茶顏悅色，裝不下去了

中國新聞周刊 2026-05-07 22:15:57
223 跟貼 223
上海迪士尼能通話錄音游客不能錄，否則無法提供服務！游客：憑什么迪士尼能錄我不能

瀟湘晨報 2026-05-07 16:14:22
632 跟貼 632

配原研藥，不用再跑大醫院了

上觀新聞 2026-05-08 07:36:05
121 跟貼 121

天氣預報｜晴朗天氣將至下周重慶最高34℃

上游新聞 2026-05-08 18:37:06
4 跟貼 4
NBA季后賽｜湖人再度不敵雷霆，賽后全隊找裁判理論

北青網-北京青年報 2026-05-08 15:47:14
136 跟貼 136

“排隊3小時，打卡1分鐘”，多景區迎“潑天流量”

澎湃新聞 2026-05-06 00:04:10
3855 跟貼 3855
俄羅斯宣布“勝利日”莫斯科等地暫時斷網！近一年來俄固定電話需求飆升

紅星新聞 2026-05-08 12:51:17
2036 跟貼 2036
上海官宣：將承辦2028年奧運會資格系列賽

現代快報 2026-05-08 09:21:24
181 跟貼 181
30條中日航線，4月取消全部航班

都市快報橙柿互動 2026-05-08 13:42:34
399 跟貼 399
1.47萬人圍觀、溢價率近920%！鐘薛高508件無形資產以2110萬元成交

紅星資本局 2026-05-08 17:42:08
67 跟貼 67
收評：滬指收綠深成指跌0.5% 創業板指跌0.96%

財聯社 2026-05-08 15:08:48
115 跟貼 115
南京、東營晉級：人均GDP超20萬元的城市增至11個

澎湃新聞 2026-05-08 10:54:27
66 跟貼 66
國乒男團再次對陣韓國隊沖擊四強今日賽程公布

大風新聞 2026-05-08 08:17:04
81 跟貼 81
工信部批復6G技術試驗頻率

新京報 2026-05-08 08:48:06
394 跟貼 394
新華鮮報｜3.25億人次出游 “五一”假期樂享文旅新風

新華社 2026-05-07 19:20:15
58 跟貼 58
高速上的貨車司機怎么也沒想到會和B767飛機發生事故

中國民航人 2026-05-08 21:17:19
0 跟貼 0
漢坦病毒陽性乘客登上郵輪的前一天，中國乘客陳勇下船離開：已向防疫部門報備并在家自我隔離

極目新聞 2026-05-08 19:09:52
0 跟貼 0
四川成都一房屋著火，還有人將貓從高空拋下？物業：房屋已經被封，消防和警察已介入

臺州交通廣播 2026-05-08 21:17:07
0 跟貼 0
“我媽有兩個‘老公’”，OPPO就母親節文案致歉：創作初衷，是希望打破刻板印象，呈現更多元、更立體的當代母親形象，已下架相關物料

揚子晚報 2026-05-08 17:38:48
0 跟貼 0
外賣員借滅火器救火反被收50元社區：已退還

看看新聞Knews 2026-05-08 21:16:02
0 跟貼 0

北京首鋼拒絕輸球！全力淘汰廣東宏遠，許利民調整陣容，央視直播

北京首鋼拒絕輸球！全力淘汰廣東宏遠，許利民調整陣容，央視直播

體壇瞎白話

2026-05-08 08:02:05

里夫斯：裁判沖著我的臉大吼大叫，我覺得這非常不尊重人

里夫斯：裁判沖著我的臉大吼大叫，我覺得這非常不尊重人

懂球帝

2026-05-08 13:43:15

河南籍演員北京聚餐！一眼望去熟人滿滿，李亞鵬岳云鵬劉震云都在

河南籍演員北京聚餐！一眼望去熟人滿滿，李亞鵬岳云鵬劉震云都在

天天熱點見聞

2026-05-08 04:32:33

俄羅斯宣布“勝利日”莫斯科等地暫時斷網！近一年來俄固定電話需求飆升

俄羅斯宣布“勝利日”莫斯科等地暫時斷網！近一年來俄固定電話需求飆升

紅星新聞

2026-05-08 12:51:17

特斯拉宣布大降價，加拿大網民：謝謝中國！

特斯拉宣布大降價，加拿大網民：謝謝中國！

環球時報國際

2026-05-08 00:23:15

100股今日獲機構買入評級 12股上漲空間超20%

100股今日獲機構買入評級 12股上漲空間超20%

證券時報

2026-05-08 17:52:29

軍購案三讀通過！今天生日的傅崐萁，才是真正的最大贏家

軍購案三讀通過！今天生日的傅崐萁，才是真正的最大贏家

蘭妮搞笑分享

2026-05-08 15:10:15

香港2500萬美元（約1.7億元人民幣）拿下世界杯轉播權，此前FIFA給央視開出3億美元天價，是印度的17倍

香港2500萬美元（約1.7億元人民幣）拿下世界杯轉播權，此前FIFA給央視開出3億美元天價，是印度的17倍

浙江之聲

2026-05-08 11:42:15

打起來了！特朗普不宣而戰，美軍發起斬首行動，伊朗或再次上當

打起來了！特朗普不宣而戰，美軍發起斬首行動，伊朗或再次上當

小久解說

2026-05-08 20:04:41

釣友在成都一河道發現大量注射器，街道辦：系用于控糖減重的注射器，已打撈，水質檢測無異常

釣友在成都一河道發現大量注射器，街道辦：系用于控糖減重的注射器，已打撈，水質檢測無異常

極目新聞

2026-05-08 15:36:19

“近11年來最好的拜仁”，終究技不如人

“近11年來最好的拜仁”，終究技不如人

足球周刊

2026-05-08 17:10:49

每體：社媒平臺清除機器人賬戶，C羅數小時內粉絲減少600萬

每體：社媒平臺清除機器人賬戶，C羅數小時內粉絲減少600萬

懂球帝

2026-05-08 10:15:10

谷歌重返中國？

新浪財經

2026-05-06 18:31:15

中日再突發重大事件，高市尚未登機回國，古賀誠：戰爭正逼近日本

中日再突發重大事件，高市尚未登機回國，古賀誠：戰爭正逼近日本

阿離家居

2026-05-08 20:11:41

交火數小時，美伊披露戰果

魯中晨報

2026-05-08 09:58:03

全網吵炸！北京女大學生青海自駕游，幸存女孩一審被判4年，冤嗎

全網吵炸！北京女大學生青海自駕游，幸存女孩一審被判4年，冤嗎

一盅情懷

2026-05-08 09:07:58

體檢報告中，若3個指標都正常，基本可以排除很多疾病

體檢報告中，若3個指標都正常，基本可以排除很多疾病

芹姐說生活

2026-05-08 19:06:29

笑死,原來大多數中年人都沒覺得自己已經老了！8090后最先破防了

笑死,原來大多數中年人都沒覺得自己已經老了！8090后最先破防了

夜深愛雜談

2026-05-08 11:19:34

日本高層訪華無果后，不甘心的高市決定親自訪華，中方態度堅決

日本高層訪華無果后，不甘心的高市決定親自訪華，中方態度堅決

瀲滟晴方DAY

2026-05-08 05:03:41

使用違禁藥物！中國馬拉松國際健將，遭國際田徑誠信委員會禁賽

使用違禁藥物！中國馬拉松國際健將，遭國際田徑誠信委員會禁賽

全景體育V

2026-05-08 07:05:35

AI產業主平臺領航智能+時代

15162文章數 66850關注度

往期回顧全部

科技要聞

SK海力士平均獎金600萬工服成相親神器

頭條要聞

"大衣哥"再度翻紅：五一假期3天跑5場累到"要保命"

頭條要聞

"大衣哥"再度翻紅：五一假期3天跑5場累到"要保命"

體育要聞

他把首勝讓給隊友，然后用一年時間還清賬單

娛樂要聞

古天樂被曝隱婚生子，新娘竟是她

財經要聞

特朗普全球關稅又受阻，也能退款？

汽車要聞

MG 4X實車亮相將于5月11日開啟盲訂

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

房產

教育

家居

軍事航空

旅游要聞

519中國旅游日 | 去追一場星光，愛上一座城！

房產要聞

豪擲6.8億拿地！何猷君大手筆投資三亞！

教育要聞

關于舉辦“圖畫書里的中國”2026年山東省原創兒童圖畫書素材創意大賽、原創兒童圖畫書講讀大賽的通知

家居要聞

流動的尺度打破家的形式主義

破繭成蝶土味精裝房爆改
大膽前衛時尚大宅
靈動實用生活藝術場

軍事要聞

伊朗：最高領袖穆杰塔巴全面掌控局勢

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板： 99国产欧美另娄久久久精品| 精品久久久久无码| 日本亚洲乱码中文字幕影院| 狠狠综合久久久久综合网浪潮| 人妻无码中文专区久久五月婷| 成人区人妻精品一熟女| 亚洲成a人片77777国产| 国产成人亚洲综合网色欲网| 国产成人一区二区三区视频免费| 亚洲国产成人久久精品软件 | 夜夜嗨久久人成在日日夜夜| 老头同志同性xxxxxxxxx| 亚洲人成在线影院| 加勒比久久综合网天天| 国产国语对白一区二区三区| www中文字幕在线观看| 国产手机在线αⅴ片无码观看| 一本大道香蕉久中文在线播放| AV免费网站| 亚洲色Www永久网站| 久久精品无码免费不卡| 啪啪福利| 中文字幕一二三产区区别| 玩弄放荡人妇系列av在线网站| 国产福利小视频高清在线观看| 18gay| 伊人久久大香线蕉综合色狠狠| 麻豆国产av尤物网站尤物| 午夜福利在线观看6080| 夜夜嗨av一区二区三区四季av| 成人午夜在线播放| av大尺度一区二区三区| 在线观看免费AV网| 亚洲脚交| 日韩无码人妻一区| 日区中文字幕一区二区| 3P免费视频在线观看| 国产AV无码国产AV毛片| 亚洲AV无码成人精品区网页| 亚洲乱熟女| 免费无码av|

<u id="m3dh8"></u>

<ruby id="m3dh8"></ruby>

<abbr id="m3dh8"><rp id="m3dh8"></rp></abbr>