<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>

<p id="tp1vn"></p>

<sub id="tp1vn"><p id="tp1vn"></p></sub>

<u id="tp1vn"><rp id="tp1vn"></rp></u>

<meter id="tp1vn"></meter>

<wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>

日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao

<em id="7zsfw"></em>

<cite id="7zsfw"></cite>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

GPT-5.5參數有10T？病毒式論文剛剛被打假，實際縮水至1.5T

2026-05-03 17:12:10　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：Aeneas KingHZ

【新智元導讀】五一假期前，AI社區被一篇「GPT-5.5擁有近10萬億參數」的論文刷屏，今天這項研究就被研究者打假了！研究者表示，修正論文中的各種問題后，GPT-5.5的參數很可能約為1.5T。

2026年4月底，AI界被一篇名為《不可壓縮知識探針》（Incompressible Knowledge Probes，簡稱 IKP）的論文震動了。

論文地址：https://www.alphaxiv.org/abs/2604.24827

Pine AI的首席科學家Bojie Li發表了一項研究，聲稱通過一種全新的「黑盒探測法」，推算出了那些閉源模型的真實體量。

GPT-5.5：9.7萬億（9.7T）參數
Claude Opus 4.7：4.0萬億（4.0T）參數
o1：3.5萬億（3.5T）參數

這個數據瞬間引爆了社交媒體。

要知道，如果GPT-5.5真的達到了10T規模，那意味著它比傳聞中的GPT-4（約1.8T）大了5倍有余。

一時間，這個參數瞬間傳遍全網。

然而，僅僅幾天后，反轉就來了。

邏輯的漏洞：從10T到1.5T的縮水內幕

最近，來自UC伯克利CHAI實驗室的Lawrence Chan和UK AISI的研究員Ben Sturgeon對這篇論文進行了深挖。

他們發現，這篇聲稱「逆推大模型規模」的爆火論文，竟然存在嚴重的邏輯與代碼偏差。

修復這些問題后，GPT-5.5的參數約為1.5T（90% 置信區間：256B-8.3T）。

被修飾的擬合曲線

在原始論文中，作者聲稱沒有對模型的得分進行「保底處理」（flooring）。但在復現代碼時，研究者發現作者在計算小模型得分時，偷偷地將負分歸零了。

科普：當模型遇到不知道的冷知識時，如果亂猜（幻覺），得分會是負數。

如果把這個「歸零」操作去掉，小模型的得分會大幅下降。這意味著原本陡峭的「得分-參數」擬合曲線會變得平緩。修正后，估算的GPT-5.5規模直接從9.7T暴跌至1.5T。

「人工智障」出題：25%的題目本身就有錯

研究者發現，這套用來測試模型的「冷知識題庫」質量同樣堪憂。

歧義性：約25%的專家知識題存在歧義（例如重名研究員）。
事實錯誤：部分標準答案本身就是錯的。

最戲劇性的是，原作者Bojie Li后來坦言：這篇研究是他在AI智能體的輔助下，僅用4天時間完成的早期探索。

這種「AI寫論文研究AI」的模式，被Lawrence Chan戲稱為「充滿槽點的Vibe-coding」。

核心理論依然堅挺

知識「不可壓縮」

用嚴謹的話說，論文的核心思想——IKP 得分與對數參數數量之間的線性關系——仍然成立，但參數數量的估計卻不成立。

解決這兩個問題后，基于IKP的前沿模型估計的參數數量通常會下降，置信區間會擴大：

GPT 5.5：9.7T -> 1.5T

Claude Opus 4.7：4.0T -> 1.1T

DeepSeek R1（實際大小671B）：424 B -> 760 B

難得的是，論文中的三種說法，承受住了各種測試，被證明依然是正確的。

比如，IKP分數和模型的參數呈對數線性關系。

總之，論文提出的核心模型依然得到了學界的認可：不可壓縮知識探針（IKP）。

這個理論認為，大模型的能力可以分為兩部分。

程序性能力（邏輯、推理、代碼）：這是可以壓縮的。隨著架構優化，更小的模型可以擁有更強的推理能力。
事實性知識（某人的出生日期、冷門研究領域）：這是不可壓縮的。

你可以把模型想象成一個硬盤，存一個事實就需要占幾個比特位。

因此，測試模型到底知道多少「不可壓縮」的冷知識，確實是目前探測閉源模型參數最科學的「測力計」。

誰才是真正的「知識之王」？

而且，盡管參數規模下調了，但各家模型的「有效容量」排名依然極具參考價值。

梯隊格局

第一梯隊（巔峰王者）：GPT-5.5。雖然可能只有1.5T左右，但它在T6級別的超冷門知識表現上依然冠絕群雄。
第二梯隊（貼身肉搏）：Claude Opus 4.7、o1、Grok-4。這幾款模型的有效容量高度接近，競爭進入白熱化。
MoE（混合專家模型）的秘密：研究發現，MoE模型的知識量取決于其總參數，而非每次運行時的「激活參數」。這意味著，如果你想讓模型博學，堆參數依然是唯一的硬道理。

「思考模式」的玄學

測試顯示，開啟「思維鏈」（Thinking Mode）并不能顯著增加模型的知識量。這再次印證了：思考能提高邏輯，但不能憑空變出你沒讀過的書。

最后，Lawrence Chan吐槽說：這項工作果然是AI智能體在四天內完成的，因為網站和代碼庫到處都體現著vibe coding的粗糙風格。

GPT-5.5參數有9.7T？

4月30日，Pine AI的首席科學家李博杰的這篇論文引發了熱議。

核心觀點是：事實性容量與模型規模呈對數線性關系。

論文展示了 7 個知識層級，其中T7對所有模型來說幾乎都是0%左右，這表明預訓練仍有巨大的提升空間。

Gemini 3.1 Pro很可能超過 10T，因為它被用作錨點，但論文中沒有對其直接估算。

這意味著，我們可以在一定程度上推斷不同模型的訓練成本，以及它們的后訓練效果——即在給定規模下，在某些非事實性任務上的表現。

在原作中，李博杰構建了一個包含1400個事實性問題的數據集，并將準確率與參數數量進行擬合。

通過反轉擬合，從閉源模型的數據集得分，研究人員推斷出其參數數量。

特別要注意最后一行的90%預測區間「Predicition interval, PI」非常大。

此前，就有網友注意到這些「規模只是推測，不應當作事實」。

現在許多人，想知道估算對方法論有多敏感——

李博杰直言，「同一個評估任務，結果橫跨60倍區間 → 任何單一的點估計都不誠實。」

不過，IKP本是一個起點，而非終點。

作者坦誠自己匆忙上傳了一篇未成熟的arXiv論文，只是為了把這個想法放出來。

論文、代碼、數據集和網站都是在 4 天內完成的，主要借助 Claude Code，發布前未經同行審閱。采用下限處理和 λ=?1，是為了在開放權重模型上最大化R2。

我們期待未來的工作能將它做得更好！

Scaling Law失效了嗎？

這次「參數神話」的破滅，給行業敲響了警鐘：盲目崇拜大數字的時代正在過去。

GPT-5.5從10T降到1.5T，并不意味著它變弱了，而是意味著OpenAI可能在數據質量和參數效率上做了更驚人的優化。

正如Lawrence Chan在總結中所說：「GPT-5.5到底有多少參數？我們依然不確定。但這種通過探測知識容量來反推規模的方法，為我們揭開黑盒模型的面紗提供了一條新路徑。」

在通往AGI的路上，我們需要的或許不再是更大的硬盤，而是更聰明的索引方式。

參考資料：

https://x.com/deedydas/status/2049523583517634862

https://x.com/justanotherlaw/status/2050399317782155726

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Anthropic出手！AI的內心獨白，曝光了

量子位 2026-05-08 14:32:06
0 跟貼 0
告別冗長思維鏈！Laser用「概率疊加」重塑多模態大模型隱式推理

機器之心Pro 2026-05-08 14:18:56
0 跟貼 0

不用再學AI了！生成結果包穩的Agent來了

機器之心Pro 2026-05-08 15:03:15
0 跟貼 0

AI像電影人一樣「看」視頻，8B小模型反超GPT-5與Gemini-3.1-Pro

機器之心Pro 2026-05-08 15:53:06
0 跟貼 0
Anthropic最危險路線圖曝光: 無限記憶、多智能體! AI終局戰僅剩雙雄決頂

新智元 2026-05-08 15:10:12
22 跟貼 22

OpenAI的瘋狂五一：與馬斯克法庭翻舊賬、算力燒錢500億美元、GPT-5.5免費用

鈦媒體APP 2026-05-06 15:21:08
4 跟貼 4

AlphaEvolve交出一周年炸裂成績單！AI自我改進不再科幻

新智元 2026-05-08 20:27:15
1 跟貼 1
獨家對話靈御智能：百萬小時真機數據，喂出具身智能的“云端大腦”

鈦媒體APP 2026-05-08 20:33:07
0 跟貼 0

00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
每經科技CEO韓利：企業一定要在AI時代搶占大模型入口重塑品牌價值

每日經濟新聞 2026-05-08 21:05:06
0 跟貼 0
字節海外競對：停更一年半躺賺50萬，逆襲估值5億美元

虎嗅APP 2026-05-08 20:50:42
0 跟貼 0
秋冬交替流感病毒高發爆發期，朋友們要照顧好孩子

水云人 2026-05-07 23:31:02
0 跟貼 0
英偉達巧用8B模型秒掉GPT-5 開源了

量子位 2025-12-06 14:07:18
97 跟貼 97
生成式推理再排序，可能會是LLM4RecSys的新突破口嗎？

機器之心Pro 2026-04-08 11:52:53
0 跟貼 0
Excel公式寫到崩潰？這個隱藏函數讓你一次定義，全局復用

閃存獵手 2026-05-08 19:53:26
0 跟貼 0
頂級神箭手僅憑祖傳絕技曲線射箭，竟一人干掉整支弓獵手大隊

不哈電影 2026-05-04 15:43:09
15 跟貼 15
深觀察｜國際醫學界：漢坦病毒感染不會引發全球大流行

國際在線 2026-05-08 08:05:17
1 跟貼 1
暴發致命病毒郵輪或出現人傳人現象，致命病毒5天奪命，太可怕了

河洛有話說 2026-05-07 14:49:53
8 跟貼 8
熱浪寒潮成催化劑，氣候變化正重塑傳染病風險？

上游新聞 2026-05-08 20:32:11
0 跟貼 0
世衛組織證實荷航空乘人員漢坦病毒檢測為陰性

界面新聞 2026-05-08 16:27:53
0 跟貼 0
從參數到外觀：汽車行業的最后一場競爭

基地邊緣BaseEdge 2026-05-08 17:48:10
0 跟貼 0
殲-35"0001編號"戰機亮相噴涂英文縮寫或量產出口

央視新聞客戶端 2026-05-08 08:00:26
7625 跟貼 7625
三角洲部隊內部組織架構！

浩然簡史 2026-05-04 19:53:21
0 跟貼 0
關于中東地區架構與權力的轉變，賴岳謙與三妹的觀察點，值得參考

伢伢gagako 2026-05-08 00:39:06
0 跟貼 0
圍剿張雪機車？錢江摩托聲明：從未向任何供應鏈企業下達“封殺令”

看看新聞Knews 2026-05-08 11:34:33
5427 跟貼 5427
AdaGen: 讓圖像生成模型學會自適應策略

機器之心Pro 2026-04-13 15:47:03
0 跟貼 0
世界上有什么絕對不會造假的東西？

果殼 2026-05-08 20:40:56
0 跟貼 0
不問配置不聊價格，浙江一女子開口就要買5臺最新款iPhone，老板不但不賣，反手報了警

環球網資訊 2026-05-08 07:38:20
1420 跟貼 1420
續航710km電動車參數亮眼，開完一周才想起充電

你笑的好甜美 2026-05-06 04:46:52
1 跟貼 1
“排隊3小時，打卡1分鐘”，多景區迎“潑天流量”

澎湃新聞 2026-05-06 00:04:10
3850 跟貼 3850
上海迪士尼能通話錄音游客不能錄，否則無法提供服務！游客：憑什么迪士尼能錄我不能

瀟湘晨報 2026-05-07 16:14:22
632 跟貼 632
茶顏悅色，裝不下去了

中國新聞周刊 2026-05-07 22:15:57
297 跟貼 297
商湯最強Lite模型來了，Token消耗直降60%，限時免費調用

智東西 2026-05-08 21:25:23
0 跟貼 0
900V架構二排座椅旋轉全車舒適平權煥新極氪009搶先體驗

潮畔汽車 2026-05-08 10:00:00
0 跟貼 0
15%全量Attention！「RTPurbo」阿里Qwen3長文本推理5倍壓縮方案

機器之心Pro 2025-12-23 12:52:34
0 跟貼 0
清華打破多模態音頻生成通才困境：Omni2Sound 音頻基礎模型開源

機器之心Pro 2026-05-08 19:32:14
0 跟貼 0
廣西北海：全鏈重拳守凈土靶向發力筑屏障

人民資訊 2026-05-08 19:29:16
0 跟貼 0
俄羅斯宣布“勝利日”莫斯科等地暫時斷網！近一年來俄固定電話需求飆升

紅星新聞 2026-05-08 12:51:17
1660 跟貼 1660
一半模型巧解小學幾何

天天數理學習分享 2026-05-08 16:04:22
1 跟貼 1
2026世界旅游小姐冠軍驚艷亮相，完美曲線驚艷全場！

挖掘笑點坊 2026-05-07 10:25:16
1 跟貼 1

任敏連搭“頂流”6連撲：被強捧的“小花”們，會成為資本棄兒嗎

任敏連搭“頂流”6連撲：被強捧的“小花”們，會成為資本棄兒嗎

扒點半吃瓜

2026-05-08 07:00:12

吳晨已任中國醫學科學院北京協和醫學院副院校長

吳晨已任中國醫學科學院北京協和醫學院副院校長

澎湃新聞

2026-05-08 16:02:26

除了一款紅米，國產手機全軍覆沒，沒人能上全球暢銷Top10

除了一款紅米，國產手機全軍覆沒，沒人能上全球暢銷Top10

科技專家

2026-05-07 15:05:58

快訊！哈薩克斯坦害怕了！

達文西看世界

2026-05-08 08:59:39

五個水兵死在英格蘭，清廷花15英鎊買地下葬，這塊地如今還屬中國

五個水兵死在英格蘭，清廷花15英鎊買地下葬，這塊地如今還屬中國

飯小妹說歷史

2026-05-07 08:56:08

終于后知后覺了？美媒：中國正全國動員，殲36殲50生產超美國兩倍

終于后知后覺了？美媒：中國正全國動員，殲36殲50生產超美國兩倍

Ck的蜜糖

2026-05-08 20:16:48

楊瀚森要換教練了？斯普利特基本無緣留任利拉德已推薦新帥人選

楊瀚森要換教練了？斯普利特基本無緣留任利拉德已推薦新帥人選

羅說NBA

2026-05-08 06:22:16

離譜！國際奧委會先斬后奏，官宣上海成為 2028 奧運賽事舉辦城市

離譜！國際奧委會先斬后奏，官宣上海成為 2028 奧運賽事舉辦城市

南宗歷史

2026-05-08 19:38:26

114國拒絕簽字！魯比奧警告中國，中美爆發爭端，特朗普該死心了

114國拒絕簽字！魯比奧警告中國，中美爆發爭端，特朗普該死心了

小祁談歷史

2026-05-08 16:34:32

4-0橫掃！埃梅里神了：率隊成功翻盤，挺進決賽，目標直指冠軍

4-0橫掃！埃梅里神了：率隊成功翻盤，挺進決賽，目標直指冠軍

足球狗說

2026-05-08 04:57:35

交火數小時，美伊披露戰果

魯中晨報

2026-05-08 09:58:03

Kylie Jenner和男友甜茶超美新圖

Kylie Jenner和男友甜茶超美新圖

陳意小可愛

2026-05-08 14:13:31

澳大利亞華人家庭慘案：“尖子生”長子殺害父母和弟弟警方：現場毛骨悚然，非常恐怖

澳大利亞華人家庭慘案：“尖子生”長子殺害父母和弟弟警方：現場毛骨悚然，非常恐怖

紅星新聞

2026-05-08 11:39:24

取消提前1年落戶限制！南京鼓樓區2026年小學、初中招生入學工作實施辦法

取消提前1年落戶限制！南京鼓樓區2026年小學、初中招生入學工作實施辦法

南京擇校

2026-05-08 18:00:09

四川16歲女孩懸崖秋千墜亡事件，最致命的真相被所有人忽略了！

四川16歲女孩懸崖秋千墜亡事件，最致命的真相被所有人忽略了！

脆皮先生

2026-05-07 19:41:52

網傳高校一線教師不合格率高達22%，而行政人員全員合格！

網傳高校一線教師不合格率高達22%，而行政人員全員合格！

趣筆談

2026-05-08 10:56:55

恩里克：當年我拿到第一份球員薪水后，把錢給了還房貸的父母

恩里克：當年我拿到第一份球員薪水后，把錢給了還房貸的父母

懂球帝

2026-05-08 09:54:18

國乒女團晉級四強，但仍有3大難題急待解決，馬琳早就把話說透

國乒女團晉級四強，但仍有3大難題急待解決，馬琳早就把話說透

八斗小先生

2026-05-08 14:23:41

醫生提醒：立夏后這 4 種菜別再買了！第一種很多家庭餐桌上常有

醫生提醒：立夏后這 4 種菜別再買了！第一種很多家庭餐桌上常有

橘子約定

2026-05-08 21:19:37

珠海居民在小區散步時被掉落的大王椰樹葉片砸中背部！十級傷殘…

珠海居民在小區散步時被掉落的大王椰樹葉片砸中背部！十級傷殘…

廣東活動

2026-05-08 07:08:14

AI產業主平臺領航智能+時代

15162文章數 66850關注度

往期回顧全部

科技要聞

SK海力士平均獎金600萬工服成相親神器

頭條要聞

"大衣哥"再度翻紅：五一假期3天跑5場累到"要保命"

頭條要聞

"大衣哥"再度翻紅：五一假期3天跑5場累到"要保命"

體育要聞

他把首勝讓給隊友，然后用一年時間還清賬單

娛樂要聞

古天樂被曝隱婚生子，新娘竟是她

財經要聞

特朗普全球關稅又受阻，也能退款？

汽車要聞

MG 4X實車亮相將于5月11日開啟盲訂

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機

藝術

家居

房產

軍事航空

手機要聞

大疆Osmo Pocket 4P開啟預約

藝術要聞

探索施密德的油畫，感受無法抵擋的藝術魅力！

家居要聞

流動的尺度打破家的形式主義

破繭成蝶土味精裝房爆改
大膽前衛時尚大宅
靈動實用生活藝術場

房產要聞

豪擲6.8億拿地！何猷君大手筆投資三亞！

軍事要聞

伊朗：最高領袖穆杰塔巴全面掌控局勢

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：日本黄h兄妹h动漫一区二区三区| 国产精品一区二区韩国AV| 国产专区国产av| 91视频在线视频| 天堂最新在线官网av| 99热这里有免费国产精品| 金寨县| 国产福利一区视频| 国产又粗又硬又大爽黄老大爷视频 | 久久国产avjust麻豆| 墨竹工卡县| 97无码免费人妻超级碰碰碰| 日韩免费美熟女中文av| 亚洲色图另类| 色噜噜狠狠一区二区三区果冻| 国产内射爽爽大片| 久久久国产精品人人片| 国产明星裸体无码xxxx视频| 精品欧美久久99久久久另类专区| 无码国产伦一区二区三区视频| 黑人变态另类videos| 亚洲日韩国产中文其他| 少妇天堂网络| 久久亚洲av一二三区| 亚洲精品综合第一国产综合| 久久青青草原亚洲AV无码麻豆 | 精品制服丝袜亚洲专区| 国产麻豆一精品一av一免费| 久草热久草热线频97精品| 久久亚洲人成网站| 国产成人午夜福利院| av二区在线| 中文字幕av久久爽Av| 欧美黑人又粗又硬xxxxx喷水| 久久久久亚洲AV无码专区网站| 人妻无码中文字幕永久在线| 午夜无码区在线观看亚洲| 国产不卡精品视频男人的天堂| 亚洲我射av| 一本一道人人妻人人妻αV| 中文字幕人妻中出|

^{<blockquote id="igspi"></blockquote>}

<thead id="igspi"><i id="igspi"><noscript id="igspi"></noscript></i></thead>

<blockquote id="igspi"><i id="igspi"><noscript id="igspi"></noscript></i></blockquote>

^{<sub id="igspi"></sub>}