<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      GPT-5.5參數有10T?病毒式論文剛剛被打假,實際縮水至1.5T

      0
      分享至


      新智元報道

      編輯:Aeneas KingHZ

      【新智元導讀】五一假期前,AI社區被一篇「GPT-5.5擁有近10萬億參數」的論文刷屏,今天這項研究就被研究者打假了!研究者表示,修正論文中的各種問題后,GPT-5.5的參數很可能約為1.5T。

      2026年4月底,AI界被一篇名為《不可壓縮知識探針》(Incompressible Knowledge Probes,簡稱 IKP)的論文震動了。


      論文地址:https://www.alphaxiv.org/abs/2604.24827

      Pine AI的首席科學家Bojie Li發表了一項研究,聲稱通過一種全新的「黑盒探測法」,推算出了那些閉源模型的真實體量。

      • GPT-5.5:9.7萬億(9.7T)參數

      • Claude Opus 4.7:4.0萬億(4.0T)參數

      • o1:3.5萬億(3.5T)參數

      這個數據瞬間引爆了社交媒體。

      要知道,如果GPT-5.5真的達到了10T規模,那意味著它比傳聞中的GPT-4(約1.8T)大了5倍有余。

      一時間,這個參數瞬間傳遍全網。


      然而,僅僅幾天后,反轉就來了。

      邏輯的漏洞:從10T到1.5T的縮水內幕

      最近,來自UC伯克利CHAI實驗室的Lawrence Chan和UK AISI的研究員Ben Sturgeon對這篇論文進行了深挖。


      他們發現,這篇聲稱「逆推大模型規模」的爆火論文,竟然存在嚴重的邏輯與代碼偏差。


      修復這些問題后,GPT-5.5的參數約為1.5T(90% 置信區間:256B-8.3T)。


      被修飾的擬合曲線

      在原始論文中,作者聲稱沒有對模型的得分進行「保底處理」(flooring)。但在復現代碼時,研究者發現作者在計算小模型得分時,偷偷地將負分歸零了。

      科普:當模型遇到不知道的冷知識時,如果亂猜(幻覺),得分會是負數。

      如果把這個「歸零」操作去掉,小模型的得分會大幅下降。這意味著原本陡峭的「得分-參數」擬合曲線會變得平緩。修正后,估算的GPT-5.5規模直接從9.7T暴跌至1.5T



      「人工智障」出題:25%的題目本身就有錯

      研究者發現,這套用來測試模型的「冷知識題庫」質量同樣堪憂。

      • 歧義性:約25%的專家知識題存在歧義(例如重名研究員)。

      • 事實錯誤:部分標準答案本身就是錯的。

      最戲劇性的是,原作者Bojie Li后來坦言:這篇研究是他在AI智能體的輔助下,僅用4天時間完成的早期探索。

      這種「AI寫論文研究AI」的模式,被Lawrence Chan戲稱為「充滿槽點的Vibe-coding」。



      核心理論依然堅挺

      知識「不可壓縮」

      用嚴謹的話說,論文的核心思想——IKP 得分與對數參數數量之間的線性關系——仍然成立,但參數數量的估計卻不成立。


      解決這兩個問題后,基于IKP的前沿模型估計的參數數量通常會下降,置信區間會擴大:

      GPT 5.5:9.7T -> 1.5T

      Claude Opus 4.7:4.0T -> 1.1T

      DeepSeek R1(實際大小671B):424 B -> 760 B


      難得的是,論文中的三種說法,承受住了各種測試,被證明依然是正確的。

      比如,IKP分數和模型的參數呈對數線性關系。


      總之,論文提出的核心模型依然得到了學界的認可:不可壓縮知識探針(IKP)。

      這個理論認為,大模型的能力可以分為兩部分。

      1. 程序性能力(邏輯、推理、代碼):這是可以壓縮的。隨著架構優化,更小的模型可以擁有更強的推理能力。

      2. 事實性知識(某人的出生日期、冷門研究領域):這是不可壓縮的。

      你可以把模型想象成一個硬盤,存一個事實就需要占幾個比特位。

      因此,測試模型到底知道多少「不可壓縮」的冷知識,確實是目前探測閉源模型參數最科學的「測力計」。

      誰才是真正的「知識之王」?

      而且,盡管參數規模下調了,但各家模型的「有效容量」排名依然極具參考價值。

      梯隊格局

      • 第一梯隊(巔峰王者):GPT-5.5。雖然可能只有1.5T左右,但它在T6級別的超冷門知識表現上依然冠絕群雄。

      • 第二梯隊(貼身肉搏):Claude Opus 4.7、o1、Grok-4。這幾款模型的有效容量高度接近,競爭進入白熱化。

      • MoE(混合專家模型)的秘密:研究發現,MoE模型的知識量取決于其總參數,而非每次運行時的「激活參數」。這意味著,如果你想讓模型博學,堆參數依然是唯一的硬道理。

      「思考模式」的玄學

      測試顯示,開啟「思維鏈」(Thinking Mode)并不能顯著增加模型的知識量。這再次印證了:思考能提高邏輯,但不能憑空變出你沒讀過的書。

      最后,Lawrence Chan吐槽說:這項工作果然是AI智能體在四天內完成的,因為網站和代碼庫到處都體現著vibe coding的粗糙風格。


      GPT-5.5參數有9.7T?

      4月30日,Pine AI的首席科學家李博杰的這篇論文引發了熱議。


      核心觀點是:事實性容量與模型規模呈對數線性關系。

      論文展示了 7 個知識層級,其中T7對所有模型來說幾乎都是0%左右,這表明預訓練仍有巨大的提升空間。


      Gemini 3.1 Pro很可能超過 10T,因為它被用作錨點,但論文中沒有對其直接估算。

      這意味著,我們可以在一定程度上推斷不同模型的訓練成本,以及它們的后訓練效果——即在給定規模下,在某些非事實性任務上的表現。

      在原作中,李博杰構建了一個包含1400個事實性問題的數據集,并將準確率與參數數量進行擬合。

      通過反轉擬合,從閉源模型的數據集得分,研究人員推斷出其參數數量。


      特別要注意最后一行的90%預測區間「Predicition interval, PI」非常大。

      此前,就有網友注意到這些「規模只是推測,不應當作事實」。


      現在許多人,想知道估算對方法論有多敏感——


      李博杰直言,「同一個評估任務,結果橫跨60倍區間 → 任何單一的點估計都不誠實。」


      不過,IKP本是一個起點,而非終點。

      作者坦誠自己匆忙上傳了一篇未成熟的arXiv論文,只是為了把這個想法放出來。

      論文、代碼、數據集和網站都是在 4 天內完成的,主要借助 Claude Code,發布前未經同行審閱。采用下限處理和 λ=?1,是為了在開放權重模型上最大化R2。

      我們期待未來的工作能將它做得更好!

      Scaling Law失效了嗎?

      這次「參數神話」的破滅,給行業敲響了警鐘:盲目崇拜大數字的時代正在過去。

      GPT-5.5從10T降到1.5T,并不意味著它變弱了,而是意味著OpenAI可能在數據質量和參數效率上做了更驚人的優化。

      正如Lawrence Chan在總結中所說:「GPT-5.5到底有多少參數?我們依然不確定。但這種通過探測知識容量來反推規模的方法,為我們揭開黑盒模型的面紗提供了一條新路徑。」

      在通往AGI的路上,我們需要的或許不再是更大的硬盤,而是更聰明的索引方式。

      參考資料:

      https://x.com/deedydas/status/2049523583517634862

      https://x.com/justanotherlaw/status/2050399317782155726

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      任敏連搭“頂流”6連撲:被強捧的“小花”們,會成為資本棄兒嗎

      任敏連搭“頂流”6連撲:被強捧的“小花”們,會成為資本棄兒嗎

      扒點半吃瓜
      2026-05-08 07:00:12
      吳晨已任中國醫學科學院北京協和醫學院副院校長

      吳晨已任中國醫學科學院北京協和醫學院副院校長

      澎湃新聞
      2026-05-08 16:02:26
      除了一款紅米,國產手機全軍覆沒,沒人能上全球暢銷Top10

      除了一款紅米,國產手機全軍覆沒,沒人能上全球暢銷Top10

      科技專家
      2026-05-07 15:05:58
      快訊!哈薩克斯坦害怕了!

      快訊!哈薩克斯坦害怕了!

      達文西看世界
      2026-05-08 08:59:39
      五個水兵死在英格蘭,清廷花15英鎊買地下葬,這塊地如今還屬中國

      五個水兵死在英格蘭,清廷花15英鎊買地下葬,這塊地如今還屬中國

      飯小妹說歷史
      2026-05-07 08:56:08
      終于后知后覺了?美媒:中國正全國動員,殲36殲50生產超美國兩倍

      終于后知后覺了?美媒:中國正全國動員,殲36殲50生產超美國兩倍

      Ck的蜜糖
      2026-05-08 20:16:48
      楊瀚森要換教練了?斯普利特基本無緣留任 利拉德已推薦新帥人選

      楊瀚森要換教練了?斯普利特基本無緣留任 利拉德已推薦新帥人選

      羅說NBA
      2026-05-08 06:22:16
      離譜!國際奧委會先斬后奏,官宣上海成為 2028 奧運賽事舉辦城市

      離譜!國際奧委會先斬后奏,官宣上海成為 2028 奧運賽事舉辦城市

      南宗歷史
      2026-05-08 19:38:26
      114國拒絕簽字!魯比奧警告中國,中美爆發爭端,特朗普該死心了

      114國拒絕簽字!魯比奧警告中國,中美爆發爭端,特朗普該死心了

      小祁談歷史
      2026-05-08 16:34:32
      4-0橫掃!埃梅里神了:率隊成功翻盤,挺進決賽,目標直指冠軍

      4-0橫掃!埃梅里神了:率隊成功翻盤,挺進決賽,目標直指冠軍

      足球狗說
      2026-05-08 04:57:35
      交火數小時,美伊披露戰果

      交火數小時,美伊披露戰果

      魯中晨報
      2026-05-08 09:58:03
      Kylie Jenner和男友甜茶超美新圖

      Kylie Jenner和男友甜茶超美新圖

      陳意小可愛
      2026-05-08 14:13:31
      澳大利亞華人家庭慘案:“尖子生”長子殺害父母和弟弟 警方:現場毛骨悚然,非常恐怖

      澳大利亞華人家庭慘案:“尖子生”長子殺害父母和弟弟 警方:現場毛骨悚然,非常恐怖

      紅星新聞
      2026-05-08 11:39:24
      取消提前1年落戶限制!南京鼓樓區2026年小學、初中招生入學工作實施辦法

      取消提前1年落戶限制!南京鼓樓區2026年小學、初中招生入學工作實施辦法

      南京擇校
      2026-05-08 18:00:09
      四川16歲女孩懸崖秋千墜亡事件,最致命的真相被所有人忽略了!

      四川16歲女孩懸崖秋千墜亡事件,最致命的真相被所有人忽略了!

      脆皮先生
      2026-05-07 19:41:52
      網傳高校一線教師不合格率高達22%,而行政人員全員合格!

      網傳高校一線教師不合格率高達22%,而行政人員全員合格!

      趣筆談
      2026-05-08 10:56:55
      恩里克:當年我拿到第一份球員薪水后,把錢給了還房貸的父母

      恩里克:當年我拿到第一份球員薪水后,把錢給了還房貸的父母

      懂球帝
      2026-05-08 09:54:18
      國乒女團晉級四強,但仍有3大難題急待解決,馬琳早就把話說透

      國乒女團晉級四強,但仍有3大難題急待解決,馬琳早就把話說透

      八斗小先生
      2026-05-08 14:23:41
      醫生提醒:立夏后這 4 種菜別再買了!第一種很多家庭餐桌上常有

      醫生提醒:立夏后這 4 種菜別再買了!第一種很多家庭餐桌上常有

      橘子約定
      2026-05-08 21:19:37
      珠海居民在小區散步時被掉落的大王椰樹葉片砸中背部!十級傷殘…

      珠海居民在小區散步時被掉落的大王椰樹葉片砸中背部!十級傷殘…

      廣東活動
      2026-05-08 07:08:14
      2026-05-08 22:15:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      15162文章數 66850關注度
      往期回顧 全部

      科技要聞

      SK海力士平均獎金600萬 工服成相親神器

      頭條要聞

      "大衣哥"再度翻紅:五一假期3天跑5場 累到"要保命"

      頭條要聞

      "大衣哥"再度翻紅:五一假期3天跑5場 累到"要保命"

      體育要聞

      他把首勝讓給隊友,然后用一年時間還清賬單

      娛樂要聞

      古天樂被曝隱婚生子,新娘竟是她

      財經要聞

      特朗普全球關稅又受阻,也能退款?

      汽車要聞

      MG 4X實車亮相 將于5月11日開啟盲訂

      態度原創

      手機
      藝術
      家居
      房產
      軍事航空

      手機要聞

      大疆Osmo Pocket 4P開啟預約

      藝術要聞

      探索施密德的油畫,感受無法抵擋的藝術魅力!

      家居要聞

      流動的尺度 打破家的形式主義

      房產要聞

      豪擲6.8億拿地!何猷君大手筆投資三亞!

      軍事要聞

      伊朗:最高領袖穆杰塔巴全面掌控局勢

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日本黄h兄妹h动漫一区二区三区| 国产精品一区二区韩国AV| 国产专区国产av| 91视频在线视频| 天堂最新在线官网av| 99热这里有免费国产精品| 金寨县| 国产福利一区视频| 国产又粗又硬又大爽黄老大爷视频 | 久久国产avjust麻豆| 墨竹工卡县| 97无码免费人妻超级碰碰碰| 日韩免费美熟女中文av| 亚洲色图另类| 色噜噜狠狠一区二区三区果冻| 国产内射爽爽大片| 久久久国产精品人人片| 国产明星裸体无码xxxx视频| 精品欧美久久99久久久另类专区| 无码国产伦一区二区三区视频| 黑人变态另类videos| 亚洲日韩国产中文其他| 少妇天堂网络| 久久亚洲av一二三区| 亚洲精品综合第一国产综合| 久久青青草原亚洲AV无码麻豆 | 精品制服丝袜亚洲专区| 国产麻豆一精品一av一免费| 久草热久草热线频97精品| 久久亚洲人成网站| 国产成人午夜福利院| av二区在线| 中文字幕av久久爽Av| 欧美黑人又粗又硬xxxxx喷水| 久久久久亚洲AV无码专区网站| 人妻无码中文字幕永久在线| 午夜无码区在线观看亚洲| 国产不卡精品视频男人的天堂| 亚洲我射av| 一本一道人人妻人人妻αV| 中文字幕人妻中出|