<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      頂級AI撞上低級烏龍:連寫幾十頁推導,結果發現題干錯了?

      0
      分享至

        新智元報道

        編輯:傾傾

        【新智元導讀】Google DeepMind再次血洗數學圈!700個地獄級難題被丟進Gemini的熔爐,結果讓數學家集體破防:這哪是證明,這分明是「邏輯拆遷」。DeepMind這一波不僅貼臉爆殺了OpenAI,還砸爛了人類所有的優越感。

        幾百美金的懸賞,跨越半個世紀的死局。

        20世紀最偉大的「題目魔術師」保羅·埃爾德什(PaulErd?s)生前留下了幾百個懸賞令,金額從50刀漲到5000刀。

        50年里,無數數學天才熬禿了頭,也沒能拿走一分錢。

        結果,Google DeepMind帶著名為Aletheia(真理女神)的怪獸進場了。

        上線僅7天,13道難題應聲而碎。

        

        論文鏈接:https://arxiv.org/abs/2601.22401

        但最扎心的真相是:AI并不是比你更聰明,它只是比你更懂「洗稿」。

        13/700的真相:AI真的在加速科學嗎?

        「AI攻克百年數學難題」看起來很像爽文標題,聽聽就行,別被帶了節奏。

        數學這行只看硬指標。DeepMind這次祭出的Aletheia,底色根本不是什么「天才數學家」,而是一個冷酷的「頂級邏輯洗煤廠」

        這套邏輯極其殘酷,帶著一股子硅谷大廠KPI導向的血腥味:

        

        初始的流量層里,裝著700個埃爾德什猜想。

        隨后,Gemini開啟Deep Think模式,像不要錢一樣大規模灌入算力,得出200個候選方案。

        然后,這200個候選人經過自然語言驗證器,剔除邏輯不通的部分,最后只剩下63個。

        最后,經過專家級別的數學推演,得到13個真正具有數學原創意義的答案。

        

        成功證明問題:Erd?s problem#1051

        700個問題里只解答出13個,轉化率還不到2%。

        其中,最具代表性的是對「Erd?s-1051」猜想中關于無理數分布的證明。

        聽著很牛X,但DeepMind自己也承認,剩下的68.5%都是學術垃圾。

        

        有些AI給出的證明過程長達幾百頁,讀起來像是東拼西湊的論文。

        在整個過程中,Aletheia像一個「自動審稿員」。Gemini負責狂暴輸出,而驗證器負責冷酷拒絕。

        

        Gemini DeepThink處理數學猜想具體過程:https://www.youtube.com/watch?v=Nmv4YxpbhU8

        更諷刺的是,人類數學家復核后發現,這13個所謂的「突破」,很大一部分屬于數學界的「低垂果實」——太繁瑣所以沒人想做。

        一位參與評審的組合數學專家曾私下感嘆:

        AI目前的強項不是創造,而是清掃。

        只要算力管夠,這種靠暴力邏輯搜集、整理、強行出結果的路徑,AI基本無敵。

        潛意識剽竊:AI數學家的「洗稿」藝術

        在這次DeepMind的成果展示中,出現了一個讓學術界集體炸鍋的新名詞:潛意識剽竊。

        簡單說,就是AI利用自己幾乎無限的硬盤,從某個犄角旮旯翻出一篇冷門論文,然后用現代的邏輯語言把它重新包裝了一遍。

        最典型的翻車現場是關于Erd?s-1089猜想的證明。

        

        當時Aletheia給出了一個極其精妙的推導,精妙到連幾個頂尖數學家都差點想給它頒獎。

        但隨后,有人在數據庫的深層挖掘中發現,這個所謂的「原創靈感」,與1981年一篇東歐冷門數學期刊上的論文高度重合。

        這就是AI作為一個「黑盒」最讓人絕望的本能。

        對AI來說,它并沒有原創和抄襲的概念。它只是在概率的指引下,把權重最高的Token組合在一起。

        AI記住了所有你忘了的東西。當它從千億級參數中提取出那個冷門關聯時,它自己都不知道是在致敬還是在白嫖。

        

        GoogleDeepMind-Aletheia項目詳情,在此頁面可以找到更多具體輸出案例:https://github.com/google-deepmind/superhuman

        只要喂的數據夠多,AI就能通過變換符號系統、調整推導步長,把一篇舊論文洗得像剛出爐的SCI。

        菲爾茲獎得主陶哲軒一語道破:

        AI并不是在做數學,它是在對人類過往的智慧進行大規模的歸納整合。

        細思極恐。如果連數學這種硬核真理領域,AI都能靠「洗稿」蒙混過關,那我們寫的行業報告、架構方案、市場分析,在它眼里算什么?

        大師也翻車:被詛咒的Erd?s-75號

        接下來這個「Erd?s-75號靈異事件」,暴露出AI的智商硬傷。

        

        這道題在數學圈臭名昭著,因為它被「詛咒」了。

        1995年,埃爾德什在寫下這個猜想時,犯了一個低級邏輯錯誤,這道題題干就是錯的,是個偽命題。

        魔幻的一幕發生了:Aletheia接手后,不僅沒發現題目有問題,反而憑借其狂暴的算力和自我博弈機制,硬生生地輸出了一份長達幾十頁、邏輯閉環的「完美證明」。

        這種「邏輯狂奔」暴露了當前AI的致命缺陷:

        首先,AI缺乏審美與常識。它只會在符號框架內找最優解,卻根本分不清這個框架本身是不是一張廢紙。

        

        其次,獎勵函數具有盲目性。AI的目標是讓驗證器閉嘴。只要推導過程符合規則,結論哪怕再荒謬,它也敢一路狂飆到底。

        最后發現Bug的,還得是那幫數學家。他們翻出1995年的手稿,一行行對完后得出結論:「這題出錯了,AI證的是個寂寞。」

        而這一點,恰恰是我們和AI競爭時的最后防線。AI能在幾毫秒內跑完幾千公里的邏輯馬拉松,但它不知道終點線是不是畫在懸崖外面。

        DeepMind貼臉開大:OpenAI的「數學公關戰」破產題

        前陣子,OpenAI靠著o1在數學AIME考試里刷屏,宣稱AI已經有了類似人類的「慢思考」能力。

        但在DeepMind看來,那頂多算是一場極其成功的文獻開盒。

        為了打臉OpenAI,Google專門在Aletheia的輸出分類里設立了一個很損的標簽:「已知文獻關聯」。

        它明擺著在諷刺OpenAI:你以為你解決了問題,其實你只是從訓練集里翻出了標準答案。

        而DeepMind表示,我不僅能證出來,我還能告訴你哪些是人類證過的、哪些是我洗稿洗出來的、哪些才是真正的原創。

        這場「數學公關戰」撕開了大廠競爭的遮羞布。

        OpenAI的數學能力很大程度上依賴于「題海戰術」,一旦遇到訓練集之外的真命題就容易抓瞎。

        而DeepMind走的是「AlphaGo路線」——自我博弈+形式化驗證(Lean),寧可轉化率只有2%,也要確保這13個成果是硬通貨。

        

        DeepMind官方技術文檔:Aletheia用于數學的自我對弈與形式化證明

        數學界的「掃地僧」陶哲軒一直關注著這場博弈。

        他在自己的他在博客里含蓄地表示:相比于追求「看起來正確」的概率模型,他更看好那種能生成「可由計算機驗證證明」的系統。

        這等于是給DeepMind站了臺。

        瓶頸位移:從「解題機器」到「審美法官」

        折騰了半天,這場13/700的戰役到底告訴了我們什么?

        是——數學發現的瓶頸,正在從「解題能力」位移到「價值判定」。

        這種范式轉移,預示了未來所有硬核從業者的兩種求生路徑:

        一種是從「操作員」變成「審美法官」。

        既然AI能以極低成本生成海量邏輯證明,人類的價值就不再是去復核每一個符號,而是運用直覺和審美,去判斷哪個方向才有真正的科學突破。

        另一種形態是邏輯審計員。

        面對潛意識剽竊和大師Bug,人類需要利用對歷史的精通,去甄別AI到底是真天才,還是個洗稿高手。

        AI能在幾毫秒內重走完人類幾千年的邏輯之路,但它依然讀不懂人類在深夜推演失敗時,那份撕掉草稿紙的無奈。

        邏輯可以代工,但靈魂和審美,AI暫時還沒學會怎么洗。

        參考資料:

        https://x.com/quocleix/status/2018402933193539735?s=20

        https://arxiv.org/abs/2601.22401

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      7800億軍購強行過關:AIT聯手民進黨演雙簧?藍白淪為背鍋俠

      7800億軍購強行過關:AIT聯手民進黨演雙簧?藍白淪為背鍋俠

      荷蘭豆愛健康
      2026-05-08 19:51:36
      知情人士稱江蘇鹽城一醫生與同事聚餐酒后墜入河溝溺亡,醫院工作人員證實:有醫生溺亡一事

      知情人士稱江蘇鹽城一醫生與同事聚餐酒后墜入河溝溺亡,醫院工作人員證實:有醫生溺亡一事

      都市快報橙柿互動
      2026-05-08 17:46:37
      新加坡現2名漢坦病毒密接者:已入境近1周、強制隔離30天...

      新加坡現2名漢坦病毒密接者:已入境近1周、強制隔離30天...

      新加坡萬事通
      2026-05-07 19:45:45
      45歲才明白:微信上基本不發朋友圈的,十有八九是這兩種人

      45歲才明白:微信上基本不發朋友圈的,十有八九是這兩種人

      心理觀察局
      2026-05-08 09:43:07
      世界杯門票太貴,特朗普驚了:即使是我也不會花1000美元看比賽!央視拒絕花天價買轉播權,底氣何在?“國際足聯可能已經慌了”上熱搜

      世界杯門票太貴,特朗普驚了:即使是我也不會花1000美元看比賽!央視拒絕花天價買轉播權,底氣何在?“國際足聯可能已經慌了”上熱搜

      每日經濟新聞
      2026-05-08 14:58:09
      黃子佼獲緩刑4年,無需入獄服刑,他偷笑著走出法庭

      黃子佼獲緩刑4年,無需入獄服刑,他偷笑著走出法庭

      素素娛樂
      2026-05-08 09:01:53
      老人再婚后第一次圓房有何感想?67歲老人傾訴:她給了我很多驚喜

      老人再婚后第一次圓房有何感想?67歲老人傾訴:她給了我很多驚喜

      熱心柚子姐姐
      2026-05-07 16:28:09
      深圳網約車真實一天!早6充電干到到晚9,一天流水太現實!

      深圳網約車真實一天!早6充電干到到晚9,一天流水太現實!

      三農老歷
      2026-05-08 14:47:16
      巡撫好比省委書記,但不管從哪個方面比較,前者的權力都遠超后者

      巡撫好比省委書記,但不管從哪個方面比較,前者的權力都遠超后者

      鶴羽說個事
      2026-05-06 22:59:42
      福建一區民政局原局長、四級調研員涉嫌嚴重違紀違法被調查

      福建一區民政局原局長、四級調研員涉嫌嚴重違紀違法被調查

      大閩門戶
      2026-05-08 19:21:54
      吳宜澤奪冠爆火,因籍貫問題引兩省網友爭論,姐姐給出了準確回應

      吳宜澤奪冠爆火,因籍貫問題引兩省網友爭論,姐姐給出了準確回應

      胡一舸南游y
      2026-05-07 20:39:43
      這就是赤裸裸的現實!中國郵政退休工資,才是真正的普通人天花板

      這就是赤裸裸的現實!中國郵政退休工資,才是真正的普通人天花板

      椰青美食分享
      2026-05-08 14:05:19
      巴媒:費利佩合同年底到期,成都蓉城已開啟續約談判

      巴媒:費利佩合同年底到期,成都蓉城已開啟續約談判

      懂球帝
      2026-05-08 15:25:12
      交火數小時,美伊披露戰果

      交火數小時,美伊披露戰果

      魯中晨報
      2026-05-08 09:58:03
      沈眉莊為什么拍完《甄嬛傳》后,仍是18線演員,鄭曉龍評:自己作

      沈眉莊為什么拍完《甄嬛傳》后,仍是18線演員,鄭曉龍評:自己作

      美芽
      2026-05-07 12:12:22
      八路軍最強的師,擁有30個師的兵力,八年抗戰下來殲滅日偽軍42萬

      八路軍最強的師,擁有30個師的兵力,八年抗戰下來殲滅日偽軍42萬

      凡人侃史
      2026-05-07 22:41:20
      浙江油價定了:5月8日24時起,92號汽油每升8.68元,95號汽油每升9.23元,0號柴油每升8.39元

      浙江油價定了:5月8日24時起,92號汽油每升8.68元,95號汽油每升9.23元,0號柴油每升8.39元

      臺州交通廣播
      2026-05-08 16:54:11
      美媒曝KD與申京存裂痕!名嘴暗示將貨架 模擬一套三方涉及7人交易

      美媒曝KD與申京存裂痕!名嘴暗示將貨架 模擬一套三方涉及7人交易

      顏小白的籃球夢
      2026-05-08 09:35:35
      皇馬內訌大地震!巴爾韋德遭隊友重擊腦損傷,阿韋洛亞更衣室失控

      皇馬內訌大地震!巴爾韋德遭隊友重擊腦損傷,阿韋洛亞更衣室失控

      星耀國際足壇
      2026-05-08 21:46:46
      中國球迷險無法看國足踢世界杯!央視極限壓價:2億買兩屆轉播權

      中國球迷險無法看國足踢世界杯!央視極限壓價:2億買兩屆轉播權

      念洲
      2026-05-07 16:31:49
      2026-05-08 22:48:49
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      15162文章數 66850關注度
      往期回顧 全部

      科技要聞

      SK海力士平均獎金600萬 工服成相親神器

      頭條要聞

      "4只皮皮蝦1035元"消費者再次發聲 否認"想吃白食"

      頭條要聞

      "4只皮皮蝦1035元"消費者再次發聲 否認"想吃白食"

      體育要聞

      他把首勝讓給隊友,然后用一年時間還清賬單

      娛樂要聞

      古天樂被曝隱婚生子,新娘竟是她

      財經要聞

      估值3000億 DeepSeek尋求500億元融資

      汽車要聞

      MG 4X實車亮相 將于5月11日開啟盲訂

      態度原創

      親子
      藝術
      游戲
      教育
      時尚

      親子要聞

      男人帶娃,為什么如此輕松?網友: 放下你的控制欲你也能輕松

      藝術要聞

      探索施密德的油畫,感受無法抵擋的藝術魅力!

      曝PS大量經典IP有機會復活!索尼已啟動老游戲計劃

      教育要聞

      快接住今天高考的專屬好運!祝考生金榜題名

      衣服其實沒有必要買很貴,準備這三件基礎款,百搭實用又不挑人

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品一区欧美日韩制服| 人妻?制服?丝袜| 国产ssss在线观看极品| 国产精品久久久久久人妻精品| 成人区精品一区二区婷婷| 国产成人+综合亚洲+天堂| 久久无码无码久久综合综合| 久久久无码精品国产一区| 一本到无码av专区无码不卡| 中文字幕无码色综合网| 国产福利精品导航网址| 日本国产高清色www视频在线| 国产老熟女伦老熟妇露脸| 日韩精品欧美国产在线| 两性午夜刺激性视频| 日韩精品有码中文字幕| 精品va在线观看| 国产日韩一区二区三区| 黄网站色成年片在线观看| 亚洲精品国产av成人网| 在线精品熟女AV播放| 丁香五月综合网| 国产亚洲欧美精品永久| 日本一区二区中文字幕久久| 在线视频?制服?中文| 亚洲h视频| 靖宇县| 成人免费AA片在线观看| 97香蕉久久国产超碰青草专区| 精品免费看国产一区二区 | 国产精品99久久久久久噜噜| 91啪啪视频| 国产精品国产免费无码专区不卡| 久久亚洲精品中文字幕无男同| 亚洲欧美综合一区二区三区| 日韩不卡一区二区三区| 欧美熟妇xxxxx欧美老妇不卡| 国产精品小粉嫩在线观看| 久久久久久AV| 亚洲狠狠操| 日本乱码一区二区三区|