<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      人類56年解不出,谷歌AI一夜連破9道世紀難題!

      0
      分享至


      新智元報道


      【新智元導讀】DeepMind發(fā)布全新數(shù)學智能體AlphaProof Nexus,9道Erd?s開放難題一次性告破,最老的懸了56年!全部證明都已經(jīng)過Lean編譯器形式化驗證,沒有幻覺。網(wǎng)友驚呼:數(shù)學奇點的火花點燃了。

      數(shù)學界這個月,徹底瘋了。

      前腳OpenAI剛把Erd?s 80年猜想推翻,數(shù)學家們的驚呼聲還沒落地。

      緊接著,Google DeepMind發(fā)布了一個全新AI數(shù)學智能體——AlphaProof Nexus


      論文地址:https://arxiv.org/abs/2605.22763v1

      它一出手,就干掉了9道懸而未決幾十年的Erd?s開放問題。其中最古老的那個,懸了整整56年

      而且,每道題花費的算力成本,只有幾百美元。

      更關(guān)鍵的是,這次的證明不可能有錯

      每一步推理都經(jīng)過Lean編譯器的形式化驗證,不存在幻覺空間。編譯器通過,證明就是對的。


      值得一提的是,AlphaProof Nexus和2024年拿下IMO銀牌的初代AlphaProof完全不同。

      初代只有強化學習樹搜索,Nexus把大語言模型、AlphaProof和進化算法三合一,直接瞄準了人類數(shù)學家啃不動的研究級難題。

      AlphaProof Nexus

      進化算法+LLM+Lean編譯器

      這套系統(tǒng)的架構(gòu)分為四個層級,從簡單到復雜。

      1. Agent A(基礎(chǔ)版)

      多個獨立的證明子智能體并行工作,每個子智能體與Gemini 3.1 Pro進行多輪對話,通過搜索替換工具修改Lean代碼,編譯器實時反饋錯誤信息,子智能體根據(jù)反饋迭代修正。

      2. Agent B

      在A的基礎(chǔ)上加入了AlphaProof作為工具。當子智能體在某個子目標上卡住時,可以調(diào)用AlphaProof進行強化學習驅(qū)動的樹搜索,嘗試攻克局部難點。

      3. Agent C

      引入進化算法。多個子智能體不再獨立工作,而是共享一個「種群數(shù)據(jù)庫」。每個證明草稿會被LLM評審員打分(用Elo評分系統(tǒng)),高分草稿被優(yōu)先采樣、變異、進化。

      4. Agent D(完整版)

      集大成者。進化算法 + AlphaProof + Gemini 3.1 Pro協(xié)同作戰(zhàn)。這是DeepMind用來大規(guī)模掃蕩Erd?s問題的主力武器。


      整個工作流的核心循環(huán)非常清晰——

      AI提出證明草稿 → Lean編譯器驗證 → 失敗則反饋錯誤信息 → AI修正 → 再驗證 → 循環(huán)往復,直到證明完全通過或耗盡算力預算。

      Erd?s #125為例,它的解題過程是這樣的。

      首先,子智能體先用思維鏈推理分析問題結(jié)構(gòu),然后通過搜索替換修改Lean代碼,接著調(diào)用AlphaProof處理子目標。


      AlphaProof搞定了6個子目標中的3個,子智能體隨即將剩余的「硬骨頭」分解為更小的引理,再次調(diào)用AlphaProof——這次,全部搞定。

      整個過程中,沒有任何人類數(shù)學家介入。

      9道Erd?s問題

      56年前的懸案一朝告破

      DeepMind將完整版Agent D投放到353道已形式化的Erd?s問題上。每道題最多允許3000輪迭代。

      最終,9道問題被攻克。


      其中含金量最高的幾道:

      1. Erd?s #12(1970年提出)

      是否存在一個無限集A,滿足「任意三個不同元素a


      這道題懸置了56年,期間多位數(shù)學家取得了部分進展,但始終無法給出完整構(gòu)造。

      AI的解法精妙地結(jié)合了中國剩余定理和三項等差數(shù)列回避集,通過構(gòu)建一系列精心設(shè)計的「區(qū)塊」來同時滿足密度條件和整除約束。

      2. Erd?s #125(1996年提出)

      在三進制下只用數(shù)字0和1的整數(shù)集A,加上四進制下只用數(shù)字0和1的整數(shù)集B,它們的和集A+B的下密度是否為正?


      AI證明了答案是否定的——下密度為零。

      證明的核心是一個歸納稀疏化論證,巧妙利用了3^m和4^k的丟番圖逼近性質(zhì)(log4/log3是無理數(shù)),通過反復找到兩個基數(shù)幾乎對齊的尺度,讓密度以0.99的比率逐步衰減到零。

      3. Erd?s #138(1981年提出的變體)

      van der Waerden數(shù)W(k+1) - W(k)是否趨于無窮?

      AI給出了一個極其優(yōu)雅的證明:W(k+1) ≥ W(k) + k。核心思路是貪心染色擴展——在一個沒有單色k-AP的2-著色基礎(chǔ)上,逐個添加新元素,用反證法說明貪心策略不會失敗。

      4. Erd?s #846

      這是一個關(guān)于平面點集中共線性質(zhì)的問題。


      而AI的構(gòu)造,令人嘆為觀止。

      它把完全圖K∞的每條邊映射到平面上的一個點,用二次多項式編碼坐標,然后利用無窮Ramsey定理完成證明。

      目前,所有9道問題的Lean證明代碼已開源在GitHub上。


      項目地址:https://github.com/google-deepmind/alphaproof-nexus-results

      簡單Agent也能解全部9題?!

      最出人意料的結(jié)論,不是完整版Agent D有多強,而是——

      最簡單的Agent A,也能解決全部9道問題。

      Agent A沒有進化算法,沒有AlphaProof,只有多個獨立的LLM子智能體和Lean編譯器的反饋循環(huán)。

      根據(jù)DeepMind團隊的對比分析,它在大多數(shù)問題上,Agent A和Agent B(加了AlphaProof的版本)的表現(xiàn)在誤差范圍內(nèi)幾乎相同。

      相比之下,Agent D的優(yōu)勢主要體現(xiàn)在最困難的問題上(比如#125和#138),能以2到5倍的成本優(yōu)勢完成證明。


      對此,DeepMind將基礎(chǔ)Agent的成功歸因于兩個因素:LLM自身能力的飆升,以及編譯器反饋在錨定LLM推理方面的強大作用。

      也就是說,隨著基礎(chǔ)模型越來越強,復雜的系統(tǒng)工程可能逐漸讓位于簡單的智能體循環(huán)。

      今天需要進化算法和AlphaProof協(xié)同作戰(zhàn)才能高效解決的問題,明天可能一個樸素的LLM+編譯器循環(huán)就夠了。


      具體到成本,最便宜的一道題(#741(ii))中位成本僅5-7美元,最貴的(#152)也不過200-400美元。

      但前提是用對了模型——單獨運行AlphaProof或使用較小模型(Gemini 3.0 Flash等),9道題一道都解不出來。


      代數(shù)幾何15年懸案、凸優(yōu)化新界一并搞定

      除了Erd?s問題,AlphaProof Nexus還在多個數(shù)學分支中取得了實質(zhì)性突破:

      OEIS猜想系統(tǒng)自動形式化了492個開放猜想,證明了其中44個。為防止形式化錯誤,系統(tǒng)要求先證明「測試引理」——驗證序列前幾項與形式化定義一致——才能嘗試目標猜想。

      代數(shù)幾何解決了一個懸置約15年的開放問題——證明了余維數(shù)3、類型2的純O-序列的對數(shù)凹性。這個問題此前被認為是該領(lǐng)域最后一個主要未解情況。

      凸優(yōu)化解決了一個關(guān)于錨定梯度下降-上升算法(Anchored GDA)精確收斂速率的開放問題。更妙的是,AI不僅驗證了一個固定算法,還在證明過程中自主搜索并發(fā)現(xiàn)了一個新的學習率調(diào)度參數(shù),從而實現(xiàn)了更強的保證。

      圖論證明了Graffiti系統(tǒng)在1996年提出的一個關(guān)于生成樹葉子數(shù)與局部獨立集的猜想,形成了一個有趣的閉環(huán)——AI證明了另一個AI提出的猜想。

      加法組合學幫助解決了Ben Green著名開放問題列表中的第57題。

      量子光學與Mario Krenn合作,解決了多個關(guān)于單色量子圖的猜想,對應高維GHZ量子態(tài)的構(gòu)造。


      三路合圍,數(shù)學前沿全面失守

      2026年5月,AI在數(shù)學領(lǐng)域的造詣,幾乎同時達到了研究級水平。

      OpenAI走的是自然語言路線。

      通用推理模型直接輸出證明,推翻了Erd?s 80年單位距離猜想。證明極其精妙,但驗證它需要人類頂級專家逐行審查。

      菲爾茲獎得主Gowers把未解問題扔給GPT-5.5 Pro,兩小時拿到博士論文級成果,全程數(shù)學貢獻為零。

      DeepMind走的是形式化驗證路線。

      AlphaProof Nexus讓AI用Lean語言寫證明代碼,編譯器自動檢查每一步推理。任何一步出現(xiàn)邏輯斷裂,編譯器直接報錯,證明被拒絕。

      自然語言路線靈活,但可能有幻覺。形式化路線可靠,但目前局限于Lean數(shù)學庫成熟的領(lǐng)域。

      而DeepMind的數(shù)學家合作者發(fā)現(xiàn)了一個意料之外的收獲——

      即使智能體無法證明目標定理,它生成的證明嘗試也加深了他們對問題的理解。因為草稿是形式化的,專家可以直接聚焦于未解決的子目標,而不需要重新驗證整個論證鏈。

      換句話說,AI不只是在解題,它正在改變數(shù)學家思考問題的方式。

      如今,未來的圖景已經(jīng)浮現(xiàn):

      AI先用自然語言探索證明思路,再用形式化系統(tǒng)逐步固化和驗證。

      人類數(shù)學家的角色,則從「親手推導」轉(zhuǎn)向「提出問題、審查方向、提煉洞見」。

      有人說,我們正目睹數(shù)學奇點的早期火花。


      幾百美元算力,幾十小時運行,56年懸案告破,編譯器給出鐵證。

      保羅·埃爾德什生前留下了1217道數(shù)學難題,懸賞后人求解。

      他大概從未想過,有一天來領(lǐng)賞的,不是人類。

      參考資料:

      https://x.com/prz_chojecki/status/2058435083741061359?s=20

      https://arxiv.org/abs/2605.22763v1

      編輯:摩西

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      還記得8年前誣告朱軍“性騷擾”的弦子嗎?近況曝光,全網(wǎng)叫好

      還記得8年前誣告朱軍“性騷擾”的弦子嗎?近況曝光,全網(wǎng)叫好

      叨嘮
      2026-05-27 21:09:09
      萬萬沒想到,我國在喜馬拉雅山脈南側(cè)還有4座城市,直抵印度腹地

      萬萬沒想到,我國在喜馬拉雅山脈南側(cè)還有4座城市,直抵印度腹地

      抽象派大師
      2026-05-27 00:12:32
      《阿嬤》票房破10億只是開始,吳京、沈騰、謝霆鋒要掀起新高潮了

      《阿嬤》票房破10億只是開始,吳京、沈騰、謝霆鋒要掀起新高潮了

      皮皮電影
      2026-05-27 14:00:19
      “寧愿死也不會向中國低頭”——最硬氣的鈴木,如今怎么樣了?

      “寧愿死也不會向中國低頭”——最硬氣的鈴木,如今怎么樣了?

      時評人李文君
      2026-05-07 19:57:28
      CBA總決賽才打1場就開始慶祝?上海小將提前開香檳:或激怒廣廈?

      CBA總決賽才打1場就開始慶祝?上海小將提前開香檳:或激怒廣廈?

      籃球快餐車
      2026-05-27 20:09:19
      90后寶媽生下“果凍寶寶”,寶爸臉色煞白不敢抱,醫(yī)生:恭喜你

      90后寶媽生下“果凍寶寶”,寶爸臉色煞白不敢抱,醫(yī)生:恭喜你

      大果小果媽媽
      2026-05-26 13:27:56
      中東,突傳大消息!美伊談判,最新動向!伊朗發(fā)聲,黃金、白銀跳水!原油暴跌!

      中東,突傳大消息!美伊談判,最新動向!伊朗發(fā)聲,黃金、白銀跳水!原油暴跌!

      證券時報e公司
      2026-05-27 17:20:02
      僅有中國存在!外國專家種萬粒種子全死了,落到咱尿桶里卻發(fā)了芽

      僅有中國存在!外國專家種萬粒種子全死了,落到咱尿桶里卻發(fā)了芽

      珺瑤婉史
      2026-05-27 19:20:24
      除了梅西沒來,瓜帥幾乎兌現(xiàn)了全部當年對小球迷許下的諾言

      除了梅西沒來,瓜帥幾乎兌現(xiàn)了全部當年對小球迷許下的諾言

      懂球帝
      2026-05-27 02:50:15
      3分鐘傾家蕩產(chǎn)?年入千億的“精神鴉片”正精準榨干中國人的錢包

      3分鐘傾家蕩產(chǎn)?年入千億的“精神鴉片”正精準榨干中國人的錢包

      大魚簡科
      2026-05-13 14:26:55
      麒麟9050 Pro流片完成,華為Mate90系列首發(fā)搭載

      麒麟9050 Pro流片完成,華為Mate90系列首發(fā)搭載

      三言科技
      2026-05-27 17:29:23
      阿里美團京東集體沉默,樸樸報價太高了

      阿里美團京東集體沉默,樸樸報價太高了

      東哥解讀電商
      2026-05-27 10:28:14
      中東核基地被炸成火海!伊朗先下手為強,特朗普緊急叫停決戰(zhàn)

      中東核基地被炸成火海!伊朗先下手為強,特朗普緊急叫停決戰(zhàn)

      最新聲音
      2026-05-23 19:32:27
      趣論:鄭欽文重返世界前10還需要多久?以及我關(guān)于她的三個猜想

      趣論:鄭欽文重返世界前10還需要多久?以及我關(guān)于她的三個猜想

      網(wǎng)球之家
      2026-05-26 23:13:26
      江西這個“尷尬”的縣,明明隸屬于江西,好多人卻讓它回歸安徽

      江西這個“尷尬”的縣,明明隸屬于江西,好多人卻讓它回歸安徽

      劉小順
      2026-05-27 21:15:26
      全球變暖搞雙標?印度熱炸,中國北方卻迎來1000年一遇的大喜事!

      全球變暖搞雙標?印度熱炸,中國北方卻迎來1000年一遇的大喜事!

      有態(tài)度的何總
      2026-05-27 12:41:46
      4500股飄綠!漲不跟、跌先崩:老登股徹底哭暈,咋辦好?

      4500股飄綠!漲不跟、跌先崩:老登股徹底哭暈,咋辦好?

      華哥的投資筆記
      2026-05-27 18:05:41
      人口大遷徙已是定局?明后年,越來越多人會流入這4座城市?

      人口大遷徙已是定局?明后年,越來越多人會流入這4座城市?

      牛鍋巴小釩
      2026-05-27 01:03:35
      54:45!美國投票結(jié)果出爐,一個時代已結(jié)束,中國加速減持美債

      54:45!美國投票結(jié)果出爐,一個時代已結(jié)束,中國加速減持美債

      小陸搞笑日常
      2026-05-27 15:50:24
      14億人的“高壓鍋”終于炸了:印度如何用一條黑產(chǎn),沖垮整個發(fā)達國家?

      14億人的“高壓鍋”終于炸了:印度如何用一條黑產(chǎn),沖垮整個發(fā)達國家?

      美食格物
      2026-05-26 11:35:19
      2026-05-27 23:31:00
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
      15321文章數(shù) 66892關(guān)注度
      往期回顧 全部

      科技要聞

      韜定律:全球在卷納米數(shù) 華為換了一把尺子

      頭條要聞

      武契奇夫人到上海面料市場定制西服 點名要用國產(chǎn)羊毛

      頭條要聞

      武契奇夫人到上海面料市場定制西服 點名要用國產(chǎn)羊毛

      體育要聞

      這群老阿姨,是最硬核的馬刺球迷

      娛樂要聞

      王鶴棣風波連累父親炸串店遭差評?

      財經(jīng)要聞

      中國半導體的陽謀

      汽車要聞

      限時補貼價9.28-10.98萬 MG 4X正式上市

      態(tài)度原創(chuàng)

      房產(chǎn)
      教育
      藝術(shù)
      時尚
      公開課

      房產(chǎn)要聞

      合生創(chuàng)展前總裁被查!直指房企違規(guī)放貸、利益輸送等問題

      教育要聞

      校內(nèi)征訂收緊:2026 年教輔市場正在被重新洗牌

      藝術(shù)要聞

      這個夏天去蘇州過幾天清閑安逸的日子

      全網(wǎng)首檔AI短劇拍攝現(xiàn)場直播出圈指南

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 内射无套内射国产精品视频| 人妻少妇中文字幕久久69堂| 精品无码久久久久久久动漫| 亚洲高清美女一区二区三区| 久久人人做人人妻人人玩精| 97香蕉久久国产超碰青草专区| 国产a在视频线精品视频下载| 亚洲偷自拍国综合| 中国老太婆bb无套内射| 日本在线视频网站www色下载| 成人欧美一区二区三区的电影| 性饥渴少妇av无码毛片| 国产精品日韩中文字幕熟女| av资源站| 女邻居夹得好紧太爽了av| 国产91专区一区二区| 亚洲日韩精品无码av海量| 91精品国产综合久久久不打电影| 中文字幕日本一区久久| 国产亚洲精aa在线看| 国产一区二区三区不卡自拍| 国产精品亚洲av三区色| 久久777国产线看是看精品 | 亚洲熟妇少妇任你躁在线观看无码| 日本一区三区在线视频| 国产精品-区区久久久狼| 中文字幕国产精品资源| 亚洲国产精品无码久久电影| jizz亚洲AV| 博爱县| 人妻影音先锋啪啪AV资源| 精品乱码一区二区| 欧美猛少妇色xxxxx| 精品国产高清一区二区三区| 99国产精品丝袜久久久久| 国产91视频一区| 国产精品1区2区3区在线观看| 日韩大片免费观看视频播放 | 3pAV在线播放| 狠狠综合av一区二区| 亚洲人亚洲精品成人网站|