<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      留給人類數學家的懸賞不多了!谷歌DeepMind解決9道埃爾德什問題

      0
      分享至

      聞樂 發自 凹非寺
      量子位 | 公眾號 QbitAI

      AI進軍數學界的速度太快了。

      OpenAI前腳剛用內部模型突破埃爾德什的80年單位距離問題,谷歌DeepMind后腳就解決一個同樣卡了人類56年的埃爾德什數學難題——

      最新發布AlphaProof Nexus,一套由Gemini驅動的智能體框架,一出手就是9個埃爾德什開放問題



      除了這9道,它還順手證明了OEIS整數序列百科里的44個猜想、搞定了一道擱置15年的代數幾何難題、還改進了凸優化領域里一個沿用已久的理論邊界。

      推理成本呢?每道題幾百美元,整套證明代碼也全都開源放在了GitHub上。



      這篇論文共有20位作者,其中的Aja Huang,也是2016年AlphaGo的核心研究員。

      56年沒人做出來的題,AI 給了什么答案

      AlphaProof Nexus解決的這幾道題,咱挑三道最有意思的說說。

      Erd?s#12,1970年提出,懸置56年

      這道題問的是:你能不能找出一個無限大的整數集合,滿足兩個聽起來很別扭的條件:

      第一,任意從中挑三個不同的數字a、b、c,a永遠不能整除b加c的和。

      第二,這組數不能太零散,在自然數里要保持一定的密度。

      簡單理解就是,這群數字之間,既不能一個數整除另一個數,也不能一個數整除另外兩個數的和,同時數字還要分布得相對密集,不能只挑寥寥幾個數投機取巧。

      從1970年開始,就沒人能給出這個集合的完整構造,各種局部進展有,但始終拼不成一個整體解。



      AI的解法是用中國剩余定理把大問題拆成許多個獨立的區塊,每個區塊內部用三項等差數列的回避集來滿足約束,然后把所有區塊拼回一個完整的無限集。



      Erd?s#125,1996年提出,30年沒有定論

      這道題聽著就更奇怪了。

      想象兩個數字集合:第一個集合里全是“在三進制下只由數字0和1組成的整數”,第二個集合里全是“在四進制下只由數字0和1組成的整數”。把這兩個集合里所有數字兩兩相加,得到一個新集合。

      問:這個新集合里的數字在自然數中出現的頻率(數學上叫下密度)是不是正的?

      直覺上你可能會覺得,兩種集合包含的數字本來就不算很多,加起來應該也挺稀疏的。

      但稀疏到什么程度?是徹底稀到密度歸零,還是多少保持一點正密度?

      這中間的差別非常微妙,1996年提出后一直沒定論。

      AI的答案是:密度為零。



      證明思路是log?除以log?是無理數。這意味著3的冪次和4的冪次可以以任意精度彼此逼近。

      利用這一點,AI構造了一個歸納性稀疏化論證:不斷找到兩個幾乎對齊的尺度,讓密度以0.99的比率一步步衰減,直到徹底歸零。

      一個純數論的性質,解決了一個組合幾何的問題。

      Erd?s#846,1992年提出,卡了人類34年。

      這是個平面幾何題,AI證明了存在這樣一個無限擴展的平面點集:

      你從中任意挑出有限個點,總能發現其中大部分點是不共線的——

      隨便截一段,看起來都挺正常,但當你試圖把這個無限集合拆分成有限個“絕對沒有任何三點共線”的子集時,辦不到。

      一個集合的每個有限局部都正常,但整體頑固得不可拆分。這種全局與局部的張力,是組合幾何里最難的那一類問題。

      AI把完全圖的每條邊映射到平面上一個點,用二次多項式編碼坐標,再拉上無窮Ramsey定理完成證明,把一個幾何問題翻譯成了圖論和邏輯的語言。

      除了這三道,還有六道分別在整除集構造、范德瓦爾登數間隙、西頓集孤立點、集合拆分密度等領域。



      同時,AlphaProof Nexus還在OEIS整數序列百科里證明了44個開放猜想,在代數幾何那邊解決了一道希爾伯特函數對數凹性的15年懸案,凸優化那邊改進了一個錨定梯度下降法的理論邊界。



      菲爾茲獎得主陶哲軒曾經提醒過,AI目前解決埃爾德什問題的實際成功率大約在1-2%,這次谷歌的系統挑戰了353道題,解開9道,比例剛好對上了。

      用幾百美元算力換一道56年難題

      AlphaProof Nexus的架構核心用一句話就能說清楚,Gemini 3.1 Pro生成Lean語言證明步驟→Lean編譯器逐行檢查→報錯直接反饋給模型→模型根據報錯修改→再檢查→循環到全部通過。



      好家伙,這有點像平時寫代碼,只不過現在Debug的是數學定理……



      在這套框架里,DeepMind設計了四個Agent

      最簡單的Agent A是同時啟動多個獨立子Agent,先靠Gemini 3.1 Pro梳理解題思路,動手編寫證明代碼。

      寫完立刻交給編譯器核驗,一旦報錯,錯誤信息就會傳回模型,讓它不斷修改、重試,直到通關。

      全程沒有額外輔助工具,純靠寫代碼+查錯循環。



      Agent B多了一樣東西,AlphaProof。

      AlphaProof是DeepMind之前專門為奧數級別題目訓練過的強化學習證明工具。

      當Agent A模式在某個小步驟上反復卡住、編譯器反復報錯也修不過來時,Agent B可以調用AlphaProof做一次強化學習驅動的樹搜索,專門攻擊這個局部難點。

      Agent C引入了進化算法的思路。

      前面兩種Agent的子Agent都是各自獨立工作的,互不交流。

      Agent C是所有子Agent共享一個證明草圖種群,每一個子模塊都會產出不同的證明草稿。

      然后由另一個模型從合理性、清晰度、新穎性三個維度給每一份草稿打分,用Elo評分系統排名。

      高分草稿會相互組合,衍生出新解法,低分草稿直接淘汰,整個種群在證明空間里做進化搜索。

      Agent D是全功能完全體,進化篩選思路+專項工具攻克難點+大模型邏輯推理,三股力量在一個框架里協同,也是這次批量破解難題的主力。



      這么看下來,我以為最強的Agent D應該會碾壓一切,Agent A只當個對照組。

      結果沒想到論文里表明最簡單的Agent A,同樣能解出全部9道題

      沒有進化算法,沒有AlphaProof,就一個LLM循環加編譯器反饋的Agent A,只是在難題上更費錢一點。



      研究團隊把原因歸為兩個:

      • 一是Gemini 3.1 Pro本身的能力已經足夠強了;
      • 二是Lean編譯器的那層實打實的糾錯反饋,對AI的引導作用,遠比人們預想的更大。

      這個結果或許也在預示著,未來隨著大模型能力持續升級,復雜的多工具組合系統,可能不再是剛需,只用大模型+專業校驗工具這套簡單循環,就能搞定大多數數學難題。

      而且這套方案的優勢也體現在成本上,單題僅需幾百美元。

      埃爾德什生前為這些難題設置了懸賞,只是他不會想到——

      解開這些謎題的可能不是人類智慧,而是算力。

      論文地址:https://arxiv.org/abs/2605.22763v1
      Github地址:https://github.com/google-deepmind/alphaproof-nexus-results


      [1]https://x.com/pushmeet/status/2058936037754224998
      [2]https://the-decoder.com/google-deepminds-alphaproof-nexus-solves-decades-old-math-problems-for-a-few-hundred-dollars/

      — 完 —

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中國技術全球領先,美國需15年才能追趕

      中國技術全球領先,美國需15年才能追趕

      無情有思可
      2026-05-26 16:55:42
      看了孫銘徽賭氣甩鍋塔克的離譜操作,才知道,郭士強為什么不要他

      看了孫銘徽賭氣甩鍋塔克的離譜操作,才知道,郭士強為什么不要他

      后仰大風車
      2026-05-27 08:25:11
      一張山頂票2.42萬!尼克斯時隔27年重返NBA總決賽,票價創史上峰值

      一張山頂票2.42萬!尼克斯時隔27年重返NBA總決賽,票價創史上峰值

      界面新聞
      2026-05-27 12:25:40
      四個省會城市市政府領導班子調整

      四個省會城市市政府領導班子調整

      上觀新聞
      2026-05-27 10:08:07
      問政四川丨47萬元電車行駛中動力中斷,車主質疑存在重大安全隱患,4S店拒換車?記者調查

      問政四川丨47萬元電車行駛中動力中斷,車主質疑存在重大安全隱患,4S店拒換車?記者調查

      新浪財經
      2026-05-26 18:56:13
      詹姆斯有望重返克利夫蘭!騎士湖人醞釀重磅先簽后換交易

      詹姆斯有望重返克利夫蘭!騎士湖人醞釀重磅先簽后換交易

      夜白侃球
      2026-05-27 11:24:54
      大連一商場樓頂部分垮塌,當地稱無人受傷,正現場處置,商場影城全天暫停放映

      大連一商場樓頂部分垮塌,當地稱無人受傷,正現場處置,商場影城全天暫停放映

      極目新聞
      2026-05-27 12:21:30
      許家印認罪!2.4萬億窟窿,家族只拿走500億,其余真金白銀去哪了

      許家印認罪!2.4萬億窟窿,家族只拿走500億,其余真金白銀去哪了

      蜉蝣說
      2026-04-23 09:41:11
      “榛樹”導彈打出去,俄羅斯更加沒牌了

      “榛樹”導彈打出去,俄羅斯更加沒牌了

      山河路口
      2026-05-24 19:54:50
      創紀錄的空襲中戲劇性的一幕

      創紀錄的空襲中戲劇性的一幕

      西樓飲月
      2026-05-26 11:14:36
      隆江豬腳飯!曾經的打工人神飯,如今快涼透了

      隆江豬腳飯!曾經的打工人神飯,如今快涼透了

      草莓甜甜
      2026-05-25 15:55:15
      這一回,輪到煙草員工開始沒心情上班了?干活沒底氣了?

      這一回,輪到煙草員工開始沒心情上班了?干活沒底氣了?

      今朝牛馬
      2026-05-26 20:40:56
      韓國超模自曝身材煩惱:太豐滿也是一種負擔,1個穿搭秘訣化解困擾

      韓國超模自曝身材煩惱:太豐滿也是一種負擔,1個穿搭秘訣化解困擾

      赴一場山海啊
      2026-05-25 00:12:48
      回憶錄神話該破了:那些自帶光環的親歷者,真的一句謊都沒撒?

      回憶錄神話該破了:那些自帶光環的親歷者,真的一句謊都沒撒?

      浪子說
      2026-05-25 00:50:03
      女子僅一天沒在辦公室,茶具上就長毛了,喜提“毛絨外套”一件 ,網友:現在知道為什么在很多餐具都是不銹鋼的了

      女子僅一天沒在辦公室,茶具上就長毛了,喜提“毛絨外套”一件 ,網友:現在知道為什么在很多餐具都是不銹鋼的了

      洪觀新聞
      2026-05-26 16:33:36
      五大聯賽落幕!金球獎10位熱門候選出爐:登貝萊第2,亞馬爾第5

      五大聯賽落幕!金球獎10位熱門候選出爐:登貝萊第2,亞馬爾第5

      球場沒跑道
      2026-05-26 18:21:45
      凌晨法網戰報,2-0,2-1,中國金花兩連勝,提前鎖定16強席位

      凌晨法網戰報,2-0,2-1,中國金花兩連勝,提前鎖定16強席位

      桃葉渡春
      2026-05-27 08:42:22
      拋開裁判不談,馬刺為何慘敗?米奇發聲,蘇群一針見血,扎心文班

      拋開裁判不談,馬刺為何慘???米奇發聲,蘇群一針見血,扎心文班

      萌蘭聊個球
      2026-05-27 11:40:31
      雷霆127-114勝馬刺,3-2賽點!我必須承認5個事實:裁判硬保雷霆

      雷霆127-114勝馬刺,3-2賽點!我必須承認5個事實:裁判硬保雷霆

      籃球掃地僧
      2026-05-27 12:11:29
      殺人誅心!穆里尼奧皇馬首簽鎖定!強挖 1.2 億英超王牌

      殺人誅心!穆里尼奧皇馬首簽鎖定!強挖 1.2 億英超王牌

      奶蓋熊本熊
      2026-05-27 04:55:25
      2026-05-27 12:44:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12690文章數 176471關注度
      往期回顧 全部

      科技要聞

      韜定律:全球在卷納米數 華為換了一把尺子

      頭條要聞

      武契奇在北京發表演講 談及北約轟炸中國駐南聯盟使館

      頭條要聞

      武契奇在北京發表演講 談及北約轟炸中國駐南聯盟使館

      體育要聞

      這群老阿姨,是最硬核的馬刺球迷

      娛樂要聞

      小S曬歸寧宴舊照,大S穿吊帶裙扎丸子頭

      財經要聞

      ST巖石退市背后:A股“炒殼”時代終結

      汽車要聞

      極狐問道V9今日將正式上市 搭載華為雪鸮增程系統

      態度原創

      數碼
      手機
      藝術
      旅游
      公開課

      數碼要聞

      酷冷至尊MasterFrame 400 Mesh Gold限量版機箱上市,1699元

      手機要聞

      榮耀曹工回應截屏彈出存儲不足提示,稱問題已確認并找到解決方案

      藝術要聞

      這個夏天去蘇州過幾天清閑安逸的日子

      旅游要聞

      官方回應稻城亞丁景區截斷省道收費爭議:將盡快向公眾答復

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 乱码午夜-极国产极内射| 亚欧乱色熟女一区二区三区| 久热久热中文字幕综合激情| 伊人久久婷婷色综合98网| 亚洲天堂网色图伦理经典| 韩国午夜理论A三级在线观看| 亚洲欧美日韩精品中文乱码| av解说在线观看| 国内女人喷潮完整视频| 好男人在线影院www| 国产精品免费视频不卡| 午夜成年影院| 人妻自拍网| 国产人妖xxxx做受视频| 亚洲综合极品嫩模喷大量白浆 | 综合一区无套内射中文字幕| 大帝AV在线一区二区三区| 免费人成在线观看网站| 大肉大捧一进一出好爽视频 | 久久久噜噜噜久久中文字幕色伊伊| 精品乱人伦一区二区三区| 亚洲国产精品国自产电影| 久久无码免费束人妻| 久久午夜伦鲁片免费无码| 人人人澡人人肉久久精品| 欧美专区第二页| 久久aⅴ无码av高潮AV喷| 亚洲精品一区二区区别| 成人A级片| 亚洲人成无码网站| 亚洲人成综合网站7777香蕉| 久久婷婷五月综合色一区二区| 欧美老熟妇牲交| 中文字字幕在线中文| 女人摸下面自熨视频在线播放| 久久精品视频中文字幕无码| 国产福利不卡视频| 国产无遮挡裸体免费直播| 东京热加勒比综合| 国产欧美精品一区二区色综合| 亚洲AV成人一区二区三区网站|