網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

最強(qiáng)黑客大模型，不再是Mythos

2026-05-15 12:34:20　來源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：艾倫

【新智元導(dǎo)讀】微軟用一套多 Agent 系統(tǒng)在 AI 漏洞發(fā)現(xiàn)的頂級(jí)基準(zhǔn)測(cè)試上拿下第一，超過 Anthropic 最強(qiáng)模型 Mythos 五個(gè)百分點(diǎn)。詭異的是，微軟自己并沒有一個(gè)能打的前沿模型。它用別人的模型組了個(gè)系統(tǒng)，打敗了造出這些模型的公司。這對(duì)AI競(jìng)爭(zhēng)格局的啟示，比這個(gè)工具挖出了大量 Windows 漏洞本身更重要。

最強(qiáng)黑客大模型 Mythos，居然被黑馬超越了！

5 月 12 日，微軟發(fā)布了代號(hào) MDASH 的 AI 安全系統(tǒng)，同時(shí)登頂 CyberGym 基準(zhǔn)測(cè)試榜首，成績(jī) 88.45%。

排在它后面的是 Anthropic 的 Mythos Preview（83.1%）和 OpenAI 的 GPT-5.5（81.8%）。

https://www.cybergym.io/

CyberGym 榜單上，Anthropic 用的是自家最強(qiáng)模型 Mythos，OpenAI 用的是自家最強(qiáng)模型 GPT-5.5。

微軟用的是什么？

答案是，別人家的模型。

微軟在博客里明確寫道，MDASH 使用的全部是「generally available models」，即市面上公開可用的模型。

https://www.microsoft.com/en-us/security/blog/2026/05/12/defense-at-ai-speed-microsofts-new-multi-model-agentic-security-system-tops-leading-industry-benchmark/

微軟自己并沒有一個(gè)能與 Mythos 或 GPT-5.5 競(jìng)爭(zhēng)的前沿模型。

在這張榜單上，如果微軟拿單個(gè)模型去跑，成績(jī)大概率會(huì)落到中下游。

但它組了一套系統(tǒng)，調(diào)度 100 多個(gè)專業(yè)化 Agent，讓多個(gè)模型分工協(xié)作，跑出了比任何單一模型都高的分?jǐn)?shù)。

用別人的磚，蓋了最高的樓。

微軟已經(jīng)用這套工具，挖出了自家 Windows 11 系統(tǒng) 16 個(gè)高危漏洞！

遠(yuǎn)程執(zhí)行導(dǎo)致藍(lán)屏的漏洞 CVE-2026-33827 效果演示

這是個(gè)什么榜單

CyberGym 由 UC Berkeley 團(tuán)隊(duì)開發(fā)，論文發(fā)表在 ICLR 2026，是目前 AI 安全能力評(píng)估領(lǐng)域最權(quán)威的公開基準(zhǔn)之一。

https://arxiv.org/pdf/2506.02548

Anthropic、OpenAI、Meta、智譜都在上面提交過成績(jī)。

測(cè)試方式很直接，給 AI 一段有已知漏洞的代碼和漏洞描述，讓它自己寫出能觸發(fā)漏洞的攻擊代碼。

1507 道題，來自 188 個(gè)真實(shí)開源項(xiàng)目。

能不能挖到漏洞、能不能證明它可被利用，一測(cè)便知。

一個(gè)細(xì)節(jié)值得留意，榜單成績(jī)由各公司自行提交，基準(zhǔn)代碼公開但無(wú)獨(dú)立第三方驗(yàn)證。

多 Agent 系統(tǒng)的強(qiáng)大能力

MDASH 帶來的核心啟示：「系統(tǒng)」可以抹平甚至反超「模型」的差距。

Anthropic 花了巨大的研發(fā)投入訓(xùn)練出 Mythos，這是目前公認(rèn)的安全領(lǐng)域最強(qiáng)單一模型，強(qiáng)到 Anthropic 自己都不敢公開發(fā)布，只通過一個(gè)叫 Project Glasswing 的聯(lián)盟向少數(shù)公司定向開放。

OpenAI 的 GPT-5.5 同樣是傾全公司之力訓(xùn)出的前沿模型。

微軟沒有這樣的模型。

但它有一套流水線，把「準(zhǔn)備→掃描→驗(yàn)證→去重→證明」五個(gè)階段拆開，每個(gè)階段用不同的 Agent、不同的模型去跑。

審計(jì) Agent 和辯論 Agent 分開，發(fā)現(xiàn)漏洞和證明漏洞分開，重度推理用大模型、高頻驗(yàn)證用蒸餾小模型。

關(guān)鍵在于，這套系統(tǒng)對(duì)底層模型不綁定。

新模型出來，換個(gè)配置跑 A/B 測(cè)試就行，前面積累的所有工程資產(chǎn)全部復(fù)用。

微軟在博客里特別強(qiáng)調(diào)了這一點(diǎn)——「the model is one input」，模型只是眾多輸入之一。

這對(duì) Anthropic 和 OpenAI 構(gòu)成一種新型威脅。

它們燒了天文數(shù)字的美元訓(xùn)出來的模型優(yōu)勢(shì)，被一個(gè)系統(tǒng)層的競(jìng)爭(zhēng)者用工程手段消解了。

更扎心的是，微軟用的還是它們自己的模型。

這將對(duì) ASI 終局帶來哪些潛在變數(shù)

在前沿模型這張牌桌上，真正有籌碼的只有 Anthropic 和 OpenAI。

微軟雖然是 OpenAI 最大的投資方和云計(jì)算合作伙伴，但它自己并沒有訓(xùn)出過一個(gè)真正進(jìn)入第一梯隊(duì)的旗艦大模型。

這次 CyberGym 的結(jié)果把一個(gè)問題擺上了臺(tái)面，通往 ASI 的路徑，到底是一條還是兩條？

路徑一是 Anthropic 和 OpenAI 正在走的，把單一模型推到極致。

Mythos 在安全領(lǐng)域的能力已經(jīng)強(qiáng)到需要限制發(fā)布，GPT-5.5 在多個(gè)基準(zhǔn)上持續(xù)刷新紀(jì)錄。

Mythos 僅通過 Project Glasswing 測(cè)試

這條路需要海量算力、海量數(shù)據(jù)、頂尖的研究團(tuán)隊(duì)，門檻極高。

路徑二就是微軟用 MDASH 展示的，不追求造出最強(qiáng)的單一模型，轉(zhuǎn)而構(gòu)建一個(gè)能把現(xiàn)有模型能力最大化的系統(tǒng)。

100 多個(gè) Agent 各司其職，模型之間的分歧變成信號(hào)，多階段流水線把單次推理做不到的事情通過任務(wù)分解實(shí)現(xiàn)。

MDASH 的成績(jī)證明了路徑二至少在特定領(lǐng)域是可行的。

但這不代表路徑二可以替代路徑一。

MDASH 用的底層模型仍然來自路徑一的公司。

如果 Anthropic 和 OpenAI 停止訓(xùn)練更強(qiáng)的模型，MDASH 的天花板也會(huì)停滯。

這件事不只關(guān)乎微軟

多 Agent 系統(tǒng)作為一種范式，正在從實(shí)驗(yàn)走向生產(chǎn)。

MDASH 團(tuán)隊(duì)的多位核心成員來自 Team Atlanta，就是在 DARPA AI 網(wǎng)絡(luò)挑戰(zhàn)賽中贏得 2950 萬(wàn)美元獎(jiǎng)金的隊(duì)伍。

他們驗(yàn)證過的一個(gè)核心判斷是，讓 AI 做到專業(yè)級(jí)別的安全審計(jì)，工程量遠(yuǎn)超模型本身。

微軟這次同時(shí)公布了 16 個(gè)由 MDASH 輔助發(fā)現(xiàn)的 Windows 漏洞，其中 4 個(gè)是 Critical（關(guān)鍵）級(jí)別的遠(yuǎn)程代碼執(zhí)行。

這些漏洞大多可以在無(wú)需認(rèn)證的情況下從網(wǎng)絡(luò)側(cè)觸發(fā)，已在 5 月 Patch Tuesday 中修復(fù)。

在內(nèi)部回溯測(cè)試中，MDASH 對(duì) Windows 核心組件 clfs.sys 過去五年的已確認(rèn)漏洞召回率達(dá)到 96%，tcpip.sys 達(dá)到 100%。

這些數(shù)字的分量在于，它們來自實(shí)戰(zhàn)，不只是跑分。

16 個(gè) CVE 已經(jīng)進(jìn)入微軟的正式補(bǔ)丁流程，96% 的召回率對(duì)標(biāo)的是過去五年真實(shí)被攻擊者利用過的漏洞。

微軟在博客中說，以后的 Patch Tuesday 會(huì)越來越大。

AI 正在加速漏洞發(fā)現(xiàn)的速度，補(bǔ)丁規(guī)模自然水漲船高。

這句話的另一面同樣成立，攻擊者也能用同樣的技術(shù)。

MDASH 用的全是公開可用的模型，沒有任何技術(shù)上的獨(dú)占壁壘。

還該關(guān)注些什么

對(duì)行業(yè)來說，MDASH 的意義大于 MDASH 本身。

它驗(yàn)證了一個(gè)猜想：在 AI 能力的下一階段競(jìng)爭(zhēng)中，「圍繞模型構(gòu)建系統(tǒng)」可能和「訓(xùn)練更強(qiáng)模型」同等重要。

這對(duì)三類人有不同的含義。

對(duì)模型公司（Anthropic、OpenAI），它敲響了一個(gè)警鐘。

模型能力的領(lǐng)先不能自動(dòng)轉(zhuǎn)化為應(yīng)用層的領(lǐng)先。

別人可以用你的模型，在你的地盤上贏你。

對(duì)平臺(tái)公司（谷歌、微軟），它指出了一條差異化路徑。

沒有最強(qiáng)模型？沒關(guān)系，構(gòu)建最強(qiáng)系統(tǒng)。

但前提是，你得深刻理解具體領(lǐng)域的工程細(xì)節(jié)，100 多個(gè) Agent 的分工設(shè)計(jì)、領(lǐng)域插件、驗(yàn)證流水線，這些東西的積累門檻同樣很高。

對(duì)普通用戶，這件事的直接影響很簡(jiǎn)單，及時(shí)打補(bǔ)丁，否則不懂技術(shù)的人也能借助 AI 利用這類漏洞。

MDASH 目前也像 Mythos 和 GPT-5.5 Cyber 一樣，正在進(jìn)行小范圍客戶私測(cè)，微軟未公布定價(jià)和正式發(fā)布時(shí)間。

參考資料：

https://www.microsoft.com/en-us/security/blog/2026/05/12/defense-at-ai-speed-microsofts-new-multi-model-agentic-security-system-tops-leading-industry-benchmark/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.