![]()
新智元報(bào)道
編輯:艾倫
【新智元導(dǎo)讀】微軟用一套多 Agent 系統(tǒng)在 AI 漏洞發(fā)現(xiàn)的頂級(jí)基準(zhǔn)測(cè)試上拿下第一,超過 Anthropic 最強(qiáng)模型 Mythos 五個(gè)百分點(diǎn)。詭異的是,微軟自己并沒有一個(gè)能打的前沿模型。它用別人的模型組了個(gè)系統(tǒng),打敗了造出這些模型的公司。這對(duì)AI競(jìng)爭(zhēng)格局的啟示,比這個(gè)工具挖出了大量 Windows 漏洞本身更重要。
最強(qiáng)黑客大模型 Mythos,居然被黑馬超越了!
5 月 12 日,微軟發(fā)布了代號(hào) MDASH 的 AI 安全系統(tǒng),同時(shí)登頂 CyberGym 基準(zhǔn)測(cè)試榜首,成績(jī) 88.45%。
排在它后面的是 Anthropic 的 Mythos Preview(83.1%)和 OpenAI 的 GPT-5.5(81.8%)。
![]()
https://www.cybergym.io/
CyberGym 榜單上,Anthropic 用的是自家最強(qiáng)模型 Mythos,OpenAI 用的是自家最強(qiáng)模型 GPT-5.5。
微軟用的是什么?
答案是,別人家的模型。
微軟在博客里明確寫道,MDASH 使用的全部是「generally available models」,即市面上公開可用的模型。
![]()
![]()
https://www.microsoft.com/en-us/security/blog/2026/05/12/defense-at-ai-speed-microsofts-new-multi-model-agentic-security-system-tops-leading-industry-benchmark/
微軟自己并沒有一個(gè)能與 Mythos 或 GPT-5.5 競(jìng)爭(zhēng)的前沿模型。
在這張榜單上,如果微軟拿單個(gè)模型去跑,成績(jī)大概率會(huì)落到中下游。
但它組了一套系統(tǒng),調(diào)度 100 多個(gè)專業(yè)化 Agent,讓多個(gè)模型分工協(xié)作,跑出了比任何單一模型都高的分?jǐn)?shù)。
用別人的磚,蓋了最高的樓。
微軟已經(jīng)用這套工具,挖出了自家 Windows 11 系統(tǒng) 16 個(gè)高危漏洞!
![]()
遠(yuǎn)程執(zhí)行導(dǎo)致藍(lán)屏的漏洞 CVE-2026-33827 效果演示
這是個(gè)什么榜單
CyberGym 由 UC Berkeley 團(tuán)隊(duì)開發(fā),論文發(fā)表在 ICLR 2026,是目前 AI 安全能力評(píng)估領(lǐng)域最權(quán)威的公開基準(zhǔn)之一。
![]()
https://arxiv.org/pdf/2506.02548
Anthropic、OpenAI、Meta、智譜都在上面提交過成績(jī)。
測(cè)試方式很直接,給 AI 一段有已知漏洞的代碼和漏洞描述,讓它自己寫出能觸發(fā)漏洞的攻擊代碼。
1507 道題,來自 188 個(gè)真實(shí)開源項(xiàng)目。
能不能挖到漏洞、能不能證明它可被利用,一測(cè)便知。
一個(gè)細(xì)節(jié)值得留意,榜單成績(jī)由各公司自行提交,基準(zhǔn)代碼公開但無(wú)獨(dú)立第三方驗(yàn)證。
多 Agent 系統(tǒng)的強(qiáng)大能力
MDASH 帶來的核心啟示:「系統(tǒng)」可以抹平甚至反超「模型」的差距。
Anthropic 花了巨大的研發(fā)投入訓(xùn)練出 Mythos,這是目前公認(rèn)的安全領(lǐng)域最強(qiáng)單一模型,強(qiáng)到 Anthropic 自己都不敢公開發(fā)布,只通過一個(gè)叫 Project Glasswing 的聯(lián)盟向少數(shù)公司定向開放。
OpenAI 的 GPT-5.5 同樣是傾全公司之力訓(xùn)出的前沿模型。
微軟沒有這樣的模型。
但它有一套流水線,把「準(zhǔn)備→掃描→驗(yàn)證→去重→證明」五個(gè)階段拆開,每個(gè)階段用不同的 Agent、不同的模型去跑。
審計(jì) Agent 和辯論 Agent 分開,發(fā)現(xiàn)漏洞和證明漏洞分開,重度推理用大模型、高頻驗(yàn)證用蒸餾小模型。
![]()
關(guān)鍵在于,這套系統(tǒng)對(duì)底層模型不綁定。
新模型出來,換個(gè)配置跑 A/B 測(cè)試就行,前面積累的所有工程資產(chǎn)全部復(fù)用。
微軟在博客里特別強(qiáng)調(diào)了這一點(diǎn)——「the model is one input」,模型只是眾多輸入之一。
![]()
這對(duì) Anthropic 和 OpenAI 構(gòu)成一種新型威脅。
它們燒了天文數(shù)字的美元訓(xùn)出來的模型優(yōu)勢(shì),被一個(gè)系統(tǒng)層的競(jìng)爭(zhēng)者用工程手段消解了。
更扎心的是,微軟用的還是它們自己的模型。
這將對(duì) ASI 終局帶來哪些潛在變數(shù)
在前沿模型這張牌桌上,真正有籌碼的只有 Anthropic 和 OpenAI。
微軟雖然是 OpenAI 最大的投資方和云計(jì)算合作伙伴,但它自己并沒有訓(xùn)出過一個(gè)真正進(jìn)入第一梯隊(duì)的旗艦大模型。
這次 CyberGym 的結(jié)果把一個(gè)問題擺上了臺(tái)面,通往 ASI 的路徑,到底是一條還是兩條?
路徑一是 Anthropic 和 OpenAI 正在走的,把單一模型推到極致。
Mythos 在安全領(lǐng)域的能力已經(jīng)強(qiáng)到需要限制發(fā)布,GPT-5.5 在多個(gè)基準(zhǔn)上持續(xù)刷新紀(jì)錄。
![]()
Mythos 僅通過 Project Glasswing 測(cè)試
這條路需要海量算力、海量數(shù)據(jù)、頂尖的研究團(tuán)隊(duì),門檻極高。
路徑二就是微軟用 MDASH 展示的,不追求造出最強(qiáng)的單一模型,轉(zhuǎn)而構(gòu)建一個(gè)能把現(xiàn)有模型能力最大化的系統(tǒng)。
100 多個(gè) Agent 各司其職,模型之間的分歧變成信號(hào),多階段流水線把單次推理做不到的事情通過任務(wù)分解實(shí)現(xiàn)。
MDASH 的成績(jī)證明了路徑二至少在特定領(lǐng)域是可行的。
但這不代表路徑二可以替代路徑一。
MDASH 用的底層模型仍然來自路徑一的公司。
如果 Anthropic 和 OpenAI 停止訓(xùn)練更強(qiáng)的模型,MDASH 的天花板也會(huì)停滯。
這件事不只關(guān)乎微軟
多 Agent 系統(tǒng)作為一種范式,正在從實(shí)驗(yàn)走向生產(chǎn)。
MDASH 團(tuán)隊(duì)的多位核心成員來自 Team Atlanta,就是在 DARPA AI 網(wǎng)絡(luò)挑戰(zhàn)賽中贏得 2950 萬(wàn)美元獎(jiǎng)金的隊(duì)伍。
他們驗(yàn)證過的一個(gè)核心判斷是,讓 AI 做到專業(yè)級(jí)別的安全審計(jì),工程量遠(yuǎn)超模型本身。
微軟這次同時(shí)公布了 16 個(gè)由 MDASH 輔助發(fā)現(xiàn)的 Windows 漏洞,其中 4 個(gè)是 Critical(關(guān)鍵)級(jí)別的遠(yuǎn)程代碼執(zhí)行。
這些漏洞大多可以在無(wú)需認(rèn)證的情況下從網(wǎng)絡(luò)側(cè)觸發(fā),已在 5 月 Patch Tuesday 中修復(fù)。
在內(nèi)部回溯測(cè)試中,MDASH 對(duì) Windows 核心組件 clfs.sys 過去五年的已確認(rèn)漏洞召回率達(dá)到 96%,tcpip.sys 達(dá)到 100%。
![]()
這些數(shù)字的分量在于,它們來自實(shí)戰(zhàn),不只是跑分。
16 個(gè) CVE 已經(jīng)進(jìn)入微軟的正式補(bǔ)丁流程,96% 的召回率對(duì)標(biāo)的是過去五年真實(shí)被攻擊者利用過的漏洞。
微軟在博客中說,以后的 Patch Tuesday 會(huì)越來越大。
AI 正在加速漏洞發(fā)現(xiàn)的速度,補(bǔ)丁規(guī)模自然水漲船高。
這句話的另一面同樣成立,攻擊者也能用同樣的技術(shù)。
MDASH 用的全是公開可用的模型,沒有任何技術(shù)上的獨(dú)占壁壘。
還該關(guān)注些什么
對(duì)行業(yè)來說,MDASH 的意義大于 MDASH 本身。
它驗(yàn)證了一個(gè)猜想:在 AI 能力的下一階段競(jìng)爭(zhēng)中,「圍繞模型構(gòu)建系統(tǒng)」可能和「訓(xùn)練更強(qiáng)模型」同等重要。
這對(duì)三類人有不同的含義。
對(duì)模型公司(Anthropic、OpenAI),它敲響了一個(gè)警鐘。
模型能力的領(lǐng)先不能自動(dòng)轉(zhuǎn)化為應(yīng)用層的領(lǐng)先。
別人可以用你的模型,在你的地盤上贏你。
對(duì)平臺(tái)公司(谷歌、微軟),它指出了一條差異化路徑。
沒有最強(qiáng)模型?沒關(guān)系,構(gòu)建最強(qiáng)系統(tǒng)。
但前提是,你得深刻理解具體領(lǐng)域的工程細(xì)節(jié),100 多個(gè) Agent 的分工設(shè)計(jì)、領(lǐng)域插件、驗(yàn)證流水線,這些東西的積累門檻同樣很高。
對(duì)普通用戶,這件事的直接影響很簡(jiǎn)單,及時(shí)打補(bǔ)丁,否則不懂技術(shù)的人也能借助 AI 利用這類漏洞。
MDASH 目前也像 Mythos 和 GPT-5.5 Cyber 一樣,正在進(jìn)行小范圍客戶私測(cè),微軟未公布定價(jià)和正式發(fā)布時(shí)間。
參考資料:
https://www.microsoft.com/en-us/security/blog/2026/05/12/defense-at-ai-speed-microsofts-new-multi-model-agentic-security-system-tops-leading-industry-benchmark/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.