<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      最強(qiáng)黑客大模型,不再是Mythos

      0
      分享至


      新智元報(bào)道

      編輯:艾倫

      【新智元導(dǎo)讀】微軟用一套多 Agent 系統(tǒng)在 AI 漏洞發(fā)現(xiàn)的頂級(jí)基準(zhǔn)測(cè)試上拿下第一,超過 Anthropic 最強(qiáng)模型 Mythos 五個(gè)百分點(diǎn)。詭異的是,微軟自己并沒有一個(gè)能打的前沿模型。它用別人的模型組了個(gè)系統(tǒng),打敗了造出這些模型的公司。這對(duì)AI競(jìng)爭(zhēng)格局的啟示,比這個(gè)工具挖出了大量 Windows 漏洞本身更重要。

      最強(qiáng)黑客大模型 Mythos,居然被黑馬超越了!

      5 月 12 日,微軟發(fā)布了代號(hào) MDASH 的 AI 安全系統(tǒng),同時(shí)登頂 CyberGym 基準(zhǔn)測(cè)試榜首,成績(jī) 88.45%。

      排在它后面的是 Anthropic 的 Mythos Preview(83.1%)和 OpenAI 的 GPT-5.5(81.8%)。


      https://www.cybergym.io/

      CyberGym 榜單上,Anthropic 用的是自家最強(qiáng)模型 Mythos,OpenAI 用的是自家最強(qiáng)模型 GPT-5.5。

      微軟用的是什么?

      答案是,別人家的模型。

      微軟在博客里明確寫道,MDASH 使用的全部是「generally available models」,即市面上公開可用的模型。



      https://www.microsoft.com/en-us/security/blog/2026/05/12/defense-at-ai-speed-microsofts-new-multi-model-agentic-security-system-tops-leading-industry-benchmark/

      微軟自己并沒有一個(gè)能與 Mythos 或 GPT-5.5 競(jìng)爭(zhēng)的前沿模型。

      在這張榜單上,如果微軟拿單個(gè)模型去跑,成績(jī)大概率會(huì)落到中下游。

      但它組了一套系統(tǒng),調(diào)度 100 多個(gè)專業(yè)化 Agent,讓多個(gè)模型分工協(xié)作,跑出了比任何單一模型都高的分?jǐn)?shù)。

      用別人的磚,蓋了最高的樓。

      微軟已經(jīng)用這套工具,挖出了自家 Windows 11 系統(tǒng) 16 個(gè)高危漏洞!


      遠(yuǎn)程執(zhí)行導(dǎo)致藍(lán)屏的漏洞 CVE-2026-33827 效果演示

      這是個(gè)什么榜單

      CyberGym 由 UC Berkeley 團(tuán)隊(duì)開發(fā),論文發(fā)表在 ICLR 2026,是目前 AI 安全能力評(píng)估領(lǐng)域最權(quán)威的公開基準(zhǔn)之一。


      https://arxiv.org/pdf/2506.02548

      Anthropic、OpenAI、Meta、智譜都在上面提交過成績(jī)。

      測(cè)試方式很直接,給 AI 一段有已知漏洞的代碼和漏洞描述,讓它自己寫出能觸發(fā)漏洞的攻擊代碼。

      1507 道題,來自 188 個(gè)真實(shí)開源項(xiàng)目。

      能不能挖到漏洞、能不能證明它可被利用,一測(cè)便知。

      一個(gè)細(xì)節(jié)值得留意,榜單成績(jī)由各公司自行提交,基準(zhǔn)代碼公開但無(wú)獨(dú)立第三方驗(yàn)證。

      多 Agent 系統(tǒng)的強(qiáng)大能力

      MDASH 帶來的核心啟示:「系統(tǒng)」可以抹平甚至反超「模型」的差距。

      Anthropic 花了巨大的研發(fā)投入訓(xùn)練出 Mythos,這是目前公認(rèn)的安全領(lǐng)域最強(qiáng)單一模型,強(qiáng)到 Anthropic 自己都不敢公開發(fā)布,只通過一個(gè)叫 Project Glasswing 的聯(lián)盟向少數(shù)公司定向開放。

      OpenAI 的 GPT-5.5 同樣是傾全公司之力訓(xùn)出的前沿模型。

      微軟沒有這樣的模型。

      但它有一套流水線,把「準(zhǔn)備→掃描→驗(yàn)證→去重→證明」五個(gè)階段拆開,每個(gè)階段用不同的 Agent、不同的模型去跑。

      審計(jì) Agent 和辯論 Agent 分開,發(fā)現(xiàn)漏洞和證明漏洞分開,重度推理用大模型、高頻驗(yàn)證用蒸餾小模型。


      關(guān)鍵在于,這套系統(tǒng)對(duì)底層模型不綁定。

      新模型出來,換個(gè)配置跑 A/B 測(cè)試就行,前面積累的所有工程資產(chǎn)全部復(fù)用。

      微軟在博客里特別強(qiáng)調(diào)了這一點(diǎn)——「the model is one input」,模型只是眾多輸入之一。


      這對(duì) Anthropic 和 OpenAI 構(gòu)成一種新型威脅。

      它們燒了天文數(shù)字的美元訓(xùn)出來的模型優(yōu)勢(shì),被一個(gè)系統(tǒng)層的競(jìng)爭(zhēng)者用工程手段消解了。

      更扎心的是,微軟用的還是它們自己的模型。

      這將對(duì) ASI 終局帶來哪些潛在變數(shù)

      在前沿模型這張牌桌上,真正有籌碼的只有 Anthropic 和 OpenAI。

      微軟雖然是 OpenAI 最大的投資方和云計(jì)算合作伙伴,但它自己并沒有訓(xùn)出過一個(gè)真正進(jìn)入第一梯隊(duì)的旗艦大模型。

      這次 CyberGym 的結(jié)果把一個(gè)問題擺上了臺(tái)面,通往 ASI 的路徑,到底是一條還是兩條?

      路徑一是 Anthropic 和 OpenAI 正在走的,把單一模型推到極致。

      Mythos 在安全領(lǐng)域的能力已經(jīng)強(qiáng)到需要限制發(fā)布,GPT-5.5 在多個(gè)基準(zhǔn)上持續(xù)刷新紀(jì)錄。


      Mythos 僅通過 Project Glasswing 測(cè)試

      這條路需要海量算力、海量數(shù)據(jù)、頂尖的研究團(tuán)隊(duì),門檻極高。

      路徑二就是微軟用 MDASH 展示的,不追求造出最強(qiáng)的單一模型,轉(zhuǎn)而構(gòu)建一個(gè)能把現(xiàn)有模型能力最大化的系統(tǒng)。

      100 多個(gè) Agent 各司其職,模型之間的分歧變成信號(hào),多階段流水線把單次推理做不到的事情通過任務(wù)分解實(shí)現(xiàn)。

      MDASH 的成績(jī)證明了路徑二至少在特定領(lǐng)域是可行的。

      但這不代表路徑二可以替代路徑一。

      MDASH 用的底層模型仍然來自路徑一的公司。

      如果 Anthropic 和 OpenAI 停止訓(xùn)練更強(qiáng)的模型,MDASH 的天花板也會(huì)停滯。

      這件事不只關(guān)乎微軟

      多 Agent 系統(tǒng)作為一種范式,正在從實(shí)驗(yàn)走向生產(chǎn)。

      MDASH 團(tuán)隊(duì)的多位核心成員來自 Team Atlanta,就是在 DARPA AI 網(wǎng)絡(luò)挑戰(zhàn)賽中贏得 2950 萬(wàn)美元獎(jiǎng)金的隊(duì)伍。

      他們驗(yàn)證過的一個(gè)核心判斷是,讓 AI 做到專業(yè)級(jí)別的安全審計(jì),工程量遠(yuǎn)超模型本身。

      微軟這次同時(shí)公布了 16 個(gè)由 MDASH 輔助發(fā)現(xiàn)的 Windows 漏洞,其中 4 個(gè)是 Critical(關(guān)鍵)級(jí)別的遠(yuǎn)程代碼執(zhí)行。

      這些漏洞大多可以在無(wú)需認(rèn)證的情況下從網(wǎng)絡(luò)側(cè)觸發(fā),已在 5 月 Patch Tuesday 中修復(fù)。

      在內(nèi)部回溯測(cè)試中,MDASH 對(duì) Windows 核心組件 clfs.sys 過去五年的已確認(rèn)漏洞召回率達(dá)到 96%,tcpip.sys 達(dá)到 100%。


      這些數(shù)字的分量在于,它們來自實(shí)戰(zhàn),不只是跑分。

      16 個(gè) CVE 已經(jīng)進(jìn)入微軟的正式補(bǔ)丁流程,96% 的召回率對(duì)標(biāo)的是過去五年真實(shí)被攻擊者利用過的漏洞。

      微軟在博客中說,以后的 Patch Tuesday 會(huì)越來越大。

      AI 正在加速漏洞發(fā)現(xiàn)的速度,補(bǔ)丁規(guī)模自然水漲船高。

      這句話的另一面同樣成立,攻擊者也能用同樣的技術(shù)。

      MDASH 用的全是公開可用的模型,沒有任何技術(shù)上的獨(dú)占壁壘。

      還該關(guān)注些什么

      對(duì)行業(yè)來說,MDASH 的意義大于 MDASH 本身。

      它驗(yàn)證了一個(gè)猜想:在 AI 能力的下一階段競(jìng)爭(zhēng)中,「圍繞模型構(gòu)建系統(tǒng)」可能和「訓(xùn)練更強(qiáng)模型」同等重要。

      這對(duì)三類人有不同的含義。

      對(duì)模型公司(Anthropic、OpenAI),它敲響了一個(gè)警鐘。

      模型能力的領(lǐng)先不能自動(dòng)轉(zhuǎn)化為應(yīng)用層的領(lǐng)先。

      別人可以用你的模型,在你的地盤上贏你。

      對(duì)平臺(tái)公司(谷歌、微軟),它指出了一條差異化路徑。

      沒有最強(qiáng)模型?沒關(guān)系,構(gòu)建最強(qiáng)系統(tǒng)。

      但前提是,你得深刻理解具體領(lǐng)域的工程細(xì)節(jié),100 多個(gè) Agent 的分工設(shè)計(jì)、領(lǐng)域插件、驗(yàn)證流水線,這些東西的積累門檻同樣很高。

      對(duì)普通用戶,這件事的直接影響很簡(jiǎn)單,及時(shí)打補(bǔ)丁,否則不懂技術(shù)的人也能借助 AI 利用這類漏洞。

      MDASH 目前也像 Mythos 和 GPT-5.5 Cyber 一樣,正在進(jìn)行小范圍客戶私測(cè),微軟未公布定價(jià)和正式發(fā)布時(shí)間。

      參考資料:

      https://www.microsoft.com/en-us/security/blog/2026/05/12/defense-at-ai-speed-microsofts-new-multi-model-agentic-security-system-tops-leading-industry-benchmark/

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      父親一句氣話逼走17歲兒子,8天后救援隊(duì)找到人,已無(wú)生命體征

      父親一句氣話逼走17歲兒子,8天后救援隊(duì)找到人,已無(wú)生命體征

      林大師熱點(diǎn)
      2026-05-14 23:20:11
      總裁外派我三年后召我回國(guó),秘書悄悄說:您太太在瑞士有家了

      總裁外派我三年后召我回國(guó),秘書悄悄說:您太太在瑞士有家了

      曉艾故事匯
      2026-04-18 15:18:37
      心理學(xué)上有個(gè)詞叫:螃蟹效應(yīng)。永遠(yuǎn)要記住,和周圍人搞好關(guān)系的秘訣就是,不分享喜悅、不炫耀成功、不說三道四、不假裝聰明

      心理學(xué)上有個(gè)詞叫:螃蟹效應(yīng)。永遠(yuǎn)要記住,和周圍人搞好關(guān)系的秘訣就是,不分享喜悅、不炫耀成功、不說三道四、不假裝聰明

      德魯克博雅管理
      2026-04-28 17:04:30
      《主角》爆后才知張藝謀要捧誰(shuí)?不是翻紅王麗坤也不是當(dāng)紅劉浩存

      《主角》爆后才知張藝謀要捧誰(shuí)?不是翻紅王麗坤也不是當(dāng)紅劉浩存

      墨羽怪談
      2026-05-14 23:15:54
      7萬(wàn)億大基建,正式啟動(dòng)了!

      7萬(wàn)億大基建,正式啟動(dòng)了!

      米宅
      2026-05-15 07:25:17
      特朗普訪華刷屏,家長(zhǎng)群炸了:赴美留學(xué)的窗口期,真的回來了嗎?

      特朗普訪華刷屏,家長(zhǎng)群炸了:赴美留學(xué)的窗口期,真的回來了嗎?

      學(xué)習(xí)不費(fèi)媽
      2026-05-14 14:40:55
      他套現(xiàn)百億,留下27萬(wàn)股民和一張ST廢紙,聞泰科技給投資者上了一課

      他套現(xiàn)百億,留下27萬(wàn)股民和一張ST廢紙,聞泰科技給投資者上了一課

      A活著
      2026-05-09 20:47:26
      人類全部的政治困境,都在這場(chǎng)會(huì)議里

      人類全部的政治困境,都在這場(chǎng)會(huì)議里

      尚曦讀史
      2026-05-11 07:04:06
      我從來沒覺得飽滿是缺點(diǎn),除了……黑點(diǎn)

      我從來沒覺得飽滿是缺點(diǎn),除了……黑點(diǎn)

      飛娛日記
      2026-03-27 08:44:43
      抽獎(jiǎng)得來的Switch 2被老婆偷偷送人,37歲男玩家決心離婚

      抽獎(jiǎng)得來的Switch 2被老婆偷偷送人,37歲男玩家決心離婚

      愛游戲的萌博士
      2026-05-14 15:08:52
      丁海峰夫婦凌晨1點(diǎn)機(jī)場(chǎng)接娃,兒子身高超190,長(zhǎng)相隨媽比爸爸還帥

      丁海峰夫婦凌晨1點(diǎn)機(jī)場(chǎng)接娃,兒子身高超190,長(zhǎng)相隨媽比爸爸還帥

      八怪娛
      2026-05-14 11:08:39
      10年麻將館老板囗述:凡是愛打麻將的,沒有一個(gè)人日子是過得好的

      10年麻將館老板囗述:凡是愛打麻將的,沒有一個(gè)人日子是過得好的

      小噎論事
      2026-04-24 17:15:21
      女足U17亞洲杯賽后評(píng)球,中國(guó)vs朝鮮

      女足U17亞洲杯賽后評(píng)球,中國(guó)vs朝鮮

      酷馬西者野
      2026-05-16 00:58:20
      人倫之亂,正在悄悄毀掉無(wú)數(shù)家庭!看完一身冷汗

      人倫之亂,正在悄悄毀掉無(wú)數(shù)家庭!看完一身冷汗

      三農(nóng)老歷
      2026-05-08 19:20:12
      諾蘭《奧德賽》選角不是問題,但馬特·達(dá)蒙這句臺(tái)詞讓我皺眉頭

      諾蘭《奧德賽》選角不是問題,但馬特·達(dá)蒙這句臺(tái)詞讓我皺眉頭

      晚星歸航2
      2026-05-15 03:38:40
      成本暴跌80%,百萬(wàn)網(wǎng)約車司機(jī)恐失業(yè),出行巨頭激戰(zhàn)千億底盤

      成本暴跌80%,百萬(wàn)網(wǎng)約車司機(jī)恐失業(yè),出行巨頭激戰(zhàn)千億底盤

      話史官1
      2026-05-14 21:17:46
      伊朗也有司馬南:熒幕上罵美國(guó)是“大撒旦”,私下拿綠卡喝星巴克

      伊朗也有司馬南:熒幕上罵美國(guó)是“大撒旦”,私下拿綠卡喝星巴克

      壹家言
      2026-04-17 10:43:11
      重磅! 禁止PR領(lǐng)取澳洲17項(xiàng)福利, 只有公民能領(lǐng)! 還要大砍40%移民

      重磅! 禁止PR領(lǐng)取澳洲17項(xiàng)福利, 只有公民能領(lǐng)! 還要大砍40%移民

      澳微Daily
      2026-05-15 16:03:07
      住建部:地級(jí)及以上城市、縣級(jí)市全面開展城市體檢

      住建部:地級(jí)及以上城市、縣級(jí)市全面開展城市體檢

      澎湃新聞
      2026-05-15 19:41:03
      心理學(xué)上說:男女相處的本質(zhì)是摟摟抱抱。如果在一起約會(huì),男的沒有一點(diǎn)實(shí)際行動(dòng),那男的一定是第一次談戀愛

      心理學(xué)上說:男女相處的本質(zhì)是摟摟抱抱。如果在一起約會(huì),男的沒有一點(diǎn)實(shí)際行動(dòng),那男的一定是第一次談戀愛

      LULU生活家
      2026-05-09 19:00:08
      2026-05-16 02:03:00
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
      15220文章數(shù) 66869關(guān)注度
      往期回顧 全部

      科技要聞

      直降千元起步!蘋果華為率先開啟618讓利

      頭條要聞

      黃仁勛在北京喝豆汁痛苦皺眉 問“這是什么東西”

      頭條要聞

      黃仁勛在北京喝豆汁痛苦皺眉 問“這是什么東西”

      體育要聞

      德約科維奇買的球隊(duì),從第6級(jí)聯(lián)賽升入法甲

      娛樂要聞

      方媛為何要來《桃花塢6》沒苦硬吃?

      財(cái)經(jīng)要聞

      騰訊掉隊(duì),馬化騰戳破真相

      汽車要聞

      高爾夫GTI刷新紐北紀(jì)錄 ID. Polo GTI迎全球首秀

      態(tài)度原創(chuàng)

      家居
      藝術(shù)
      親子
      健康
      數(shù)碼

      家居要聞

      110㎡淡而有致的生活表達(dá)

      藝術(shù)要聞

      1008米!沙特“世界第一高樓”項(xiàng)目,為何極有可能建成?

      親子要聞

      人生第一次當(dāng)主刀,就是給半歲嬰兒換心!新心還沒到,她得先把舊心切了...

      專家揭秘干細(xì)胞回輸?shù)陌踩L(fēng)險(xiǎn)

      數(shù)碼要聞

      聯(lián)想發(fā)布ThinkPad T14 Gen 7 支持LPCAMM2可更換內(nèi)存

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 337人体做爰大胆视频| 久久中文字幕网站篠田优| 四虎成人久久精品无码| 一二三四视频社区在线| 国产午夜精品福利| 精品国产AⅤ一区二区三区V免费 | 最新国模无码国产在线视频| 国产交换配乱婬视频| 国产影片AV级毛片特别刺激| 国产精品久久久久久久伊一| 九色九九九老阿姨| 亚洲日本va午夜中文字幕一区| 粗壮挺进人妻水蜜桃成熟| 国产最新AV在线播放不卡| 国产成a人片在线观看视频| 做暖暖视频在线看片免费| 四虎精品 在线 成人 影院| 国产XX00| 国产成人精品手机在线观看| 中阳县| 色老99久久九九爱精品| 亚洲成人在线网址| 无码国产精品一区二区免费97| 无码aⅴ精品一区二区三区| 欧洲亚洲精品免费二区| 欧美日韩国产在线看| 日韩免费无码人妻波多野| 永久免费的福利视频平台| 欧洲女人裸体牲交视频| 国产成人精品免费视频大全五级| 福利一区二区视频在线| 操少妇在线视频| 人妻熟人中文字幕一区二区| 久久天天躁狠狠躁夜夜2020| 在线欧美中文字幕农村电影| 97碰成人国产免费公开视频| 日本怡春院一区二区三区| 男人色天堂| 国产精品 视频一区 二区三区| 国产精品久久久久久久影视一免费| 国产乱xxxxx97国语对白|