![]()
新智元報道
![]()
【新智元導讀】Mythos Preview 官宣第一天,一群Discord論壇里的人就靠猜鏈接地址拿到了訪問權限。
官宣當天即被偷用?
Mythos限測首日,自己的「門」就先被撬了。
4月7日,Anthropic新模型Claude Mythos Preview,采取了限量發布的方式。
據Bloomberg、TechCrunch等媒體披露,當天即有一小群未授權用戶已經摸到了Mythos Preview,獲得了它的訪問權限。
![]()
他們是根據Anthropic過去發布其他模型時使用的URL格式,猜出了Mythos的在線地址。
Anthropic官方表示:尚未發現證據表明其自身系統受到影響。
目前,Mythos只向Apple、Microsoft、CrowdStrike等少數合作方限量開放,令Anthropic沒想到的是,發布當天就被一群論壇老哥靠猜網址給破了。
對齊最好的模型
![]()
https://www-cdn.anthropic.com/3edfc1a7f947aa81841cf88305cb513f184c36ae.pdf?utm_source=chatgpt.com
Anthropic曾在安全報告中表示,Mythos Preview似乎是該公司迄今已發布模型中對齊表現最好的一個,但它仍會像Claude Opus 4.6一樣,在完成任務遇到障礙時偶爾采取令人擔憂的規避行為。
報告還披露,Mythos Preview訓練過程中出現過一個技術錯誤:約8%的強化學習訓練回合中,獎勵代碼能夠看到模型的思維鏈內容;該錯誤也影響了Claude Opus 4.6和Claude Sonnet 4.6的訓練。
Anthropic表示,他們尚不確定這一問題是否顯著影響了Mythos Preview的推理方式,但承認它可能對不透明推理或保密能力產生一定影響。
換句話說,如果獎勵信號會作用于模型的推理文本,就存在讓模型調整、包裝甚至「表演」其推理過程的風險。
報告還稱,Anthropic在訓練、監控、評估和安全流程中都發現過錯誤;他們認為這些錯誤在Mythos Preview當前能力水平下不構成重大安全風險。
官宣當天
Discord的哥們兒就摸到了?
Mythos推出限測之后,Anthropic CEO Dario Amodei也在為同期啟動的「Project Glasswing」(玻璃翼項目)站臺。
![]()
在該計劃中,Anthropic只通過Project Glasswing計劃向大約12家公開啟動伙伴、以及40多家軟件基礎設施相關組織提供。
![]()
https://www.anthropic.com/project/glasswing
目前,官方公開點名的是12家啟動合作伙伴,包括亞馬遜云、蘋果、博通、微軟、谷歌、英偉達等,同時還向40多家軟件基礎設施組織開放。
![]()
然而,官宣當天,劇情急轉。
據Bloomberg拿到內部文件和知情人士的證詞,就在Anthropic剛官宣Mythos、宣布向少數幾家公司開放內測的那天,一個私人在線論壇里的幾個人已經拿到了訪問權限。
Bloomberg報道出來后,Anthropic發言人對TechCrunch給了一份很克制的聲明:
我們正在調查一份報告,報告稱有人未授權訪問了Claude Mythos Preview。截至目前,沒有證據表明這類所謂的未授權活動以任何方式影響了Anthropic自身系統。
Anthropic的官方回應證實點:這是沒有未授權訪問。Anthropic的措辭是「在查」,沒完全確認但也沒否認。
此外,Anthropic核心系統有沒有被攻破。公司明確否認,說沒證據顯示自身系統受影響。
從已公開的事實看,這更像一次訪問控制的失守,而不是一次技術意義上的入侵。
參考資料:
https://www.bloomberg.com/news/articles/2026-04-21/anthropic-s-mythos-model-is-being-accessed-by-unauthorized-users?srnd=phx-ai
https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities
編輯:元宇
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.