Mythos造假/Opus降智/Agent新平臺，Anthropic所有更新一次性看懂

2026-04-13 14:10:28　來源: 卡爾的AI沃茨

北京舉報

分享至

Anthropic這段時間的更新太多太零碎了，

而且還被抓包那個藏起來不讓我們用新模型Claude Mythos效果作假，把Opus 4.6降智降到比4.5還差，思考長度從2200token壓縮到600token了，美其名曰優(yōu)化延遲和token效率，新版本的Claude Code的緩存失效把我token消耗速度干到原來的10倍以上了。

是時候來一個大掃除式的更新整理了！

先用一個時間軸整理一下這段時間Anthropic的更新和大烏龍們，

3月26號，大漏勺Anthropic內(nèi)部CMS配置錯誤，3000個未發(fā)布的文檔泄漏了，里面就有Claude Mythos。

3月31號，把Claude Code源碼泄漏了。

4月4號，Anthropic限制了第三方工具用Claude 訂閱（OpenClaw史詩級削弱），只能用API，很狗的是還會識別當前Agent的System Prompt，有OpenClaw關(guān)鍵詞就給你ban了。

4月6號，Claude Code新增了/ultraplan命令，一句話就是說把規(guī)劃任務從本地搬到云端的Claude Code Web，在瀏覽器端用Opus 4.6+Plan Mode生成計劃，review完可以選擇云端or本地執(zhí)行。

4月7號，Claude Mythos Preview發(fā)布 + Project Glasswing 網(wǎng)絡(luò)安全計劃啟動，還發(fā)布了244頁的報告。Mythos最出圈的就是發(fā)現(xiàn)了我們過去主流操作系統(tǒng)，軟件，瀏覽器里幾千個之前沒被發(fā)現(xiàn)的漏洞。當時我的想法是年底要是能用上Mythos我將直接起飛。

4月8號，Claude Managed Agents發(fā)布，本質(zhì)上是Anthropic的云端Agent平臺，核心賣點是一套調(diào)優(yōu)過的Agent Harness（編排引擎），把Agent運行，工具調(diào)用，長時間運行等全部打包成開箱即用的云服務。Anthropic的API團隊還額外說明了Agent是怎么通過Vaults（憑證）來管理用戶訪問外部服務的密鑰，這個憑證不會被讀入Claude的上下文。

platform.claude.com/docs/en/managed-agents/vaults

4月9號，推出了Advisor Strategy（策略）與 Advisor Tool（工具），就是讓Sonnet/Haiku這兩個模型有不懂了就直接去問老大哥Opus，花Sonnet的錢實現(xiàn)Opus的表現(xiàn)

4月10號，OpenClaw的老父親Peter Steinberger的Claude賬戶被封了，幾小時又被光速恢復了，很難不懷疑是因為他入職了OpenAI的原因了（/此處有笑臉）

還有一個超前預告，月底30號，Sonnet 4.5和4的百萬上下文窗口也會下線了。

這段時間OpenAI在干什么呢？

奧特曼不語，只是每新增100萬個用戶，就把Codex的額度重置一次，現(xiàn)在雙倍額度已經(jīng)重置到了5月31號了。

說那么多，是時候來分析一下Anthropic主動被動更新那么多東西意味著什么了，

信號一｜從賣模型到賣AI的基礎(chǔ)設(shè)施

按照常規(guī)劇本，Anthropic應該直接公布Mythos的跑分，開放API，然后看著它在各種排行榜上屠榜。

但他們沒有。

他們選擇了一條強到不能公開的路線，對外說是Mythos在過去幾周里，發(fā)現(xiàn)了數(shù)千個潛伏多年的漏洞，像OpenBSD操作系統(tǒng)里還有一個藏了27年的骨灰級漏洞。然后，他們宣布，這個模型太危險了，不能公開發(fā)布，只能交給AWS，蘋果，谷歌這些巨頭，以及四十多家有關(guān)鍵基礎(chǔ)設(shè)施組織，在一個叫Project Glasswing（玻璃翼計劃）的項目里，專門用來做網(wǎng)絡(luò)安全防御。

但是，看多了Anthropic更新，就會發(fā)現(xiàn)它每一次新模型都會發(fā)一點跟安全相關(guān)的新詞，ASL-4，Sleeper Agents，Undercover Mode，神經(jīng)網(wǎng)絡(luò)暗物質(zhì)，戰(zhàn)略性裝傻。

這小詞一套又一套的。

所以后面被研究員復測發(fā)現(xiàn)，Mythos的成果，很多都存在于老舊軟件里，隔壁GPT-OSS-20b照樣可以發(fā)現(xiàn)OpenBSD的漏洞。因為之前大模型的測試里比較少有大范圍測試過這些漏洞，反而被Mythos撿了個漏。

Mythos的發(fā)布，本身就是一個信號。

Anthropic想傳遞的，不只是技術(shù)參數(shù)，而是一種定價權(quán)和生態(tài)控制的聲明。

他們不再滿足于賣給我們更鋒利的劍（大模型），他們現(xiàn)在還要賣能讓我們安全揮舞這把劍的劍鞘和訓練場，也就是他們緊接著推出的Claude Managed Agents。

一個能直接在Anthrocip云端構(gòu)建，托管和運行生產(chǎn)級AI代理的基礎(chǔ)設(shè)施，提供了沙盒，憑證管理，長時間運行會話這些過去需要我們費勁去搭的東西。

這樣商業(yè)閉環(huán)就成了。

先用Mythos來定義什么是頂級智能。然后再限制其他方（特指OpenClaw）用Claude額度。再然后，再用一個開箱即用的Managed Agents平臺告訴大家，想用好這種級別的智能，來我這里，我這兒有最安全，最方便的基礎(chǔ)設(shè)施。

從模型提供商到Agent基礎(chǔ)設(shè)施提供商是一個定位轉(zhuǎn)移。

而且盲猜未來很長一段時間安全仍是Anthropic的主線，會繼續(xù)推Trustworthy Agents框架，避免Mythos模型能力失控。

Mythos和GPT 5.4 Pro的得分PK

信號二｜從大模型帶小弟到小弟請教大哥

Anthropic新出的Advisor Strategy（顧問策略）也同樣有意思。

過去我們做多Agent協(xié)作，常見的思路是，讓一個最強的大模型，比如Opus，當總指揮，把任務拆解了，分給一堆能力稍弱但便宜的小模型，比如Sonnet或者Haiku，去當執(zhí)行者。

這個模式的問題在于，總指揮需要很強的任務拆解能力，而且可以我們要自己搭一套復雜的編排框架。

Advisor策略把這個思路完全反了過來。

它讓Sonnet或者Haiku作為主力模型，全程跑任務，調(diào)用工具，推進工作。

只有當它自己跑到某個坎，覺得腦子不夠用了，決策不了的時候，它才會主動搖人，調(diào)用一次Opus來當顧問。Opus拿到共享的上下文后，會快速給出一個戰(zhàn)略指導，然后立刻下線，Sonnet往下執(zhí)行。

這用的歸藏佬的圖

這意味著，

前沿的推理能力，只在需要的時候才介入。

我們花的大部分錢，都是Sonnet或者Haiku的底價執(zhí)行算力。而在抉擇的時候給我指路的是最聰明的Opus大哥。

不過目前來說在Claude Code還用不了，要在API請求的時候顯式配置上這個Tool才行。

platform.claude.com/docs/en/agents-and-tools/tool-use/advisor-tool

也就是說，Anthropic正在把模型間的協(xié)作，

從一個需要開發(fā)者額外配置的應用層問題，

變成一個平臺原生支持的基礎(chǔ)能力。

總的來說，

Anthropic正在收緊它對生態(tài)的控制。

想要提前結(jié)束這個允許我們用各種野生方式，

去探索模型能力的大航海時代。

他們現(xiàn)在希望所有的玩家，

都能到他們預先規(guī)劃好的航道里來。

順帶提一嘴，

他們還發(fā)布了244頁的Mythos模型的心理評估，得到的結(jié)論是這模型是健康的神經(jīng)病，

就，怎么說呢，

很符合我對Dario Amodei（Anthropic CEO）的刻板印象。

@ 作者 / 卡爾

最后，感謝你看到這里如果喜歡這篇文章，不妨順手給我們點贊｜在看｜轉(zhuǎn)發(fā)｜評論

如果想要第一時間收到推送，不妨給我個星標

如果你有更有趣的玩法，歡迎在評論區(qū)聊聊

更多的內(nèi)容正在不斷填坑中……

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.