Anthropic這段時間的更新太多太零碎了,
而且還被抓包那個藏起來不讓我們用新模型Claude Mythos效果作假,把Opus 4.6降智降到比4.5還差,思考長度從2200token壓縮到600token了,美其名曰優(yōu)化延遲和token效率,新版本的Claude Code的緩存失效把我token消耗速度干到原來的10倍以上了。
是時候來一個大掃除式的更新整理了!
![]()
先用一個時間軸整理一下這段時間Anthropic的更新和大烏龍們,
3月26號,大漏勺Anthropic內(nèi)部CMS配置錯誤,3000個未發(fā)布的文檔泄漏了,里面就有Claude Mythos。
3月31號,把Claude Code源碼泄漏了。
4月4號,Anthropic限制了第三方工具用Claude 訂閱(OpenClaw史詩級削弱),只能用API,很狗的是還會識別當前Agent的System Prompt,有OpenClaw關(guān)鍵詞就給你ban了。
4月6號,Claude Code新增了/ultraplan命令,一句話就是說把規(guī)劃任務從本地搬到云端的Claude Code Web,在瀏覽器端用Opus 4.6+Plan Mode生成計劃,review完可以選擇云端or本地執(zhí)行。
4月7號,Claude Mythos Preview發(fā)布 + Project Glasswing 網(wǎng)絡(luò)安全計劃啟動,還發(fā)布了244頁的報告。Mythos最出圈的就是發(fā)現(xiàn)了我們過去主流操作系統(tǒng),軟件,瀏覽器里幾千個之前沒被發(fā)現(xiàn)的漏洞。當時我的想法是年底要是能用上Mythos我將直接起飛。
4月8號,Claude Managed Agents發(fā)布,本質(zhì)上是Anthropic的云端Agent平臺,核心賣點是一套調(diào)優(yōu)過的Agent Harness(編排引擎),把Agent運行,工具調(diào)用,長時間運行等全部打包成開箱即用的云服務。Anthropic的API團隊還額外說明了Agent是怎么通過Vaults(憑證)來管理用戶訪問外部服務的密鑰,這個憑證不會被讀入Claude的上下文。
platform.claude.com/docs/en/managed-agents/vaults
4月9號,推出了Advisor Strategy(策略)與 Advisor Tool(工具),就是讓Sonnet/Haiku這兩個模型有不懂了就直接去問老大哥Opus,花Sonnet的錢實現(xiàn)Opus的表現(xiàn)
4月10號,OpenClaw的老父親Peter Steinberger的Claude賬戶被封了,幾小時又被光速恢復了,很難不懷疑是因為他入職了OpenAI的原因了(/此處有笑臉)
還有一個超前預告,月底30號,Sonnet 4.5和4的百萬上下文窗口也會下線了。
這段時間OpenAI在干什么呢?
奧特曼不語,只是每新增100萬個用戶,就把Codex的額度重置一次,現(xiàn)在雙倍額度已經(jīng)重置到了5月31號了。
![]()
說那么多,是時候來分析一下Anthropic主動被動更新那么多東西意味著什么了,
信號一|從賣模型到賣AI的基礎(chǔ)設(shè)施
按照常規(guī)劇本,Anthropic應該直接公布Mythos的跑分,開放API,然后看著它在各種排行榜上屠榜。
但他們沒有。
他們選擇了一條強到不能公開的路線,對外說是Mythos在過去幾周里,發(fā)現(xiàn)了數(shù)千個潛伏多年的漏洞,像OpenBSD操作系統(tǒng)里還有一個藏了27年的骨灰級漏洞。然后,他們宣布,這個模型太危險了,不能公開發(fā)布,只能交給AWS,蘋果,谷歌這些巨頭,以及四十多家有關(guān)鍵基礎(chǔ)設(shè)施組織,在一個叫Project Glasswing(玻璃翼計劃)的項目里,專門用來做網(wǎng)絡(luò)安全防御。
但是,看多了Anthropic更新,就會發(fā)現(xiàn)它每一次新模型都會發(fā)一點跟安全相關(guān)的新詞,ASL-4,Sleeper Agents,Undercover Mode,神經(jīng)網(wǎng)絡(luò)暗物質(zhì),戰(zhàn)略性裝傻。
這小詞一套又一套的。
所以后面被研究員復測發(fā)現(xiàn),Mythos的成果,很多都存在于老舊軟件里,隔壁GPT-OSS-20b照樣可以發(fā)現(xiàn)OpenBSD的漏洞。因為之前大模型的測試里比較少有大范圍測試過這些漏洞,反而被Mythos撿了個漏。
Mythos的發(fā)布,本身就是一個信號。
Anthropic想傳遞的,不只是技術(shù)參數(shù),而是一種定價權(quán)和生態(tài)控制的聲明。
他們不再滿足于賣給我們更鋒利的劍(大模型),他們現(xiàn)在還要賣能讓我們安全揮舞這把劍的劍鞘和訓練場,也就是他們緊接著推出的Claude Managed Agents。
一個能直接在Anthrocip云端構(gòu)建,托管和運行生產(chǎn)級AI代理的基礎(chǔ)設(shè)施,提供了沙盒,憑證管理,長時間運行會話這些過去需要我們費勁去搭的東西。
這樣商業(yè)閉環(huán)就成了。
先用Mythos來定義什么是頂級智能。然后再限制其他方(特指OpenClaw)用Claude額度。再然后,再用一個開箱即用的Managed Agents平臺告訴大家,想用好這種級別的智能,來我這里,我這兒有最安全,最方便的基礎(chǔ)設(shè)施。
從模型提供商到Agent基礎(chǔ)設(shè)施提供商是一個定位轉(zhuǎn)移。
而且盲猜未來很長一段時間安全仍是Anthropic的主線,會繼續(xù)推Trustworthy Agents框架,避免Mythos模型能力失控。
![]()
Mythos和GPT 5.4 Pro的得分PK
信號二|從大模型帶小弟到小弟請教大哥
Anthropic新出的Advisor Strategy(顧問策略)也同樣有意思。
過去我們做多Agent協(xié)作,常見的思路是,讓一個最強的大模型,比如Opus,當總指揮,把任務拆解了,分給一堆能力稍弱但便宜的小模型,比如Sonnet或者Haiku,去當執(zhí)行者。
這個模式的問題在于,總指揮需要很強的任務拆解能力,而且可以我們要自己搭一套復雜的編排框架。
Advisor策略把這個思路完全反了過來。
它讓Sonnet或者Haiku作為主力模型,全程跑任務,調(diào)用工具,推進工作。
只有當它自己跑到某個坎,覺得腦子不夠用了,決策不了的時候,它才會主動搖人,調(diào)用一次Opus來當顧問。Opus拿到共享的上下文后,會快速給出一個戰(zhàn)略指導,然后立刻下線,Sonnet往下執(zhí)行。
![]()
這用的歸藏佬的圖
這意味著,
前沿的推理能力,只在需要的時候才介入。
我們花的大部分錢,都是Sonnet或者Haiku的底價執(zhí)行算力。而在抉擇的時候給我指路的是最聰明的Opus大哥。
不過目前來說在Claude Code還用不了,要在API請求的時候顯式配置上這個Tool才行。
platform.claude.com/docs/en/agents-and-tools/tool-use/advisor-tool
也就是說,Anthropic正在把模型間的協(xié)作,
從一個需要開發(fā)者額外配置的應用層問題,
變成一個平臺原生支持的基礎(chǔ)能力。
總的來說,
Anthropic正在收緊它對生態(tài)的控制。
想要提前結(jié)束這個允許我們用各種野生方式,
去探索模型能力的大航海時代。
他們現(xiàn)在希望所有的玩家,
都能到他們預先規(guī)劃好的航道里來。
順帶提一嘴,
他們還發(fā)布了244頁的Mythos模型的心理評估,得到的結(jié)論是這模型是健康的神經(jīng)病,
就,怎么說呢,
很符合我對Dario Amodei(Anthropic CEO)的刻板印象。
@ 作者 / 卡爾
最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉(zhuǎn)發(fā)|評論
如果想要第一時間收到推送,不妨給我個星標
如果你有更有趣的玩法,歡迎在評論區(qū)聊聊
更多的內(nèi)容正在不斷填坑中……
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.