日前,小米 MiMo 團隊負責人羅福莉在 X 上發表長文,評論 Anthropic切斷 openclaw 等第三方代理的事情。
她指出,全球算力跟不上 Agent 時代的 Token 消耗,出路不是更便宜的Token,而是更省 Token 的框架和更高效的模型共同進化。
![]()
以下為博文全文:
兩天前,Anthropic 切斷了第三方代理框架對 Claude 訂閱服務的調用權限——這并不意外。
三天前,MiMo 推出了其 token 方案。這套方案是我投入了不少精力設計的,我認為它是一次認真的嘗試,旨在合理解決算力分配與智能代理框架開發的核心問題。
結合這兩件事,我有一些思考:
1. Claude Code 的訂閱制是一套設計精良、算力分配均衡的體系。
我的判斷是:這套模式并不盈利,甚至可能在虧損,除非其 API 利潤率達到 10–20 倍,而我對此深表懷疑。
我無法精確計算第三方框架接入帶來的損失,但仔細研究過 OpenClaw 的上下文管理機制——做得非常糟糕。
在單個用戶查詢中,它會將多輪低價值工具調用拆分為獨立的 API 請求,每一次都攜帶超長上下文(通常超過 10 萬代幣);即便命中緩存也依舊浪費,極端情況下還會拉高其他查詢的緩存未命中率。單條查詢產生的實際請求量,最終會是 Claude Code 原生框架的數倍。
換算成 API 定價,真實成本可能是訂閱費用的數十倍。這不是小差距,而是巨大的虧損黑洞。
2. OpenClaw、OpenCode 這類第三方框架仍可通過 API 調用 Claude,只是不能再蹭訂閱服務。
短期來看,這些代理用戶會明顯感受到成本壓力,費用很可能直接飆升數十倍。但這種壓力恰恰會倒逼這些框架優化上下文管理,最大化提示詞緩存命中率以復用已處理上下文,減少無意義的代幣消耗。陣痛最終會轉化為工程規范。
3. 我強烈建議大模型廠商,在沒想清楚如何在不巨額虧損的前提下制定編程類服務定價之前,不要盲目打價格戰。
把 token 賣得極其便宜,同時對第三方框架完全敞開大門,對用戶看似友好,實則是個陷阱——而 Anthropic 剛剛跳出了這個陷阱。
更深層的問題在于,如果用戶把時間精力耗費在低質量的智能代理框架、極不穩定且緩慢的推理服務,以及為壓縮成本而降級的模型上,最終卻發現什么任務都完成不了——這對用戶體驗與留存而言,絕非健康的循環。
4.再說 MiMo token 方案:它支持第三方框架接入,按 token 額度計費,邏輯與 Claude 新推出的超額使用套餐一致。因為我們追求的是長期穩定地提供高質量模型與服務,而不是讓用戶沖動付費后便棄之不用。
從更宏觀的視角看:全球算力供給,已經跟不上智能代理產生的 token 需求。真正的出路不是更便宜的代幣,而是協同進化:token 效率更高的智能代理框架 × 更強、更高效的模型。
無論 Anthropic 主觀意圖如何,其此舉正在推動整個生態——無論開源還是閉源——朝著這個方向發展。這或許是件好事。智能代理時代,不屬于消耗算力最多的玩家,而屬于善用算力的玩家。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.