羅福莉再發(fā)聲，Agent時代模型訂閱制涼了？

2026-04-08 21:49:49　來源: 字母榜

北京舉報

分享至

“我會建議所有LLM公司，在搞清楚‘coding plan怎么定價不虧錢’之前，不要盲目打價格戰(zhàn)。”近日，小米集團(tuán)MiMo負(fù)責(zé)人羅福莉在X平臺發(fā)文，談及針對眼下的Token定價問題發(fā)表看法。

讓羅福莉下場發(fā)聲的由頭很簡單：Anthropic在近期調(diào)整了產(chǎn)品策略，不再允許用Claude訂閱運(yùn)行OpenClaw。

本月4日起，Claude的Pro和Max訂閱不再覆蓋OpenClaw等第三方框架，用戶如果還要繼續(xù)使用這些智能體，只能改為通過API按量付費(fèi)或購買額外使用額度。

Claude官方解釋稱：這類調(diào)用對系統(tǒng)造成了“遠(yuǎn)超預(yù)期的壓力”。

而幾乎在同一時間，MiMo也推出了自家的Token Plan。

“Claude Code的訂閱機(jī)制在計算資源分配上設(shè)計得非常漂亮。但我認(rèn)為它并不賺錢甚至可能虧損，除非API利潤率高出10到20倍。”在文中，羅福莉這樣分析道。

除了呼吁不打價格戰(zhàn)，羅福莉的另一個核心觀點(diǎn)是：長期來看，Agent時代的模型正在迎接一個“被迫進(jìn)化”的過程，優(yōu)化上下文管理、復(fù)用已有計算結(jié)果、減少無效token消耗是接下來的迭代方向。

在她看來，Anthropic的這一步，正在推動整個生態(tài)向這個方向：讓高效的Agent和高效的模型協(xié)同進(jìn)化。

不過，面對Anthropic這一策略調(diào)整，也有人選擇了不買賬。

OpenClaw作者Peter Steinberger在X上直接開噴，他表示，曾嘗試與Anthropic溝通，但最終只爭取到一周的緩沖時間。

OpenClaw的廣大用戶群體無疑是這一輪調(diào)整的最大受害者，很多用戶訂閱Claude，本來就是為了運(yùn)行OpenClaw，而現(xiàn)在，這條路徑被直接切斷。

當(dāng)原本被認(rèn)為“高昂價格”的200美元的訂閱，突然間能跑出幾千美元的算力消耗，無疑是對廠商定價策略的一次考驗(yàn)。

另一方面，這并非是一句簡單的“Token調(diào)用變多了”就能解釋的現(xiàn)象。Agent正在重塑Token的調(diào)用邏輯，而背后這筆賬，算起來還真有點(diǎn)復(fù)雜。

600倍浮動下，模型該怎么定價

如果要用一個詞來解釋這場爭議的核心，那就是——波動，不可預(yù)測的波動。

南洋理工大學(xué)等團(tuán)隊(duì)在近期發(fā)布的研究《Beyond Max Tokens》顯示，在多輪工具調(diào)用的智能體場景中，同一個任務(wù)的計算消耗，可能出現(xiàn)最高658倍的差異。

一條看起來類似的任務(wù)，有的幾千個計算單元就結(jié)束，有的則被拉到數(shù)萬甚至更高。這意味著，模型的成本不只是變得更高，而是不可預(yù)測。

“我仔細(xì)觀察過OpenClaw的上下文管理——做得不怎么樣。”

解構(gòu)羅福莉在X上的發(fā)言，你能發(fā)現(xiàn)和南洋理工這份研究的契合之處。羅福莉發(fā)現(xiàn)，在OpenClaw的一個用戶請求里，往往會發(fā)起多輪低價值的工具調(diào)用，帶來了巨大的模型調(diào)用量的浪費(fèi)。

“真實(shí)成本很可能是訂閱價格的幾十倍。這不是差距——這是一個‘深坑’。”

羅福莉所說“深坑”，問題出在OpenClaw這類智能體的運(yùn)行方式：一個任務(wù)往往需要多輪嘗試和回退，很多計算并不會直接產(chǎn)生結(jié)果，但依然消耗資源。

但這個消耗資源的具體量級很難測算，這也是Claude選擇封禁掉訂閱接入Agent的渠道，而不是選擇新設(shè)立一個“合理”定價的訂閱套餐。

總而言之，隨著Agent生態(tài)加速演變，Token用量的“合理”范圍，壓根無法準(zhǔn)確預(yù)估。

“我們一直在努力滿足不斷增長的Claude需求，但我們的訂閱服務(wù)并非為這些第三方工具的使用模式而設(shè)計的。”談及這一次業(yè)務(wù)調(diào)整，Claude Code負(fù)責(zé)人Boris Cherny此前在X上這樣寫道。

他表示：“Token是一種我們謹(jǐn)慎管理的資源，我們將優(yōu)先考慮使用我們產(chǎn)品和API的客戶。”

對于這一調(diào)整帶來的影響，有業(yè)內(nèi)分析稱之為“自助餐已經(jīng)結(jié)束了”。OpenClaw開啟了Agent的大航海時代，但也推翻了此前的模型定價門檻。一個OpenClaw代理運(yùn)行一天，就可能消耗1000到5000美元的API成本。

“Anthropic正在承擔(dān)每個通過第三方接口用戶所產(chǎn)生的這部分差價，”增長營銷專家Aakash Gupta在X上寫道。“這就是一家公司眼睜睜看著利潤實(shí)時蒸發(fā)的速度。”

成本完全失控，這是Anthropic不得不立刻做出反應(yīng)的原因。

在Chatbot形態(tài)里，訂閱制之所以能延續(xù)，是因?yàn)榭梢愿鶕?jù)歷史數(shù)據(jù)，統(tǒng)計出一個代表大部分用戶的用量均值：輕度用戶覆蓋重度用戶，整體成本可以被攤平。

但在Agent場景中，這種結(jié)構(gòu)被打破。重度使用不再是個例，而是由產(chǎn)品形態(tài)本身決定的結(jié)果。只要模型開始“執(zhí)行任務(wù)”，就必然會出現(xiàn)長鏈路調(diào)用、上下文膨脹和重復(fù)嘗試。

類似的變化，其實(shí)已經(jīng)在其他產(chǎn)品中出現(xiàn)。此前當(dāng)Cursor在調(diào)整定價時，就從“按請求次數(shù)計費(fèi)”轉(zhuǎn)向“按實(shí)際Token成本折算的額度”，原因同樣是長鏈路任務(wù)帶來的成本差異，已經(jīng)無法用固定配額衡量。

不過，用Token作為唯一定價、實(shí)算實(shí)銷的方式雖然看起來很科學(xué)，但是也帶來了新的問題，Agent鏈路下Token用量不確定性依然存在，如果完全用實(shí)際Token用量核算，相當(dāng)于把這種不確定性轉(zhuǎn)嫁給了用戶。

因此，當(dāng)Anthropic發(fā)表聲明后，用戶不買賬的聲音也此起彼伏。

X上有許多用戶表示，切換到API計費(fèi)跑OpenClaw成本會嚴(yán)重攀升，使得他們不得不考慮其他途徑。

而已經(jīng)被OpenAI“收編”的OpenClaw創(chuàng)始人Steinberger，在X上“開噴”也帶了一絲叫板的意味。

有外媒分析，OpenAI似乎正在將自己定位為一個更“易于上手”的替代方案，并可能利用這一契機(jī)，從不滿的Claude高級用戶那里獲取客戶。

知名媒體Axios此前在報道中披露，曾有一位行業(yè)資深人士表示，“Anthropic強(qiáng)調(diào)訓(xùn)練和運(yùn)行模型的效率，而OpenAI的心態(tài)是，CEO奧特曼總能籌集到更多資金來支持計算規(guī)模的擴(kuò)展。”

這場爭論的結(jié)局尚未可知，但毫無疑問的是，在2026年的AI領(lǐng)域，第三方自動化獲得補(bǔ)貼、無限計算能力的時代已經(jīng)結(jié)束。

不管采用哪種計費(fèi)邏輯，更謹(jǐn)慎、更細(xì)化的Token收費(fèi)模式已在路上。

配額不是唯一出路，但已是眼下最優(yōu)解

進(jìn)一步討論定價問題前，有必要先解釋下目前模型產(chǎn)品的主流計費(fèi)模式。

目前主流模型廠商大致形成“三層計費(fèi)結(jié)構(gòu)”。第一層是訂閱制，面向個人用戶，如ChatGPT Plus、Claude Pro、Gemini Advanced，按月收費(fèi)，提供更強(qiáng)模型與更高調(diào)用上限，但通常伴隨速率與用量限制。

第二層是API按量計費(fèi)，以O(shè)penAI、Anthropic、Google以及國內(nèi)火山引擎、阿里云、智譜等公司，按token或等價計算量收費(fèi)，是開發(fā)者與企業(yè)的核心結(jié)算方式。

在此之上，各家又推出Coding Plan/Token Plan等套餐，作為訂閱與按量之間的過渡形態(tài)：用戶按月付費(fèi)獲得一定額度與優(yōu)先權(quán)，但超額仍需按量付費(fèi)，并伴隨公平使用與限流機(jī)制。

在Agent場景中，這一分層尤為關(guān)鍵，自動化調(diào)用大都只支持API按量計費(fèi)，訂閱與套餐難以覆蓋高強(qiáng)度、多輪調(diào)用的算力消耗。而大部分“訂閱模式”只針對一般用戶的Chatbot和內(nèi)嵌Agent功能。

隨著Anthropic針對Openclaw切換計費(fèi)方式，其他廠商也相繼做出反應(yīng)，是更直接的——漲價。

過去幾周時間里，一輪集中調(diào)價出現(xiàn)在國內(nèi)AI云廠商中。

騰訊云此前宣布，自上月13日起結(jié)束部分模型的免費(fèi)公測，并轉(zhuǎn)為正式收費(fèi)，同時對混元系列模型進(jìn)行大幅調(diào)價，部分價格漲幅超過400%。

隨后，阿里和百度方面也發(fā)布公告，本月月中開始上調(diào)AI算力和存儲價格，整體漲幅在5%—30%區(qū)間。

而在幾天前智譜的財報電話會議上，CEO張鵬披露，2026年一季度接口調(diào)用價格提升了83%，但調(diào)用量仍然增長400%。

接連幾家AI云廠商漲價，說明了一件事：模型需求的增長來得太快，甚至廠商的基建層都倍感壓力。

這一點(diǎn)在羅福莉的發(fā)文中也有體現(xiàn)：“更宏觀地看：全球的算力供給，跟不上agent帶來的token需求增長。”真正的出路，不是更便宜的token，而是模型和Agent的‘協(xié)同進(jìn)化’。”

只是，在更高效的模型+Agent架構(gòu)面世之前，漲價或者限制訂閱，并不能解決這套計費(fèi)邏輯中的核心矛盾。

從用戶視角看，購買的是“任務(wù)完成”；但從模型廠商的視角，計量的是“計算過程”。

這兩者之間，目前存在著明顯的錯位。走訂閱，廠商要承擔(dān)Token調(diào)用不穩(wěn)定的風(fēng)險；走API，這個風(fēng)險又來到了用戶身上。

這也是為什么“訂閱+配額+API”的組合，同時出現(xiàn)在了各大廠商的落地方案中。

在Harness/Coding場景下，各類plan本質(zhì)上是一種用戶與模型廠商之間的相互妥協(xié)：廠商通過Coding/Token Plan套餐鎖定一部分額度，換取用戶側(cè)的價格確定性，同時用限流和規(guī)則控制風(fēng)險。

但在OpenClaw這類更不受控的agent場景中，調(diào)用強(qiáng)度和路徑都難以約束，這種“妥協(xié)”很難成立，廠商們更多選擇 API按量計費(fèi)。

訂閱負(fù)責(zé)輕量使用，配額限制極端消耗，超額部分按量計費(fèi)。本質(zhì)上，這是一種對不確定性的緩沖機(jī)制。

不過，Token計價也并不是唯一的解法，行業(yè)內(nèi)已經(jīng)在探索一些“另類”的模型收費(fèi)模式。

一類是按任務(wù)收費(fèi)。比如Anthropic在Claude Code中推出的Code Review功能，直接按一次PR審查計價，單次review平均成本在15–25美元，并隨代碼規(guī)模和復(fù)雜度浮動。

二是按結(jié)果收費(fèi)，已經(jīng)在企業(yè)側(cè)落地，比如智能客服、RPA廠商按“問題解決”或“流程完成”計價；還有一種是按時間收費(fèi)，比如xAI的語音agent按運(yùn)行時長計費(fèi)，約0.05美元/分鐘）。

幾天前，在火山引擎武漢站巡展活動中，當(dāng)字母AI問及“面對模型調(diào)用激增、Token消耗存在不確定性的現(xiàn)狀，模型廠商該如何優(yōu)化定價策略？”時，火山引擎總裁譚待這樣回應(yīng)：

“目前OpenClaw這類通用型平臺適合按Token收費(fèi)，因?yàn)槠鋺?yīng)用場景廣泛，無法統(tǒng)一定義效果和成本。”譚待同時表示，未來可能會孵化出垂直領(lǐng)域的智能體，如客服智能體，就可以按回答問題的數(shù)量收費(fèi)。“類似線下找客服的模式，按效果付費(fèi)。”

“（Anthropic的這一步）大概率是一件好事。Agent時代不屬于消耗最多算力的人，而屬于最會使用算力的人。”在那篇發(fā)文最后，羅福莉這樣總結(jié)道。

顯然，圍繞Token收費(fèi)的爭論還將持續(xù)下去，這一爭論將取決于未來模型-Agent在效率層面的迭代情況。

我們可以確定的是，過去一度被壓到幾厘錢每Token的單價，在這個調(diào)用量激增、鏈路無限延伸的Agent爆發(fā)周期，已經(jīng)變成了每一個用戶都無法忽視的成本因素。

Agent大航海時代，Token收費(fèi)這筆賬，值得每一個廠商認(rèn)真盤一盤。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.