![]()
“我會建議所有LLM公司,在搞清楚‘coding plan怎么定價不虧錢’之前,不要盲目打價格戰(zhàn)。”近日,小米集團(tuán)MiMo負(fù)責(zé)人羅福莉在X平臺發(fā)文,談及針對眼下的Token定價問題發(fā)表看法。
讓羅福莉下場發(fā)聲的由頭很簡單:Anthropic在近期調(diào)整了產(chǎn)品策略,不再允許用Claude訂閱運(yùn)行OpenClaw。
本月4日起,Claude的Pro和Max訂閱不再覆蓋OpenClaw等第三方框架,用戶如果還要繼續(xù)使用這些智能體,只能改為通過API按量付費(fèi)或購買額外使用額度。
Claude官方解釋稱:這類調(diào)用對系統(tǒng)造成了“遠(yuǎn)超預(yù)期的壓力”。
而幾乎在同一時間,MiMo也推出了自家的Token Plan。
“Claude Code的訂閱機(jī)制在計算資源分配上設(shè)計得非常漂亮。但我認(rèn)為它并不賺錢甚至可能虧損,除非API利潤率高出10到20倍。”在文中,羅福莉這樣分析道。
除了呼吁不打價格戰(zhàn),羅福莉的另一個核心觀點(diǎn)是:長期來看,Agent時代的模型正在迎接一個“被迫進(jìn)化”的過程,優(yōu)化上下文管理、復(fù)用已有計算結(jié)果、減少無效token消耗是接下來的迭代方向。
在她看來,Anthropic的這一步,正在推動整個生態(tài)向這個方向:讓高效的Agent和高效的模型協(xié)同進(jìn)化。
不過,面對Anthropic這一策略調(diào)整,也有人選擇了不買賬。
OpenClaw作者Peter Steinberger在X上直接開噴,他表示,曾嘗試與Anthropic溝通,但最終只爭取到一周的緩沖時間。
![]()
OpenClaw的廣大用戶群體無疑是這一輪調(diào)整的最大受害者,很多用戶訂閱Claude,本來就是為了運(yùn)行OpenClaw,而現(xiàn)在,這條路徑被直接切斷。
當(dāng)原本被認(rèn)為“高昂價格”的200美元的訂閱,突然間能跑出幾千美元的算力消耗,無疑是對廠商定價策略的一次考驗(yàn)。
另一方面,這并非是一句簡單的“Token調(diào)用變多了”就能解釋的現(xiàn)象。Agent正在重塑Token的調(diào)用邏輯,而背后這筆賬,算起來還真有點(diǎn)復(fù)雜。
01
600倍浮動下,模型該怎么定價
如果要用一個詞來解釋這場爭議的核心,那就是——波動,不可預(yù)測的波動。
南洋理工大學(xué)等團(tuán)隊(duì)在近期發(fā)布的研究《Beyond Max Tokens》顯示,在多輪工具調(diào)用的智能體場景中,同一個任務(wù)的計算消耗,可能出現(xiàn)最高658倍的差異。
一條看起來類似的任務(wù),有的幾千個計算單元就結(jié)束,有的則被拉到數(shù)萬甚至更高。這意味著,模型的成本不只是變得更高,而是不可預(yù)測。
“我仔細(xì)觀察過OpenClaw的上下文管理——做得不怎么樣。”
![]()
解構(gòu)羅福莉在X上的發(fā)言,你能發(fā)現(xiàn)和南洋理工這份研究的契合之處。羅福莉發(fā)現(xiàn),在OpenClaw的一個用戶請求里,往往會發(fā)起多輪低價值的工具調(diào)用,帶來了巨大的模型調(diào)用量的浪費(fèi)。
“真實(shí)成本很可能是訂閱價格的幾十倍。這不是差距——這是一個‘深坑’。”
羅福莉所說“深坑”,問題出在OpenClaw這類智能體的運(yùn)行方式:一個任務(wù)往往需要多輪嘗試和回退,很多計算并不會直接產(chǎn)生結(jié)果,但依然消耗資源。
但這個消耗資源的具體量級很難測算,這也是Claude選擇封禁掉訂閱接入Agent的渠道,而不是選擇新設(shè)立一個“合理”定價的訂閱套餐。
總而言之,隨著Agent生態(tài)加速演變,Token用量的“合理”范圍,壓根無法準(zhǔn)確預(yù)估。
“我們一直在努力滿足不斷增長的Claude需求,但我們的訂閱服務(wù)并非為這些第三方工具的使用模式而設(shè)計的。”談及這一次業(yè)務(wù)調(diào)整,Claude Code負(fù)責(zé)人Boris Cherny此前在X上這樣寫道。
他表示:“Token是一種我們謹(jǐn)慎管理的資源,我們將優(yōu)先考慮使用我們產(chǎn)品和API的客戶。”
對于這一調(diào)整帶來的影響,有業(yè)內(nèi)分析稱之為“自助餐已經(jīng)結(jié)束了”。OpenClaw開啟了Agent的大航海時代,但也推翻了此前的模型定價門檻。一個OpenClaw代理運(yùn)行一天,就可能消耗1000到5000美元的API成本。
“Anthropic正在承擔(dān)每個通過第三方接口用戶所產(chǎn)生的這部分差價,”增長營銷專家Aakash Gupta在X上寫道。“這就是一家公司眼睜睜看著利潤實(shí)時蒸發(fā)的速度。”
成本完全失控,這是Anthropic不得不立刻做出反應(yīng)的原因。
在Chatbot形態(tài)里,訂閱制之所以能延續(xù),是因?yàn)榭梢愿鶕?jù)歷史數(shù)據(jù),統(tǒng)計出一個代表大部分用戶的用量均值:輕度用戶覆蓋重度用戶,整體成本可以被攤平。
但在Agent場景中,這種結(jié)構(gòu)被打破。重度使用不再是個例,而是由產(chǎn)品形態(tài)本身決定的結(jié)果。只要模型開始“執(zhí)行任務(wù)”,就必然會出現(xiàn)長鏈路調(diào)用、上下文膨脹和重復(fù)嘗試。
類似的變化,其實(shí)已經(jīng)在其他產(chǎn)品中出現(xiàn)。此前當(dāng)Cursor在調(diào)整定價時,就從“按請求次數(shù)計費(fèi)”轉(zhuǎn)向“按實(shí)際Token成本折算的額度”,原因同樣是長鏈路任務(wù)帶來的成本差異,已經(jīng)無法用固定配額衡量。
不過,用Token作為唯一定價、實(shí)算實(shí)銷的方式雖然看起來很科學(xué),但是也帶來了新的問題,Agent鏈路下Token用量不確定性依然存在,如果完全用實(shí)際Token用量核算,相當(dāng)于把這種不確定性轉(zhuǎn)嫁給了用戶。
因此,當(dāng)Anthropic發(fā)表聲明后,用戶不買賬的聲音也此起彼伏。
X上有許多用戶表示,切換到API計費(fèi)跑OpenClaw成本會嚴(yán)重攀升,使得他們不得不考慮其他途徑。
而已經(jīng)被OpenAI“收編”的OpenClaw創(chuàng)始人Steinberger,在X上“開噴”也帶了一絲叫板的意味。
有外媒分析,OpenAI似乎正在將自己定位為一個更“易于上手”的替代方案,并可能利用這一契機(jī),從不滿的Claude高級用戶那里獲取客戶。
知名媒體Axios此前在報道中披露,曾有一位行業(yè)資深人士表示,“Anthropic強(qiáng)調(diào)訓(xùn)練和運(yùn)行模型的效率,而OpenAI的心態(tài)是,CEO奧特曼總能籌集到更多資金來支持計算規(guī)模的擴(kuò)展。”
這場爭論的結(jié)局尚未可知,但毫無疑問的是,在2026年的AI領(lǐng)域,第三方自動化獲得補(bǔ)貼、無限計算能力的時代已經(jīng)結(jié)束。
不管采用哪種計費(fèi)邏輯,更謹(jǐn)慎、更細(xì)化的Token收費(fèi)模式已在路上。
02
配額不是唯一出路,但已是眼下最優(yōu)解
進(jìn)一步討論定價問題前,有必要先解釋下目前模型產(chǎn)品的主流計費(fèi)模式。
目前主流模型廠商大致形成“三層計費(fèi)結(jié)構(gòu)”。第一層是訂閱制,面向個人用戶,如ChatGPT Plus、Claude Pro、Gemini Advanced,按月收費(fèi),提供更強(qiáng)模型與更高調(diào)用上限,但通常伴隨速率與用量限制。
第二層是API按量計費(fèi),以O(shè)penAI、Anthropic、Google以及國內(nèi)火山引擎、阿里云、智譜等公司,按token或等價計算量收費(fèi),是開發(fā)者與企業(yè)的核心結(jié)算方式。
在此之上,各家又推出Coding Plan/Token Plan等套餐,作為訂閱與按量之間的過渡形態(tài):用戶按月付費(fèi)獲得一定額度與優(yōu)先權(quán),但超額仍需按量付費(fèi),并伴隨公平使用與限流機(jī)制。
在Agent場景中,這一分層尤為關(guān)鍵,自動化調(diào)用大都只支持API按量計費(fèi),訂閱與套餐難以覆蓋高強(qiáng)度、多輪調(diào)用的算力消耗。而大部分“訂閱模式”只針對一般用戶的Chatbot和內(nèi)嵌Agent功能。
隨著Anthropic針對Openclaw切換計費(fèi)方式,其他廠商也相繼做出反應(yīng),是更直接的——漲價。
過去幾周時間里,一輪集中調(diào)價出現(xiàn)在國內(nèi)AI云廠商中。
騰訊云此前宣布,自上月13日起結(jié)束部分模型的免費(fèi)公測,并轉(zhuǎn)為正式收費(fèi),同時對混元系列模型進(jìn)行大幅調(diào)價,部分價格漲幅超過400%。
隨后,阿里和百度方面也發(fā)布公告,本月月中開始上調(diào)AI算力和存儲價格,整體漲幅在5%—30%區(qū)間。
而在幾天前智譜的財報電話會議上,CEO張鵬披露,2026年一季度接口調(diào)用價格提升了83%,但調(diào)用量仍然增長400%。
接連幾家AI云廠商漲價,說明了一件事:模型需求的增長來得太快,甚至廠商的基建層都倍感壓力。
這一點(diǎn)在羅福莉的發(fā)文中也有體現(xiàn):“更宏觀地看:全球的算力供給,跟不上agent帶來的token需求增長。”真正的出路,不是更便宜的token,而是模型和Agent的‘協(xié)同進(jìn)化’。”
只是,在更高效的模型+Agent架構(gòu)面世之前,漲價或者限制訂閱,并不能解決這套計費(fèi)邏輯中的核心矛盾。
從用戶視角看,購買的是“任務(wù)完成”;但從模型廠商的視角,計量的是“計算過程”。
這兩者之間,目前存在著明顯的錯位。走訂閱,廠商要承擔(dān)Token調(diào)用不穩(wěn)定的風(fēng)險;走API,這個風(fēng)險又來到了用戶身上。
這也是為什么“訂閱+配額+API”的組合,同時出現(xiàn)在了各大廠商的落地方案中。
在Harness/Coding場景下,各類plan本質(zhì)上是一種用戶與模型廠商之間的相互妥協(xié):廠商通過Coding/Token Plan套餐鎖定一部分額度,換取用戶側(cè)的價格確定性,同時用限流和規(guī)則控制風(fēng)險。
但在OpenClaw這類更不受控的agent場景中,調(diào)用強(qiáng)度和路徑都難以約束,這種“妥協(xié)”很難成立,廠商們更多選擇 API按量計費(fèi)。
訂閱負(fù)責(zé)輕量使用,配額限制極端消耗,超額部分按量計費(fèi)。本質(zhì)上,這是一種對不確定性的緩沖機(jī)制。
![]()
不過,Token計價也并不是唯一的解法,行業(yè)內(nèi)已經(jīng)在探索一些“另類”的模型收費(fèi)模式。
一類是按任務(wù)收費(fèi)。比如Anthropic在Claude Code中推出的Code Review功能,直接按一次PR審查計價,單次review平均成本在15–25美元,并隨代碼規(guī)模和復(fù)雜度浮動。
二是按結(jié)果收費(fèi),已經(jīng)在企業(yè)側(cè)落地,比如智能客服、RPA廠商按“問題解決”或“流程完成”計價;還有一種是按時間收費(fèi),比如xAI的語音agent按運(yùn)行時長計費(fèi),約0.05美元/分鐘)。
幾天前,在火山引擎武漢站巡展活動中,當(dāng)字母AI問及“面對模型調(diào)用激增、Token消耗存在不確定性的現(xiàn)狀,模型廠商該如何優(yōu)化定價策略?”時,火山引擎總裁譚待這樣回應(yīng):
“目前OpenClaw這類通用型平臺適合按Token收費(fèi),因?yàn)槠鋺?yīng)用場景廣泛,無法統(tǒng)一定義效果和成本。”譚待同時表示,未來可能會孵化出垂直領(lǐng)域的智能體,如客服智能體,就可以按回答問題的數(shù)量收費(fèi)。“類似線下找客服的模式,按效果付費(fèi)。”
“(Anthropic的這一步)大概率是一件好事。Agent時代不屬于消耗最多算力的人,而屬于最會使用算力的人。”在那篇發(fā)文最后,羅福莉這樣總結(jié)道。
顯然,圍繞Token收費(fèi)的爭論還將持續(xù)下去,這一爭論將取決于未來模型-Agent在效率層面的迭代情況。
我們可以確定的是,過去一度被壓到幾厘錢每Token的單價,在這個調(diào)用量激增、鏈路無限延伸的Agent爆發(fā)周期,已經(jīng)變成了每一個用戶都無法忽視的成本因素。
Agent大航海時代,Token收費(fèi)這筆賬,值得每一個廠商認(rèn)真盤一盤。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.