![]()
智東西
作者|江宇
編輯|李水青
DeepSeek剛宣布API永久降價,小米也跟了。
智東西5月27日,今日,小米正式宣布MiMo-V2.5系列API價格永久下調,并同步升級新版Token Plan計費體系。相比原始定價,新價格最高降幅達到99%,且不再區分上下文窗口長度。
![]()
▲MiMo-V2.5系列API價格永久下調(圖源:小米)
![]()
▲小米MiMo新版Token Plan計費體系:定價不變/Credits大幅提升(圖源:小米)
就在幾天前,DeepSeek剛剛宣布:從6月1日起,DeepSeek-V4-Pro當前促銷價將直接轉為正式價格,不再恢復原價。此前,DeepSeek已將V4-Pro API價格降至2.5折,并把輸入緩存命中價格進一步壓到原價1/10。
短短一周內,兩家國產大模型廠商先后選擇“永久降價”,國內API價格戰再次升溫。
而這一次,小米MiMo幾乎直接對標了DeepSeek當前API的價格。更新后的價格表顯示,更新后的價格顯示,MiMo-V2.5輸入緩存命中價格已經降至0.02元/百萬tokens,未命中輸入為1元/百萬tokens,輸出價格為2元/百萬tokens;MiMo-V2.5-Pro則分別為0.025元、3元和6元。
![]()
▲DeepSeek與小米MiMo API價格對比表(智東西制表)
值得注意的是,MiMo此次還取消了此前按上下文長度區分價格的策略。無論是256K還是1M上下文窗口,均統一采用同一價格。
昨日,我們深度梳理并對比過國內外數十家主流大模型廠商的訂閱制套餐與API調用計費。
其中,DeepSeek選擇“永久降價”,阿里則暫停了Coding Plan中的Lite低價套餐,字節下架低價Coding Plan,智譜2026年一季度API調用定價提升83%。不完全統計,近半年至少已有小米、字節、阿里、智譜和騰訊等5家國產大模型廠商,對自家套餐體系進行過明顯調整。部分廠商開始縮減低價套餐、減少額度,整體價格有所上漲。
有意思的是,就在不久前,小米MiMo大模型負責人羅福莉還曾公開“開懟”行業價格戰。但另一邊,小米MiMo又靠著“100萬億Token免費計劃”,一度沖上Hermes全球調用量第一。
![]()
▲羅福莉在X上的發文部分截圖(圖源:X)
如今,小米MiMo也正式加入了這場長期價格戰。
一、Token Plan大改版:套餐容量提升5-8倍
除了API永久降價,這次變化最大的,其實是Token Plan套餐體系。
小米稱,新版計費規則進行了重新梳理,在價格不變的情況下,套餐Credits大幅提升,用量普遍達到原來的5-8倍。
從我們梳理的國內主流大模型訂閱制套餐來看,小米此次調整后,入門檔方面,小米Lite套餐與Kimi、字節、階躍星辰等廠商的最低檔位接近,但并不是市場最低,騰訊混元Hy目前仍有28元/月的Lite檔。
而高階檔方面,小米Max套餐也并非最高。目前阿里尊享版達到1398元/月,字節Agent Plan Max檔位為950元/月,MiniMax Ultra極速版則接近750元/月。
![]()
▲國內大模型訂閱制套餐價格對比(智東西制表,統計截止時間為:2026/05/27)
與此同時,小米還公布了新版Credits與Token換算關系,并公開給出了高緩存命中場景下,不同套餐大致對應的實際Token規模。
![]()
![]()
▲小米MiMo Credits與Token換算關系
按照小米給出的95%以上緩存命中場景測算,如果使用MiMo-V2.5,39元Lite套餐理論上已經可以跑到5億Token以上,99元Standard檔位超過13億Token,329元Pro檔位達到47億Token以上,659元Max檔位則突破100億Token。
即便是更貴的MiMo-V2.5-Pro,在高緩存命中場景下,39元Lite檔位也能達到1.9億Token以上,99元套餐超過5億Token,329元檔位約18億Token,659元Max檔位則接近40億Token。
小米特別強調,在Agent與Code類場景下,由于緩存命中率通常更高,實際可使用Token數量會明顯增加。
小米“百萬億Token創造者激勵計劃”也一度引發開發者圈關注。小米披露,截至5月26日下午4點08分,100T Tokens已經全部提前發放完畢,活動提前收官。所有當前仍在有效期內的Token Plan用戶,無論此前套餐已經使用到什么程度,其Credits額度都將在5月27日0點全部重置,并自動切換至新計費規則。
針對已經過期的歷史付費用戶,小米后續也將提供額外福利。
二、小米為什么敢降價?推理系統上的持續優化
這次小米也專門解釋了背后的推理優化方案。
小米團隊基于SGLang HiCache完整支持SWA(Sliding Window Attention),將KV Cache在GPU顯存、CPU內存、SSD等多級存儲間的數據搬運量降低至優化前的約1/7,可緩存Token數量提升至約5倍。與此同時,小米還優化了專家并行方案、輸入長度分桶策略等機制,進一步提升集群輸入吞吐能力,從而降低單位Token成本。
簡單來說,小米這次的核心邏輯其實和DeepSeek類似:一邊是更激進的緩存命中策略,一邊是更高的推理吞吐效率。
價格戰背后,本質仍然是推理系統與基礎設施能力的競爭。
三、模型能力進入前排后,小米MiMo補上價格牌
今年4月23日,小米正式開啟Xiaomi MiMo-V2.5系列大模型公測,推出MiMo-V2.5、V2.5-Pro、V2.5-TTS Series以及V2.5-ASR等多個版本。其中,MiMo-V2.5-Pro重點面向Agent、復雜軟件工程以及長程任務等場景。
目前,MiMo-V2.5-Pro在Artificial Analysis綜合智能榜中位列全球開源模型并列第一,同時進入全球大模型總榜前五;其Agent指數同樣位列全球開源模型并列第一。
4月28日,小米進一步將MiMo-V2.5系列以MIT協議正式開源,支持商用部署與二次訓練,無需額外授權。
而真正讓MiMo在開發者圈快速出圈的,還是此前那輪“100萬億Token免費計劃”。
5月9日,Hermes Agent(“愛馬仕”)首次超越OpenClaw(“龍蝦”),登頂OpenRouter全球應用調用量榜首。當時,Hermes月調用量排名前五的模型中,MiMo-V2-Pro排在第一,后面依次是MiniMax M2.7、英偉達Nemotron 3 Super、階躍星辰Step 3.5 Flash以及騰訊Hy3 preview。
不過,榜單變化也非常快。
截至5月27日上午9點,OpenRouter本周調用榜中,MiMo-V2.5-Pro位列第十四;
![]()
▲OpenRouter本周調用榜(截至5月27日上午9點)
在Hermes Agent模型月調用榜里,MiMo-V2-Pro也已從此前榜首掉到第16名。
![]()
▲(圖源:OpenRouter)
目前排名前三的分別是DeepSeek-V4-Flash、匿名模型Owl Alpha以及DeepSeek-V4-Pro。
![]()
▲(圖源:OpenRouter)
某種程度上,這也能看出當前國內大模型競爭的激烈程度:一邊是榜單和調用量變化越來越快,另一邊,則是價格戰開始直接靠攏DeepSeek的“地板價”。
結語:營收利潤雙降后,小米還是下場打起了價格戰
價格戰之外,小米昨日的財報,也讓這輪降價多了一層“大放血”的意味。一季度,小米營收991億元,同比下降10.9%;經調整凈利潤61億元,同比下降43.1%。
另一邊,小米對AI的投入并沒有放緩。財報顯示,其當季研發開支達到90億元,同比增長33.4%;截至2026年3月31日,小米研發人員數量達到26048人,創下歷史新高。
小米管理層也在財報會上頻繁提到AI。當被問到雷軍此前提出的160億元AI投資計劃時,小米集團CFO林世偉認為未來對于AI的投資計劃會根據AI業務的發展狀況進行調整,預期會有所上漲。
盧偉冰則專門提到,在當前內存上漲周期里,“抓住AI非常重要”。
從MiMo開源、100萬億Token免費計劃,到沖擊OpenRouter Agent榜單,再到如今直接跟進DeepSeek永久降價,小米過去一個多月在AI上的動作明顯頻繁。而隨著國內模型價格繼續下探,這場競爭也已經不只是模型能力本身的比拼,背后更是一場圍繞推理系統、算力效率以及長期資金投入的持續消耗戰。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.