![]()
作者 | 華衛
今日,小米宣布永久性翻新整個模型定價體系。價格調整公告稱,MiMo-V2.5 系列 API 實施永久降價,最高降幅達 99%,于北京時間 5 月 27 日 0:00 正式生效且全球同步。
![]()
繼 DeepSeek 之后,小米成為又一家宣布 API 永久降價的大模型廠商。然而,在大方地向全球開放模型訪問的同時,小米剛剛發布的 2026 年 Q1 財報卻顯示利潤腰斬、營收下滑。
降價力度空前,不限上下文、
Token 額度翻至 8 倍
此次價格調整覆蓋 MiMo-V2.5 和 MiMo-V2.5 Pro 兩個版本,與原 API 定價相比,新定價最高可減少 99%,且不再根據輸入長度進行區分。
具體來看,MiMo-V2.5 Pro 的輸入緩存命中價格降至 0.025 元 / 百萬 tokens,相較于原價≤256k 規格 1.40 元降幅達 98%,對比 256k-1M 規格 2.80 元降幅更是觸及 99%;輸入未命中緩存定價 3.000 元 / 百萬 tokens,較原價 7.00 元下降 57%,對比長窗口原價 14.00 元降幅 79%;輸出定價 6 元 / 百萬 tokens,相較原價 21 元、42 元分別下降 71% 與 86%。
MiMo-V2.5 的輸入緩存命中價格降至 0.02 元 / 百萬 tokens,較≤256k 原價 0.56 元降幅 96%,較 256k-1M 原價 1.12 元降幅 98%;輸入未命中緩存定價 1.000 元 / 百萬 tokens,相比原價 2.80 元降幅 64%,對比長窗口原價 5.60 元降幅 82%;輸出定價 2 元 / 百萬 tokens,較原價 14 元、28 元分別下滑 86% 與 93%。
除了 API 價格下調外,MiMo 的 Token Plan 計費體系也同步迎來重大優化:增加數量但不漲價,使用量提升到原來的 5-8 倍。在公告中,小米列出了調整后的詳細計費規則,如下:
![]()
此外,無論當前使用情況如何,所有已訂閱代幣計劃且仍在有效期內的用戶(包括參與 Quadrillion 代幣創建者激勵計劃并獲得代幣計劃的用戶,涵蓋 Apache 軟件基金會獨家福利的用戶)的積分配額于北京時間 5 月 27 日 0:00 完全重置,并根據新的計費規則實施。對于代幣計劃已過期的歷史付費用戶,小米準備了驚喜禮物,將在下周內公布。
值得注意的是,本次調價主要聚焦 MiMo-V2.5 核心系列,MiMo-V2.5-TTS 系列依舊保持限時免費接入政策,而 MiMo-V2-Pro 與 MiMo-V2-Omni 兩款高階模型 API 價格維持原價不變,同時其 Token Plan 套餐也不再參與調整并即將下線,引導開發者向高性價比的 V2.5 系列遷移。
據了解,MiMo-V2.5 系列的迭代由曾任職 DeepSeek 的 95 后 AI 技術人才羅福莉負責。在整個 MiMo 大模型產品矩陣中,MiMo-V2.5-Pro 主打高性能復雜推理,適配企業級智能體開發、深度業務分析等高階商用場景;MiMo-V2.5 聚焦輕量化通用需求,主打中小開發者日常調用與輕量化應用落地;MiMo-V2.5-TTS 則瞄準語音合成賽道,以免費策略搶占音頻生態入口。
營收利潤都跌麻了
雷軍:AI 還得再投 600 億
對于此次價格調整的原因,小米稱,這背后是其技術團隊對推理系統的持續優化。“我們完全支持基于 SGLang HiCache 的 SWA(滑動窗口注意力),將 KV 緩存在 GPU 內存、CPU 內存和 SSD 等多級存儲之間的數據傳輸量減少到優化前的近 7 分之一,并將可緩存 token 數量提升到優化前近 5 倍,顯著提升了緩存命中率和推理效率。同時,我們通過優化專家并行方案、輸入長度分桶策略等,進一步提升了集群的輸入吞吐量容量,持續降低每枚 token 的服務成本,同時確保服務質量。”
在公告中,小米還強調,“技術的價值最終在于其廣泛的使用。讓更多人使用更好的模型,這是 MiMo 堅定不移的使命。”
據了解,小米當前在 AI 方面的底層研發投入數額已然十分龐大。北京時間 5 月 26 日晚,小米發布了 2026 年第一季度財報(截止 2026 年 3 月)。在技術創新領域,小米本季度研發支出達 90 億元,同比增長 33.4%,研發團隊規模擴大至 26048 人。不過相較從 2025 年第四季度 96 億元的研發開支,這季度已經減少 6.7%,小米稱“主要是基于手機 xAIoT 相關的研發項目進度所致”。
![]()
然而,從整體財報數據來看,小米這季度的營收、毛利率、經營利潤、經調整利潤無論是同比還是環比都出現不同程度地下滑。一季度小米總收入錄得 991.4 億元,同比下跌 10.9%;經調整凈利潤也從 106.8 億元回落至 60.7 億元,跌幅達 43.1%;毛利為 218.1 億元,同比下跌 14.2%。經營利潤承壓更為嚴重,從去年同期的 131.3 億元大跌 59.5% 至 53.1 億元。
盡管如此,小米仍計劃持續加大 AI 領域的資金投入。就在昨日,小米創始人雷軍表示,“Xiaomi MiMo-V2.5-Pro 躋身 Artificial Analysis 榜單綜合智能指數、Agent 指數全球開源模型并列第一。小米今年 AI 投入至少 160 億元,未來三年在 AI 領域計劃投入 600 億元。”
國內外 AI 定價分化,
海外網友:疑惑但“我選中國模型”
在小米宣布降價前不久,國內另一頭部大模型公司 DeepSeek 已先一步開啟“永久降價”。該公司宣布,DeepSeek-V4-Pro 模型 API 價格在 5 月 31 日結束 2.5 折的限時優惠后,永久調整為原定價的 1/4。調價后,這一模型的輸入緩存命中 0.025 元 / 百萬 tokens、未命中緩存 3 元 / 百萬 tokens、輸出 6 元 / 百萬 tokens,相較原價實現 75% 的降幅。
實際上,在 4 月 24 日上線并同步開源后,DeepSeek V4-Pro 模型的原價只維持了兩天。4 月 26 日,DeepSeek 就宣布限時 2.5 折優惠,優惠期截至 5 月 5 日。4 月 28 日,該公司又宣布將優惠期延長至 5 月 31 日。現在,定價直接降至了原來的 1/4。如今,DeepSeek V4-Pro 的調用價格,已經低得有些“離譜”了,比 GPT-5.5 便宜 34 倍。
有海外網友表示,“我已經迫不及待想搭建一個大模型集群,用上百個 DeepSeek 和 Mimo 模型協同運行。如今真是技術狂飆的時代。”網友們表示,“在人工評測榜單上,小米 MiMo 僅比 Opus 低 3 分,價格便宜了百倍以上,性能差距卻微乎其微。即便只是 DeepSeek V4 Flash(還不是 Pro 版),調到高性能檔位后,能力基本比肩 Claude Opus 4.7,響應速度極快,成本還極低。連續對話數小時,花費也才幾美分。”
還有人指出,“除了 Deepseek 和小米,現在很多 AI 實驗室都會騙你緩存讀取。如果你為緩存讀取花了不少錢,實際上是在為幾秒鐘的顯存時間付出高昂的代價。自回歸語言建模的本質在于,每一個輸出 token 都會‘讀取’緩存。所以原則上,緩存命中的價格下限是 1 個輸出 token 的固定成本。但實際上,情況可能不止于此,因為你用緩存占用了顯存,迫使其他用戶退出。”
“所有美國公司(OpenAI、Anthropic、Google、MS Copilot)最近都漲價了,而中國公司則在降價。問題是,他們是怎么做到的?按理說,他們本應因芯片制裁更吃力才對。其次,為什么是現在?原本美國公司也被認為會通過補貼來維持競爭力,但現在他們已經跟不上了。大家都在轉向按使用量計費的模式,這對他們來說似乎不可持續。畢竟他們的資金也很充足。如果真的存在能夠降低算力需求的硬件突破,我相信這對全世界來說都是一件好事。“有海外網友發出疑問。
據了解,除小米與 DeepSeek 外,國內的阿里云通義千問、字節跳動豆包等通用型大模型相繼下調 API 調用價格。
今年以來,全球在線 AI 托管平臺 OpenRouter 上,中國大模型連續占據前列,包括小米 MiMo 、階躍星辰 Step 3.5 Flash、MiniMax、DeepSeek、Kimi 等。而 OpenRouter 的“霸榜”邏輯無非是,在 API 夠用的情況下,調用成本越低廉,調用總量排名就越高。
“借助中國模型,誰都能用上高性價比的 AI 服務。”有網友說道,“當前美國 AI 公司幾乎沒有機會收回哪怕一小部分估值。”
聲明:本文為 AI 前線整理,不代表平臺觀點,未經許可禁止轉載。
會議推薦
但企業級 Agent 落地,繞不開 4 個真實的工程問題。如何在 Agent 安全性和可用性之間找到平衡點?Agent 需要什么樣的記憶系統才能真正理解上下文?如何通過算法壓榨實現智力增量與成本控制的極致平衡?多 Agent 協作,如何做到可觀測、可治理、可控制?6 月 26-27 日,AICon 全球人工智能開發與應用大會·上海站國內頭部公司的 Agent 實踐,一次說透。
今日薦文
你也「在看」嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.