網易首頁 > 網易號 > 正文申請入駐

利潤腰斬也要卷AI！小米模型永久降價99%，雷軍還要再砸600億

2026-05-27 13:21:42　來源: AI前線

北京舉報

分享至

作者 | 華衛

今日，小米宣布永久性翻新整個模型定價體系。價格調整公告稱，MiMo-V2.5 系列 API 實施永久降價，最高降幅達 99%，于北京時間 5 月 27 日 0：00 正式生效且全球同步。

繼 DeepSeek 之后，小米成為又一家宣布 API 永久降價的大模型廠商。然而，在大方地向全球開放模型訪問的同時，小米剛剛發布的 2026 年 Q1 財報卻顯示利潤腰斬、營收下滑。

降價力度空前，不限上下文、

Token 額度翻至 8 倍

此次價格調整覆蓋 MiMo-V2.5 和 MiMo-V2.5 Pro 兩個版本，與原 API 定價相比，新定價最高可減少 99%，且不再根據輸入長度進行區分。

具體來看，MiMo-V2.5 Pro 的輸入緩存命中價格降至 0.025 元 / 百萬 tokens，相較于原價≤256k 規格 1.40 元降幅達 98%，對比 256k-1M 規格 2.80 元降幅更是觸及 99%；輸入未命中緩存定價 3.000 元 / 百萬 tokens，較原價 7.00 元下降 57%，對比長窗口原價 14.00 元降幅 79%；輸出定價 6 元 / 百萬 tokens，相較原價 21 元、42 元分別下降 71% 與 86%。

MiMo-V2.5 的輸入緩存命中價格降至 0.02 元 / 百萬 tokens，較≤256k 原價 0.56 元降幅 96%，較 256k-1M 原價 1.12 元降幅 98%；輸入未命中緩存定價 1.000 元 / 百萬 tokens，相比原價 2.80 元降幅 64%，對比長窗口原價 5.60 元降幅 82%；輸出定價 2 元 / 百萬 tokens，較原價 14 元、28 元分別下滑 86% 與 93%。

除了 API 價格下調外，MiMo 的 Token Plan 計費體系也同步迎來重大優化：增加數量但不漲價，使用量提升到原來的 5-8 倍。在公告中，小米列出了調整后的詳細計費規則，如下：

此外，無論當前使用情況如何，所有已訂閱代幣計劃且仍在有效期內的用戶（包括參與 Quadrillion 代幣創建者激勵計劃并獲得代幣計劃的用戶，涵蓋 Apache 軟件基金會獨家福利的用戶）的積分配額于北京時間 5 月 27 日 0：00 完全重置，并根據新的計費規則實施。對于代幣計劃已過期的歷史付費用戶，小米準備了驚喜禮物，將在下周內公布。

值得注意的是，本次調價主要聚焦 MiMo-V2.5 核心系列，MiMo-V2.5-TTS 系列依舊保持限時免費接入政策，而 MiMo-V2-Pro 與 MiMo-V2-Omni 兩款高階模型 API 價格維持原價不變，同時其 Token Plan 套餐也不再參與調整并即將下線，引導開發者向高性價比的 V2.5 系列遷移。

據了解，MiMo-V2.5 系列的迭代由曾任職 DeepSeek 的 95 后 AI 技術人才羅福莉負責。在整個 MiMo 大模型產品矩陣中，MiMo-V2.5-Pro 主打高性能復雜推理，適配企業級智能體開發、深度業務分析等高階商用場景；MiMo-V2.5 聚焦輕量化通用需求，主打中小開發者日常調用與輕量化應用落地；MiMo-V2.5-TTS 則瞄準語音合成賽道，以免費策略搶占音頻生態入口。

營收利潤都跌麻了

雷軍：AI 還得再投 600 億

對于此次價格調整的原因，小米稱，這背后是其技術團隊對推理系統的持續優化。“我們完全支持基于 SGLang HiCache 的 SWA（滑動窗口注意力），將 KV 緩存在 GPU 內存、CPU 內存和 SSD 等多級存儲之間的數據傳輸量減少到優化前的近 7 分之一，并將可緩存 token 數量提升到優化前近 5 倍，顯著提升了緩存命中率和推理效率。同時，我們通過優化專家并行方案、輸入長度分桶策略等，進一步提升了集群的輸入吞吐量容量，持續降低每枚 token 的服務成本，同時確保服務質量。”

在公告中，小米還強調，“技術的價值最終在于其廣泛的使用。讓更多人使用更好的模型，這是 MiMo 堅定不移的使命。”

據了解，小米當前在 AI 方面的底層研發投入數額已然十分龐大。北京時間 5 月 26 日晚，小米發布了 2026 年第一季度財報（截止 2026 年 3 月）。在技術創新領域，小米本季度研發支出達 90 億元，同比增長 33.4%，研發團隊規模擴大至 26048 人。不過相較從 2025 年第四季度 96 億元的研發開支，這季度已經減少 6.7%，小米稱“主要是基于手機 xAIoT 相關的研發項目進度所致”。

然而，從整體財報數據來看，小米這季度的營收、毛利率、經營利潤、經調整利潤無論是同比還是環比都出現不同程度地下滑。一季度小米總收入錄得 991.4 億元，同比下跌 10.9%；經調整凈利潤也從 106.8 億元回落至 60.7 億元，跌幅達 43.1%；毛利為 218.1 億元，同比下跌 14.2%。經營利潤承壓更為嚴重，從去年同期的 131.3 億元大跌 59.5% 至 53.1 億元。

盡管如此，小米仍計劃持續加大 AI 領域的資金投入。就在昨日，小米創始人雷軍表示，“Xiaomi MiMo-V2.5-Pro 躋身 Artificial Analysis 榜單綜合智能指數、Agent 指數全球開源模型并列第一。小米今年 AI 投入至少 160 億元，未來三年在 AI 領域計劃投入 600 億元。”

國內外 AI 定價分化，

海外網友：疑惑但“我選中國模型”

在小米宣布降價前不久，國內另一頭部大模型公司 DeepSeek 已先一步開啟“永久降價”。該公司宣布，DeepSeek-V4-Pro 模型 API 價格在 5 月 31 日結束 2.5 折的限時優惠后，永久調整為原定價的 1/4。調價后，這一模型的輸入緩存命中 0.025 元 / 百萬 tokens、未命中緩存 3 元 / 百萬 tokens、輸出 6 元 / 百萬 tokens，相較原價實現 75% 的降幅。

實際上，在 4 月 24 日上線并同步開源后，DeepSeek V4-Pro 模型的原價只維持了兩天。4 月 26 日，DeepSeek 就宣布限時 2.5 折優惠，優惠期截至 5 月 5 日。4 月 28 日，該公司又宣布將優惠期延長至 5 月 31 日。現在，定價直接降至了原來的 1/4。如今，DeepSeek V4-Pro 的調用價格，已經低得有些“離譜”了，比 GPT-5.5 便宜 34 倍。

有海外網友表示，“我已經迫不及待想搭建一個大模型集群，用上百個 DeepSeek 和 Mimo 模型協同運行。如今真是技術狂飆的時代。”網友們表示，“在人工評測榜單上，小米 MiMo 僅比 Opus 低 3 分，價格便宜了百倍以上，性能差距卻微乎其微。即便只是 DeepSeek V4 Flash（還不是 Pro 版），調到高性能檔位后，能力基本比肩 Claude Opus 4.7，響應速度極快，成本還極低。連續對話數小時，花費也才幾美分。”

還有人指出，“除了 Deepseek 和小米，現在很多 AI 實驗室都會騙你緩存讀取。如果你為緩存讀取花了不少錢，實際上是在為幾秒鐘的顯存時間付出高昂的代價。自回歸語言建模的本質在于，每一個輸出 token 都會‘讀取’緩存。所以原則上，緩存命中的價格下限是 1 個輸出 token 的固定成本。但實際上，情況可能不止于此，因為你用緩存占用了顯存，迫使其他用戶退出。”

“所有美國公司（OpenAI、Anthropic、Google、MS Copilot）最近都漲價了，而中國公司則在降價。問題是，他們是怎么做到的？按理說，他們本應因芯片制裁更吃力才對。其次，為什么是現在？原本美國公司也被認為會通過補貼來維持競爭力，但現在他們已經跟不上了。大家都在轉向按使用量計費的模式，這對他們來說似乎不可持續。畢竟他們的資金也很充足。如果真的存在能夠降低算力需求的硬件突破，我相信這對全世界來說都是一件好事。“有海外網友發出疑問。

據了解，除小米與 DeepSeek 外，國內的阿里云通義千問、字節跳動豆包等通用型大模型相繼下調 API 調用價格。

今年以來，全球在線 AI 托管平臺 OpenRouter 上，中國大模型連續占據前列，包括小米 MiMo 、階躍星辰 Step 3.5 Flash、MiniMax、DeepSeek、Kimi 等。而 OpenRouter 的“霸榜”邏輯無非是，在 API 夠用的情況下，調用成本越低廉，調用總量排名就越高。

“借助中國模型，誰都能用上高性價比的 AI 服務。”有網友說道，“當前美國 AI 公司幾乎沒有機會收回哪怕一小部分估值。”

聲明：本文為 AI 前線整理，不代表平臺觀點，未經許可禁止轉載。

會議推薦

但企業級 Agent 落地，繞不開 4 個真實的工程問題。如何在 Agent 安全性和可用性之間找到平衡點？Agent 需要什么樣的記憶系統才能真正理解上下文？如何通過算法壓榨實現智力增量與成本控制的極致平衡？多 Agent 協作，如何做到可觀測、可治理、可控制？6 月 26-27 日，AICon 全球人工智能開發與應用大會·上海站國內頭部公司的 Agent 實踐，一次說透。

今日薦文

你也「在看」嗎？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.