網易首頁 > 網易號 > 正文申請入駐

小米MiMo萬億模型開源，MIT商用自由，綜合實力難敵DeepSeek

2026-04-29 14:21:49　來源: 魏家東

北京舉報

分享至

2026年4月底，小米悄然甩出AI大模型領域的重磅炸彈——正式開源MiMo-V2.5與MiMo-V2.5-Pro兩款模型。前者主打原生多模態能力，適配圖文音等多場景交互；后者專攻長周期一致性與復雜軟件工程，瞄準AI智能體（Agent）高強度任務需求。更關鍵的是，兩款模型均采用MIT寬松許可證，企業可免費商用、自由修改，還能部署在本地或私有云，無額外授權門檻。

這波操作直接攪動國產大模型格局：Pro版在GDPVal-AA（Elo）基準拿下1581分，力壓KimiK2.6、GLM5.1；能4.3小時從零寫完整編譯器、11.5小時開發全功能視頻編輯器。但光鮮背后，爭議也隨之而來——定價不占優勢、長鏈推理短板、營銷感過重等聲音不斷。本文就從技術亮點、硬核實測、定價邏輯、爭議與行業影響五大維度，拆解小米這款“超速迭代”的模型到底成色幾何。

一、雙模型定位：多模態基座VS長任務旗艦

小米此次開源的兩款模型，定位清晰、分工明確，覆蓋從通用交互到專業工程的全場景需求，背后是“為Agent時代造模型”的核心思路。

MiMo-V2.5：輕量化多模態全能手

作為基礎模型，MiMo-V2.5核心是原生多模態能力，總參數310B、激活參數15B，采用稀疏專家混合（MoE）架構。訓練分五大階段：48萬億token文本預訓練打牢語言根基，再對齊自研音視頻編碼器，接著做多模態預訓練、擴展上下文至1Mtoken，最后用強化學習（RL）和多模態偏好優化（MOPD）提升感知能力。

簡單說，它擅長“感知與溝通”——能看懂圖片、聽懂語音、理解長文本，適合聊天交互、內容創作、簡單工具調用等通用場景，推理速度快、延遲低，對日常用戶友好。

MiMo-V2.5-Pro：1.02T參數的長任務“工程大師”

Pro版是小米當前最強模型，總參數1.02T、激活參數42B，同樣為MoE架構，主打“長周期一致性”與復雜軟件工程。它的訓練重點不是感官對齊，而是注入“腳手架意識”（harnessawareness）——能主動管理記憶、塑造上下文，在數千次連續工具調用中不失憶、不跑偏。

技術上有兩大核心設計：一是6:1混合注意力，局部滑動窗口注意力+全局注意力，窗口128token，KV-cache存儲減少7倍，能聚焦15%關鍵上下文；二是3層多Token預測（MTP），推理速度提升3倍，加速強化學習訓練。上下文最高支持100萬token，專門適配OpenClaw、NanoClaw等Agent框架的高強度任務。

二、硬核實測：4小時干完美式本科畢設，AI工程能力拉滿

小米最有說服力的，不是冰冷的參數，而是三個顛覆行業認知的實測案例——把AI從“聊天機器”變成“能獨立干活的工程師”。

案例1：4.3小時搞定編譯器，滿分通關

北大計算機系《編譯原理》課程的SysY編譯器項目，本科生通常要數周才能完成，包括詞法分析（lexer）、語法分析（parser）、RISC-V匯編后端等全流程。MiMo-V2.5-Pro僅用4.3小時，調用672次工具，從零實現完整編譯器，在隱藏測試集拿下233/233滿分，全程無人類干預、無崩潰、無邏輯錯誤。

案例2：11.5小時開發全功能視頻編輯器

更夸張的是，Pro版自主工作11.5小時，調用1868次工具，生成8192行代碼的桌面視頻編輯器。具備多軌時間線、剪輯、特效、導出流水線等完整功能，相當于獨立完成一個中型桌面應用開發，全程無需人類指導或糾錯。

案例3：研究生級EDA優化，指標提升22倍

在臺積電180nm工藝的FVF-LDO穩壓器優化任務中（研究生級工程題），Pro版通過反復迭代ngspice仿真循環，將線性調整率等核心指標提升22倍，遠超初始方案，展現出在專業工程領域的迭代優化能力。

這些案例的核心，正是小米強調的“腳手架意識”——普通模型調用幾十次工具就會失憶、邏輯斷裂，而Pro版能在數千次工具調用中維持上下文一致性，像人類工程師一樣分步拆解、逐步調試、持續優化。

三、定價與Token效率：海外價高，性價比看實際消耗

開源之外，商業化定價是開發者最關心的問題。小米采用“分層定價+超長上下文溢價”策略，覆蓋國內外市場，核心特點是“緩存未命中貴、超長上下文翻倍”。

海外定價（美元/百萬token）

普通上下文（≤256K）：輸入$1.00，輸出$3.00

超長上下文（256K-1M）：輸入$2.00，輸出$6.00

國內定價：橫向對比不便宜

橫向看國內主流開源模型，MiMo價格不占優勢：DeepSeek、智譜GLM、Kimi等模型，同級別API價格普遍低于MiMo，部分還提供免費額度或低價套餐。

性價比關鍵：Token效率比單價更重要

但小米的底氣在于Token效率——Agent任務（如編程、工具調用）的成本，核心看“完成同等任務消耗的token數”，而非單價。ArtificialAnalysis測評顯示：

MiMo-V2.5-Pro比KimiK2.6節省42%token

MiMo-V2.5比MetaMuseSpark節省50%token

簡單說：單價貴，但干同樣的活消耗更少token，長期使用總成本未必高。尤其Agent模式下，token消耗是普通聊天的幾十倍，效率直接決定成本。

行業背景是AI推理補貼時代終結：微軟GitHubCopilot轉向按token計費，不再無限訂閱；Anthropic、OpenAI也收緊補貼，“低價無限用”的時代一去不返。對企業來說，“省錢”的核心不再是找低價模型，而是找“高效+穩定”的模型，MiMo精準踩中這一需求。

四、爭議與短板：長鏈推理弱，營銷感引反感

高光之下，MiMo-V2.5-Pro也暴露明顯短板，用戶吐槽集中在三大問題，甚至有開發者直言“小米現在做一切都是為了營銷模型和賣token”。

短板1：長鏈推理“自我糾錯”能力不足

實測中，面對隱秘非報錯bug（如數據處理腳本的邏輯漏洞），Pro版和多數國產模型一樣查不出，而GPT、Claude能穩定發現。更關鍵的是：沒有明確錯誤反饋時，無法自主思考排查，需要人類精準指出方向才能定位問題，而DeepSeekV4Pro只需提示檢查范圍就能發現問題。

用戶評價一針見血：“MIMO推理預算被限制厲害，長鏈推理訓練不足，靠自己憑空思考表現差”。

短板2：價格不占優，免費期后用戶流失

國內市場，MiMo定價高于DeepSeek、GLM等同級別模型，免費試用結束后，用戶使用占比持續下降。對中小企業和個人開發者來說，“效率優勢”不足以抵消“高價”的顧慮，尤其非高強度Agent任務時，低價模型更劃算。

短板3：營銷感過重，“羅福莉出鏡”引反感

模型發布節奏“一月一更”，核心負責人羅福莉頻繁公開露面、接受采訪，被質疑過度營銷。有用戶吐槽：“小米現在做AI，不是為了技術落地，而是為了營銷產品、賣token，太急功近利”。這種“流量優先”的打法，讓部分技術向開發者產生抵觸情緒，影響口碑沉淀。

五、行業影響：國產Agent模型崛起，開源商業化加速

小米MiMo-V2.5系列的開源，絕非“又一個國產模型”那么簡單，而是國產大模型從“追參數”到“拼落地”的轉折點，對行業有三大深遠影響。

1.國產Agent模型躋身全球第一梯隊

此前，Agent能力被Claude、GPT等閉源模型壟斷，國產模型多停留在“聊天、寫文案”階段。MiMo-V2.5-Pro的出現，證明國產模型在長周期任務、復雜軟件工程領域能與國際頂模正面競爭，甚至在部分場景（如編譯器開發）表現更優。加上DeepSeek、智譜GLM等選手，國產Agent模型已形成“第一梯隊”，打破海外壟斷。

2.MIT開源推動國產模型商業化落地

寬松的MIT許可證是關鍵一步——允許商用、自由修改、本地部署，解決企業“數據隱私、授權成本、定制化”三大痛點。此前，國產模型多采用非商用或嚴格授權協議，企業不敢用、不能用。MiMo的開源策略，有望帶動更多國產模型轉向“商用友好”，加速AI在企業端的落地。

3.Agent賽道成競爭核心，Token效率成勝負手

小米、DeepSeek、智譜等玩家的發力方向一致：放棄“通用聊天”內卷，主攻Agent智能體賽道。未來，大模型的競爭不再是“誰參數大、誰跑分高”，而是“誰能更高效、更穩定地完成復雜長任務”。Token效率、長上下文一致性、工具調用穩定性，將成為模型的核心競爭力，直接決定企業使用成本與落地價值。

小米MiMo-V2.5系列的開源，是國產AI大模型發展的重要里程碑——它用硬核實測證明，國產模型在長周期復雜任務上能比肩國際頂模；用MIT開源協議，為企業商用落地掃清障礙；用Token效率優勢，回應行業“降本增效”的核心需求。

但短板同樣明顯：長鏈推理能力不足、定價偏高、營銷感過重，這些問題不解決，難以從“現象級模型”變成“行業標配”。未來，小米需要平衡“技術迭代”與“口碑沉淀”，減少過度營銷，聚焦打磨模型核心能力；同時優化定價策略，讓更多中小企業用得起、用得好。

AI智能體時代已來，大模型的競爭才剛剛開始。MiMo-V2.5系列的亮相，不是終點，而是國產模型“從技術追趕走向生態引領”的新起點。接下來，能否把“硬核能力”轉化為“落地價值”，能否在全球競爭中站穩腳跟，時間會給出答案。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.