![]()
2026年4月底,小米悄然甩出AI大模型領域的重磅炸彈——正式開源MiMo-V2.5與MiMo-V2.5-Pro兩款模型。前者主打原生多模態能力,適配圖文音等多場景交互;后者專攻長周期一致性與復雜軟件工程,瞄準AI智能體(Agent)高強度任務需求。更關鍵的是,兩款模型均采用MIT寬松許可證,企業可免費商用、自由修改,還能部署在本地或私有云,無額外授權門檻。
這波操作直接攪動國產大模型格局:Pro版在GDPVal-AA(Elo)基準拿下1581分,力壓KimiK2.6、GLM5.1;能4.3小時從零寫完整編譯器、11.5小時開發全功能視頻編輯器。但光鮮背后,爭議也隨之而來——定價不占優勢、長鏈推理短板、營銷感過重等聲音不斷。本文就從技術亮點、硬核實測、定價邏輯、爭議與行業影響五大維度,拆解小米這款“超速迭代”的模型到底成色幾何。
![]()
一、雙模型定位:多模態基座VS長任務旗艦
小米此次開源的兩款模型,定位清晰、分工明確,覆蓋從通用交互到專業工程的全場景需求,背后是“為Agent時代造模型”的核心思路。
MiMo-V2.5:輕量化多模態全能手
作為基礎模型,MiMo-V2.5核心是原生多模態能力,總參數310B、激活參數15B,采用稀疏專家混合(MoE)架構。訓練分五大階段:48萬億token文本預訓練打牢語言根基,再對齊自研音視頻編碼器,接著做多模態預訓練、擴展上下文至1Mtoken,最后用強化學習(RL)和多模態偏好優化(MOPD)提升感知能力。
簡單說,它擅長“感知與溝通”——能看懂圖片、聽懂語音、理解長文本,適合聊天交互、內容創作、簡單工具調用等通用場景,推理速度快、延遲低,對日常用戶友好。
MiMo-V2.5-Pro:1.02T參數的長任務“工程大師”
Pro版是小米當前最強模型,總參數1.02T、激活參數42B,同樣為MoE架構,主打“長周期一致性”與復雜軟件工程。它的訓練重點不是感官對齊,而是注入“腳手架意識”(harnessawareness)——能主動管理記憶、塑造上下文,在數千次連續工具調用中不失憶、不跑偏。
![]()
技術上有兩大核心設計:一是6:1混合注意力,局部滑動窗口注意力+全局注意力,窗口128token,KV-cache存儲減少7倍,能聚焦15%關鍵上下文;二是3層多Token預測(MTP),推理速度提升3倍,加速強化學習訓練。上下文最高支持100萬token,專門適配OpenClaw、NanoClaw等Agent框架的高強度任務。
![]()
二、硬核實測:4小時干完美式本科畢設,AI工程能力拉滿
小米最有說服力的,不是冰冷的參數,而是三個顛覆行業認知的實測案例——把AI從“聊天機器”變成“能獨立干活的工程師”。
案例1:4.3小時搞定編譯器,滿分通關
北大計算機系《編譯原理》課程的SysY編譯器項目,本科生通常要數周才能完成,包括詞法分析(lexer)、語法分析(parser)、RISC-V匯編后端等全流程。MiMo-V2.5-Pro僅用4.3小時,調用672次工具,從零實現完整編譯器,在隱藏測試集拿下233/233滿分,全程無人類干預、無崩潰、無邏輯錯誤。
案例2:11.5小時開發全功能視頻編輯器
更夸張的是,Pro版自主工作11.5小時,調用1868次工具,生成8192行代碼的桌面視頻編輯器。具備多軌時間線、剪輯、特效、導出流水線等完整功能,相當于獨立完成一個中型桌面應用開發,全程無需人類指導或糾錯。
案例3:研究生級EDA優化,指標提升22倍
在臺積電180nm工藝的FVF-LDO穩壓器優化任務中(研究生級工程題),Pro版通過反復迭代ngspice仿真循環,將線性調整率等核心指標提升22倍,遠超初始方案,展現出在專業工程領域的迭代優化能力。
這些案例的核心,正是小米強調的“腳手架意識”——普通模型調用幾十次工具就會失憶、邏輯斷裂,而Pro版能在數千次工具調用中維持上下文一致性,像人類工程師一樣分步拆解、逐步調試、持續優化。
三、定價與Token效率:海外價高,性價比看實際消耗
開源之外,商業化定價是開發者最關心的問題。小米采用“分層定價+超長上下文溢價”策略,覆蓋國內外市場,核心特點是“緩存未命中貴、超長上下文翻倍”。
海外定價(美元/百萬token)
普通上下文(≤256K):輸入$1.00,輸出$3.00
超長上下文(256K-1M):輸入$2.00,輸出$6.00
![]()
國內定價:橫向對比不便宜
橫向看國內主流開源模型,MiMo價格不占優勢:DeepSeek、智譜GLM、Kimi等模型,同級別API價格普遍低于MiMo,部分還提供免費額度或低價套餐。
性價比關鍵:Token效率比單價更重要
但小米的底氣在于Token效率——Agent任務(如編程、工具調用)的成本,核心看“完成同等任務消耗的token數”,而非單價。ArtificialAnalysis測評顯示:
MiMo-V2.5-Pro比KimiK2.6節省42%token
MiMo-V2.5比MetaMuseSpark節省50%token
簡單說:單價貴,但干同樣的活消耗更少token,長期使用總成本未必高。尤其Agent模式下,token消耗是普通聊天的幾十倍,效率直接決定成本。
![]()
行業背景是AI推理補貼時代終結:微軟GitHubCopilot轉向按token計費,不再無限訂閱;Anthropic、OpenAI也收緊補貼,“低價無限用”的時代一去不返。對企業來說,“省錢”的核心不再是找低價模型,而是找“高效+穩定”的模型,MiMo精準踩中這一需求。
![]()
四、爭議與短板:長鏈推理弱,營銷感引反感
高光之下,MiMo-V2.5-Pro也暴露明顯短板,用戶吐槽集中在三大問題,甚至有開發者直言“小米現在做一切都是為了營銷模型和賣token”。
![]()
短板1:長鏈推理“自我糾錯”能力不足
實測中,面對隱秘非報錯bug(如數據處理腳本的邏輯漏洞),Pro版和多數國產模型一樣查不出,而GPT、Claude能穩定發現。更關鍵的是:沒有明確錯誤反饋時,無法自主思考排查,需要人類精準指出方向才能定位問題,而DeepSeekV4Pro只需提示檢查范圍就能發現問題。
用戶評價一針見血:“MIMO推理預算被限制厲害,長鏈推理訓練不足,靠自己憑空思考表現差”。
短板2:價格不占優,免費期后用戶流失
國內市場,MiMo定價高于DeepSeek、GLM等同級別模型,免費試用結束后,用戶使用占比持續下降。對中小企業和個人開發者來說,“效率優勢”不足以抵消“高價”的顧慮,尤其非高強度Agent任務時,低價模型更劃算。
短板3:營銷感過重,“羅福莉出鏡”引反感
模型發布節奏“一月一更”,核心負責人羅福莉頻繁公開露面、接受采訪,被質疑過度營銷。有用戶吐槽:“小米現在做AI,不是為了技術落地,而是為了營銷產品、賣token,太急功近利”。這種“流量優先”的打法,讓部分技術向開發者產生抵觸情緒,影響口碑沉淀。
五、行業影響:國產Agent模型崛起,開源商業化加速
小米MiMo-V2.5系列的開源,絕非“又一個國產模型”那么簡單,而是國產大模型從“追參數”到“拼落地”的轉折點,對行業有三大深遠影響。
1.國產Agent模型躋身全球第一梯隊
此前,Agent能力被Claude、GPT等閉源模型壟斷,國產模型多停留在“聊天、寫文案”階段。MiMo-V2.5-Pro的出現,證明國產模型在長周期任務、復雜軟件工程領域能與國際頂模正面競爭,甚至在部分場景(如編譯器開發)表現更優。加上DeepSeek、智譜GLM等選手,國產Agent模型已形成“第一梯隊”,打破海外壟斷。
2.MIT開源推動國產模型商業化落地
寬松的MIT許可證是關鍵一步——允許商用、自由修改、本地部署,解決企業“數據隱私、授權成本、定制化”三大痛點。此前,國產模型多采用非商用或嚴格授權協議,企業不敢用、不能用。MiMo的開源策略,有望帶動更多國產模型轉向“商用友好”,加速AI在企業端的落地。
3.Agent賽道成競爭核心,Token效率成勝負手
小米、DeepSeek、智譜等玩家的發力方向一致:放棄“通用聊天”內卷,主攻Agent智能體賽道。未來,大模型的競爭不再是“誰參數大、誰跑分高”,而是“誰能更高效、更穩定地完成復雜長任務”。Token效率、長上下文一致性、工具調用穩定性,將成為模型的核心競爭力,直接決定企業使用成本與落地價值。
小米MiMo-V2.5系列的開源,是國產AI大模型發展的重要里程碑——它用硬核實測證明,國產模型在長周期復雜任務上能比肩國際頂模;用MIT開源協議,為企業商用落地掃清障礙;用Token效率優勢,回應行業“降本增效”的核心需求。
但短板同樣明顯:長鏈推理能力不足、定價偏高、營銷感過重,這些問題不解決,難以從“現象級模型”變成“行業標配”。未來,小米需要平衡“技術迭代”與“口碑沉淀”,減少過度營銷,聚焦打磨模型核心能力;同時優化定價策略,讓更多中小企業用得起、用得好。
AI智能體時代已來,大模型的競爭才剛剛開始。MiMo-V2.5系列的亮相,不是終點,而是國產模型“從技術追趕走向生態引領”的新起點。接下來,能否把“硬核能力”轉化為“落地價值”,能否在全球競爭中站穩腳跟,時間會給出答案。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.