聞樂 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
先別聊什么參數(shù)、benchmark了,來(lái)看個(gè)狠活——
米版“macOS Sequoia”桌面系統(tǒng)(doge)。
![]()
開機(jī)動(dòng)畫、用戶登錄、窗口管理、Dock欄縮放、Spotlight搜索、明暗顯示風(fēng)格、Launchpad啟動(dòng)臺(tái),全都有。
還自帶54個(gè)原生應(yīng)用,打開計(jì)算器能算賬,打開日歷能看日子,打開地圖能查地址,打開備忘錄能寫東西,Grapher還能畫3D函數(shù)圖……拖一拖轉(zhuǎn)一轉(zhuǎn),挺像那么回事。
![]()
甚至!還有個(gè)能真實(shí)沖浪的Safari瀏覽器,好你個(gè)“Aqqle”(狗頭.jpg)。
![]()
關(guān)鍵這個(gè)系統(tǒng)是AI 4個(gè)小時(shí)全程無(wú)中斷、無(wú)人類接管,就這么一直肝出來(lái)的。
沒錯(cuò),用的就是主打長(zhǎng)程任務(wù)、模糊指令遵循,躋身國(guó)產(chǎn)Agent第一梯隊(duì)的小米MiMo?V2.5 Pro
![]()
小米最新發(fā)布的MiMo?V2.5系列,包含Pro旗艦Agent、全模態(tài)基座、TTS語(yǔ)音合成、ASR語(yǔ)音識(shí)別四大模型,綜合實(shí)力對(duì)標(biāo)國(guó)際頂尖水準(zhǔn)。
![]()
就在今天凌晨,MiMo-V2.5系列模型(包含base版)已經(jīng)正式官宣開源,權(quán)重全量開放
4個(gè)月,從入場(chǎng)到進(jìn)入開源第一梯隊(duì),小米這位“超速”選手,咱得扒一扒。
國(guó)際頂模的飯桌,它坐上去了
先看看成績(jī)單。
首先,新一代模型在通用智能體能力、復(fù)雜軟件工程與長(zhǎng)程任務(wù)三大核心維度,相較前代MiMo-V2-Pro實(shí)現(xiàn)顯著躍升。
國(guó)際競(jìng)技場(chǎng)上,在Coding Agent、SWE-Bench Pro、GDPVal-AA等多項(xiàng)權(quán)威基準(zhǔn)測(cè)試中成績(jī)逼近Claude Opus 4.6、GPT-5.4等頂尖閉源模型,甚至大幅超越Gemini 3.1 Pro。
這么看下來(lái),MiMo?V2.5-Pro不僅躋身國(guó)產(chǎn)開源第一梯隊(duì),而且已經(jīng)跟Claude Opus 4.6、GPT-5.4等國(guó)際頂模坐在一張桌子上吃飯了。
![]()
要說(shuō)劃個(gè)重點(diǎn),小米這次升級(jí),最主要的是長(zhǎng)周期任務(wù)和模糊指令遵循能力。
官方數(shù)據(jù)顯示,它可以穩(wěn)定支撐超千次工具調(diào)用的長(zhǎng)周期任務(wù),自主完成人類專家數(shù)天甚至數(shù)周的高難度工作。
就拿北大SysY項(xiàng)目來(lái)說(shuō),從零寫一個(gè)完整編譯器這種級(jí)別的復(fù)雜工程,MiMo?V2.5-Pro自己吭哧吭哧就能從頭肝到尾,詞法分析、語(yǔ)法分析、中間代碼生成、RISC-V后端、性能優(yōu)化……全包。
4.3小時(shí)、672次工具調(diào)用,任務(wù)中間都能不崩、不跑偏、不失憶,拿到233/233的滿分。
![]()
還有個(gè)事兒必須提一嘴——Token效率
在ClawEval標(biāo)準(zhǔn)Agent任務(wù)中,MiMo單軌跡只用約7萬(wàn)Token,就能達(dá)到64%的Pass3通過(guò)率。
而Claude Opus 4.6、Gemini 3.1 Pro、GPT-5.4,普遍在12-18萬(wàn)Token。
同樣的能力,一樣的效果,MiMo直接省了40%-60%的成本
![]()
這“Token半功倍”實(shí)打?qū)嵉氖″X能力,咱還真得點(diǎn)個(gè)贊。
![]()
不只代碼強(qiáng),小米模型的語(yǔ)音能力也齊活了。
V2.5家族里的TTS支持文本描述造音色、零樣本克隆,不用上傳參考音頻,直接用文字描述就能生成想要的聲線;
![]()
視頻地址:https://mp.weixin.qq.com/s/TX5_KfchdvfWGd0iltwcdw
ASR拿到中英SOTA,粵語(yǔ)、川語(yǔ)、吳語(yǔ)、閩南語(yǔ)都能識(shí)別,連帶伴奏的歌詞都能精準(zhǔn)轉(zhuǎn)寫。
![]()
而且,MiMo-V2.5-Pro和MiMo-V2.5都標(biāo)配了1M上下文窗口,音頻模型也大幅進(jìn)化,從基座到TTS、ASR全棧升級(jí),一個(gè)不落。
好好好,小米這波根本不是單點(diǎn)突圍,這是直接端出了一整套Agent全家桶啊……
那它到底有多能跑?咱上實(shí)測(cè)!
實(shí)測(cè),真不虛!
必須得來(lái)扒一下開頭那個(gè)macOS系統(tǒng)的代碼層,畢竟效果是真行。
整個(gè)項(xiàng)目由React 18+TypeScript+Zustand+Tailwind CSS以及Vite構(gòu)建,68個(gè)組件撐起了54個(gè)原生應(yīng)用。
![]()
XcodeApp里面塞了一個(gè)真實(shí)可瀏覽的網(wǎng)頁(yè)引擎、包含完整的國(guó)際象棋邏輯的小游戲,支持3D函數(shù)繪圖的Grapher等等。
![]()
窗口管理系統(tǒng)也不是簡(jiǎn)單的彈個(gè)框,做了一套完整的窗口狀態(tài)機(jī):拖拽、縮放、最小化、最大化、焦點(diǎn)切換、z-index層級(jí)管理、還復(fù)刻了macOS標(biāo)志性的Traffic Lights三色燈邏輯。
4個(gè)小時(shí),MiMo-V2.5 Pro自己把這套架構(gòu)搭起來(lái)、把54個(gè)應(yīng)用一個(gè)個(gè)填滿、把窗口管理的狀態(tài)同步理順。
全程無(wú)中斷、無(wú)人類接管,這編程能力屬實(shí)是不虛,真把人類程序員給解放了。
然后,我把模型接到了龍蝦里,給了一個(gè)超長(zhǎng)提示詞,讓它從零開發(fā)了一個(gè)3D像素風(fēng)農(nóng)場(chǎng)模擬游戲。
![]()
什么3D場(chǎng)景搭建、像素風(fēng)格美術(shù)、作物生長(zhǎng)系統(tǒng)、天氣循環(huán)、玩家交互邏輯……全都給我塞進(jìn)去。
MiMo-V2.5 Pro一路肝下來(lái),從架構(gòu)到核心玩法,工程量大環(huán)節(jié)多的農(nóng)場(chǎng)給我搞定了。
![]()
最終交出來(lái)的版本質(zhì)感很足。畫面里是三種不同顏色劃分的農(nóng)場(chǎng)區(qū)域,外圍還點(diǎn)綴著像素風(fēng)花草點(diǎn)綴氛圍;
商店里能買到胡蘿卜、番茄、南瓜三種作物,游戲里不僅有晴雨交替的天氣變化,還做了實(shí)時(shí)更新的金幣計(jì)數(shù)和像素小人的體力條。
![]()
那就開始種地吧!
進(jìn)游戲第一件事,先鋤地。扛著鋤頭走到空地上,DuangDuangDuang幾下,一塊耕地就出來(lái)了。
然后去商店買種子,番茄、小麥、胡蘿卜……選完往兜里一揣,回到地里一顆顆種下去。
種完澆水,看著小苗苗冒頭,作物成熟之后會(huì)有閃光效果,這時(shí)候就能收獲了,收割完再去商店賣掉,金幣叮叮當(dāng)當(dāng)?shù)劫~了~
![]()
從場(chǎng)景裝飾到核心玩法,一套完整閉環(huán)直接拉滿,種地→澆水→收獲→賣錢→再買種子→再種……好,循環(huán)起來(lái)停不下,賽博種地也太上頭了!!
接下來(lái),我用MiMo-V2.5做了一個(gè)山野風(fēng)格治愈系自然漫游數(shù)字手賬本。
和小游戲不一樣,咱這次就給了一句大白話:
幫我做個(gè)山野風(fēng)格的治愈系網(wǎng)站,像一本旅行手賬,自然、安靜、有呼吸感,那種逃離城市走進(jìn)曠野的感覺。
沒給配色、沒給字體、沒給布局、沒給動(dòng)效方案,啥都沒給。
![]()
這類任務(wù)考驗(yàn)的就是模糊指令理解了,山野到底是個(gè)啥感覺?治愈系配色要怎么搭?
MiMo-V2.5的理解是:大地色系、手寫感字體、墨水質(zhì)感、以及柔和的動(dòng)畫。
![]()
于是,我就得到了一個(gè)細(xì)節(jié)拉滿、內(nèi)容豐富的手賬。
山巒背景做視差,滾動(dòng)的時(shí)候遠(yuǎn)近山層拉出縱深感,畫面上還飄著小粒子。鼠標(biāo)一挪,柔和光暈就跟過(guò)來(lái)了。
復(fù)選框點(diǎn)擊還有彈跳動(dòng)畫,全文滾動(dòng)的時(shí)候每個(gè)元素都是淡入淡出,氛圍感滿滿。
![]()
甚至最后的手賬本還有交互功能,行囊里的裝備可以標(biāo)記選擇,這個(gè)小設(shè)計(jì)屬于意外之喜了。
![]()
沒告訴它具體用什么顏色、什么字體,它自己從山野這個(gè)詞里讀懂了我要的氛圍,自行完成了交互、視覺和動(dòng)效。
這種模糊指令遵循能力,最適合普通人上手,不用把提示詞寫成PRD(產(chǎn)品需求文檔),大白話也能出好東西。
代碼能力看完了,語(yǔ)音這塊兒咱也得試試!
讓MiMo-V2.5-TTS一個(gè)人撐起一臺(tái)戲,分別生成了三種角色聲音,年輕理性女生音、中年夜市老板音、吃貨少年音,來(lái)場(chǎng)減肥辯論!
![]()
視頻地址:https://mp.weixin.qq.com/s/TX5_KfchdvfWGd0iltwcdw
出來(lái)的效果嘛……各有各的味兒,毫不串戲~
最后試試ASR語(yǔ)音識(shí)別。
丟了一段粵語(yǔ)過(guò)去,轉(zhuǎn)寫結(jié)果基本準(zhǔn)確,只有最后一句的“歡迎來(lái)到香港”的“來(lái)”聽錯(cuò)了,不過(guò)無(wú)傷大雅,識(shí)別度達(dá)到99.999%。
![]()
視頻地址:https://mp.weixin.qq.com/s/TX5_KfchdvfWGd0iltwcdw
只能說(shuō),小米這波語(yǔ)音能力補(bǔ)齊的姿勢(shì),屬實(shí)優(yōu)雅。
4個(gè)月,它拿出了真東西
效果看完了,最后咱聊聊這支團(tuán)隊(duì)。
小米AI團(tuán)隊(duì)這波節(jié)奏,確實(shí)有點(diǎn)超出預(yù)期,從去年年底V2系列進(jìn)場(chǎng),到現(xiàn)在V2.5沖到開源第一梯隊(duì),前后也就4個(gè)月時(shí)間。
放在行業(yè)里,正常節(jié)奏基本上是8-12個(gè)月,小米相當(dāng)于直接把周期砍了一半。
快也就算了,它東西還齊,旗艦、全模態(tài)、全鏈路語(yǔ)音模型一口氣全更完。
好好好,“趕工期”趕出頂尖全家桶,也是頭一回見(doge) 。
![]()
當(dāng)然了,咱用戶雖然看中模型能力,但性價(jià)比咱也真的很在乎。
小米這次全系升級(jí)到1M上下文,但憑借著超高Token效率,計(jì)費(fèi)規(guī)則反而簡(jiǎn)化了。
![]()
1M和256K采取同樣的Credit倍率,Pro從4x降到2x,標(biāo)準(zhǔn)版從2x降到1x。
加上夜間再打8折(北京時(shí)間00:00~08:00)Token Plan用戶Credits全量重置,這組合拳打下來(lái),就倆字——
普惠。讓普通用戶和開發(fā)者都能低成本體驗(yàn)高階AI能力。
這不,國(guó)外開發(fā)者馬上種草了。
![]()
技術(shù)做得好,落地普及也得跟上。小米顯然懂這個(gè)道理,于是在打折之外,又端出MiMo Orbit這個(gè)開發(fā)者扶持計(jì)劃。
這個(gè)計(jì)劃分兩塊:
一塊是百萬(wàn)億Token創(chuàng)造者激勵(lì)計(jì)劃,面向AI開發(fā)者發(fā)放100萬(wàn)億Token,完全免費(fèi)。全球個(gè)人開發(fā)者、團(tuán)隊(duì)、企業(yè)都能申請(qǐng)參與。
而且小米方面會(huì)認(rèn)真評(píng)估每份申請(qǐng),按需發(fā)放,確保Token給到真正需要的人手里。
另一塊是面向全球新興Agent框架,提供起步階段的專項(xiàng)支持。
不管你的框架做到什么階段、用戶規(guī)模多大,MiMo都愿意當(dāng)你的底層模型引擎。
不僅限免接入,還會(huì)搞定底層適配技術(shù)的技術(shù)支持,幫你把用戶體驗(yàn)門檻拉低到……幾乎沒有門檻。
我看明白了,這是個(gè)“手牽手我們一起走,創(chuàng)造幸福的生活~”的大動(dòng)作(期待.jpg)。
![]()
放在當(dāng)下這個(gè)節(jié)點(diǎn)看,其實(shí)也不難理解——
國(guó)際上幾家家底厚的模型已經(jīng)把生態(tài)鋪得很穩(wěn),開發(fā)者習(xí)慣基本固定,后來(lái)者想擠進(jìn)去并不容易。國(guó)產(chǎn)模型想要站穩(wěn),速度、實(shí)力、誠(chéng)意三樣缺一不可。
小米的打法很明確:用更快的迭代搶時(shí)間,用更強(qiáng)的能力留用戶,用真金白銀降低大家的嘗試成本。
算不算“彎道超車”不好說(shuō),但至少態(tài)度和動(dòng)作都很干脆。
至于能不能真正站穩(wěn),雖然最后還是得開發(fā)者說(shuō)了算,但就這份答卷來(lái)看,小米這支AI團(tuán)隊(duì)是真·All in。
下一個(gè)4個(gè)月,它會(huì)掏出什么呢?我先蹲一波~
體驗(yàn)地址:https://aistudio.xiaomimimo.com/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.