<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      超越DeepSeek-V4!羅福莉交出小米最強開源模型,首日適配5家國產(chǎn)芯片

      0
      分享至


      智東西
      作者 李水青
      編輯 云鵬

      智東西4月28日報道,剛剛,小米開源羅福莉帶隊研發(fā)的MiMo-V2.5系列模型,采用MIT協(xié)議,允許商用推理部署與二次訓練,無需額外授權。


      ▲MiMo-V2.5-Pro在Hugging Face的開源頁面截圖

      此前,該系列模型于4月23日開啟公測,包括MiMo-V2.5-Pro、MiMo-V2.5兩款模型。模型具備更強Agent能力,支持100萬上下文,且Token效率大幅提升。

      MiMo-V2.5-Pro的完整基準測試結果今日公布,小米稱其在GDPVal-AA(Elo)、Claw-Eval(pass^3)等多項測評中超過了最新開源的DeepSeek-V4-Pro模型,也超過了發(fā)布不久的Kimi K2.6等主流閉源模型,實現(xiàn)總體最佳。


      ▲MiMo-V2.5-Pro的最新測評成績

      開源首日,MiMo-V2.5-Pro宣布已完成與阿里平頭哥、亞馬遜云科技、AMD、百度昆侖芯、燧原科技、沐曦、天數(shù)智芯多個芯片廠商的接入適配。MiMo-V2.5系列模型同步完成SGLang和vLLM主流推理框架的Day 0適配。

      與此同時,小米還推出百萬億Token創(chuàng)造者激勵計劃,計劃30天內(nèi)免費發(fā)放總計100萬億Token權益;推出Agent生態(tài)共建計劃,目前已與OpenCode、Hermes Agent、KiloCode等Agent框架廠商展開合作。

      模型權重合集:
      https://huggingface.co/collections/XiaomiMiMo/mimo-v25
      更多細節(jié)參考模型Blog:
      https://mimo.xiaomi.com/index#blog
      百萬億Token計劃申請網(wǎng)址:
      https://100t.xiaomimimo.com/

      一、模型技術細節(jié)公布,測評超越DeepSeek-V4

      由小米最新公開的模型卡可知,小米迄今為止最強模型MiMo-V2.5-Pro是一款擁有1.02萬億(1.02T)個參數(shù)的混合專家模型,其中420億(42B)個激活參數(shù),基于混合注意力架構,相比前代模型在通用智能能力、復雜軟件工程和長時域任務處理方面均實現(xiàn)了顯著提升。

      MiMo-V2.5-Pro繼承了MiMo-V2-Flash的混合注意力機制和多標記預測(MTP)設計。局部滑動窗口注意力(SWA)和全局注意力(GA)以6:1的比例交錯使用,窗口大小為128個Token,在長上下文情況下,通過可學習的注意力池偏置,將鍵值緩存存儲空間減少了近7倍,同時保持了性能。一個輕量級的MTP模塊,采用密集前饋神經(jīng)網(wǎng)絡(FFN),原生集成用于訓練和推理,輸出吞吐量大約提升了三倍,并加速了強化學習(RL)的部署。


      ▲MiMo-V2.5-Pro的模型架構及訓練過程

      該模型預訓練使用27萬億(27T)個Token,采用FP8混合精度,原生序列長度為32K,上下文擴展至1M個Token。后訓練遵循MiMo-V2-Flash中引入的三階段范式:1、監(jiān)督式微調(diào),在精心挑選的數(shù)據(jù)對上建立基礎的指令跟蹤;2、領域專精訓練,其中不同的教師模型分別通過針對特定領域的強化學習進行優(yōu)化,涵蓋數(shù)學、安全、智能工具使用等領域;3、多教師策略蒸餾(MOPD),其中單個學生模型在每位專精教師的Token級指導下,從自身的展開中學習策略,并將所有教師的能力融合到一個統(tǒng)一的模型中。

      再來看看MiMo-V2.5,這是一個3100億(310B)參數(shù)的稀疏MoE模型,擁有150億(15B)激活參數(shù),在48萬億(48T)個Token上進行訓練。它的語言主干框架繼承了MiMo-V2-Flash的混合滑動窗口注意力機制,并搭載自研預訓練視覺、音頻編碼器,兩類編碼器通過輕量化投影模塊完成跨模塊融合。


      ▲MiMo-V2.5架構

      訓練過程分為五個階段:1、基于多樣化語料開展文本預訓練,搭建大語言模型主干網(wǎng)絡;2、進行投影層預熱訓練,實現(xiàn)音視頻、視覺投影器與語言模型的對齊融合;3、依托高質(zhì)量跨模態(tài)數(shù)據(jù)集,開展大規(guī)模多模態(tài)預訓練;4、執(zhí)行監(jiān)督微調(diào)與智能體后訓練,在此過程中將上下文窗口從32K逐步擴容至256K,最終達到100萬Token;5、最后是通過強化學習(RL)與多目標偏好蒸餾(MOPD),進一步強化模型的感知、邏輯推理與智能體執(zhí)行能力。

      從小米最新公布的測評結果來看,MiMo-V2.5在Claw-Eval Text、Terminal-Bench 2.0、SWE-Bench Pro等多項測評中大幅超越了DeepSeek最新發(fā)布的DeepSeek-V4-Flash。


      ▲MiMo-V2.5最新測評情況

      二、開源首日,完成阿里平頭哥沐曦等7家芯片廠商適配

      小米還公布了芯片生態(tài)與推理框架最新適配情況,MiMo-V2.5-Pro開源首日完成多個芯片廠商的接入適配:

      阿里平頭哥:基于真武810E及全棧自研AI軟件棧實現(xiàn)深度適配。

      亞馬遜云科技:基于Trainium2芯片與Neuron SDK + vLLM推理框架完成深度適配,實現(xiàn)開源即全球可用的首日適配。下一代3nm制程Trainium3將進一步釋放模型性能。

      AMD:依托ROCm開源軟件棧提供Day-0適配及全面優(yōu)化支持。

      百度昆侖芯:通過底層算子優(yōu)化與軟硬件協(xié)同加速,保障模型穩(wěn)定高效運行。

      燧原科技:基于自研馭算TopsRider軟件棧深度優(yōu)化,在燧原L600上完成全量適配。

      沐曦:基于曦云C系列及全棧自研MXMACA軟件棧,實現(xiàn)Triton語法到沐曦GPU指令集的端到端原生支持。

      天數(shù)智芯:實現(xiàn)Day 0級深度適配。

      此外,MiMo-V2.5系列模型同步完成SGLang和vLLM主流推理框架的Day 0適配。

      三、免費發(fā)放100萬億Token,已與Hermes Agent等合作

      與此同時,小米還同步推出MiMo Orbit計劃,包含兩部分:“百萬億Token創(chuàng)造者激勵計劃”,與面向Agent框架團隊的“Agent生態(tài)共建計劃”。

      在百萬億Token創(chuàng)造者激勵計劃方面,小米面向全球AI用戶免費發(fā)放Token,30天內(nèi)發(fā)放總計100萬億Token權益,贈完即止。

      該計劃采取申請制,通過者最高獲得Max檔位Token Plan,包含16億Credits,價值659元。活動時間:北京時間2026年4月28日00:00至5月28日00:00。

      Agent生態(tài)共建計劃方面,小米面向全球Agent框架團隊提供專項支持,為框架提供MiMo Token限免支持,同時參與和贊助框架平臺的AI Hackathon等共創(chuàng)活動。

      其目前已與OpenCode、Hermes Agent、KiloCode等Agent框架廠商展開深度合作。

      結語:多款國產(chǎn)開源模型“亮劍”交鋒

      近期,大模型行業(yè)開源力度持續(xù)加碼,模型與國產(chǎn)及國際芯片的“Day 0”適配已從亮點變?yōu)閯傂瑁评硇屎筒渴鸪杀境蔀橄乱浑A段競爭的核心。同時,百億級Token免費激勵與Agent框架生態(tài)共建,反映出行業(yè)正從“拼參數(shù)”轉向“拼應用”。

      值得關注的是,小米MiMo-V2.5-Pro在多項基準評測中直接超越DeepSeek最新開源的DeepSeek-V4-Pro模型,可謂與DeepSeek在開源賽道發(fā)起“亮劍”交鋒,有望倒逼行業(yè)更快降低推理成本、提升Agent真實任務完成率。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      俄羅斯軍事專家直言:美國到現(xiàn)在才明白,中國是天然的超級大國!

      俄羅斯軍事專家直言:美國到現(xiàn)在才明白,中國是天然的超級大國!

      抽象派大師
      2026-05-08 00:15:03
      李亞鵬和前妻一起陪女兒燙發(fā),夏夏一頭卷發(fā)真好看,三口同框溫馨

      李亞鵬和前妻一起陪女兒燙發(fā),夏夏一頭卷發(fā)真好看,三口同框溫馨

      小娛樂悠悠
      2026-05-07 10:15:38
      德州榴蓮僅退款后續(xù),商家上門對質(zhì)被威脅,警方立案,買家是慣犯

      德州榴蓮僅退款后續(xù),商家上門對質(zhì)被威脅,警方立案,買家是慣犯

      夜深愛雜談
      2026-05-08 12:37:58
      河北王牌景區(qū)白洋淀徹底翻車!五一前3天不到2萬人,口碑徹底爛了

      河北王牌景區(qū)白洋淀徹底翻車!五一前3天不到2萬人,口碑徹底爛了

      譚談社會
      2026-05-07 20:44:05
      峨眉山推猴男社死!律師曝猛料,景區(qū)拉黑只是開始,嚴重的在后面

      峨眉山推猴男社死!律師曝猛料,景區(qū)拉黑只是開始,嚴重的在后面

      寒士之言本尊
      2026-05-08 00:04:04
      特朗普以為訪華穩(wěn)了 派心腹摸底后漫天要價 點名向中方要一個人

      特朗普以為訪華穩(wěn)了 派心腹摸底后漫天要價 點名向中方要一個人

      小陸搞笑日常
      2026-05-08 10:57:58
      美3艘軍艦成功駛出海峽、伊朗沒攔住,川普稱不簽協(xié)議就繼續(xù)打

      美3艘軍艦成功駛出海峽、伊朗沒攔住,川普稱不簽協(xié)議就繼續(xù)打

      邵旭峰域
      2026-05-08 10:02:59
      因截流種棉花,7000萬人的母親河,就這樣毀在一個超級大國手里!

      因截流種棉花,7000萬人的母親河,就這樣毀在一個超級大國手里!

      抽象派大師
      2026-05-07 00:22:34
      雷霆贏完G2差距明顯!內(nèi)線碾壓,替補優(yōu)勢明顯,陣容厚度太恐怖了

      雷霆贏完G2差距明顯!內(nèi)線碾壓,替補優(yōu)勢明顯,陣容厚度太恐怖了

      籃球資訊達人
      2026-05-08 12:52:56
      罪有應得!以色列,正被全世界集體孤立!

      罪有應得!以色列,正被全世界集體孤立!

      毛豆論道
      2026-05-05 17:35:52
      歐戰(zhàn)夜全是反轉!英超要包攬冠軍,保級隊硬剛到底

      歐戰(zhàn)夜全是反轉!英超要包攬冠軍,保級隊硬剛到底

      田心生活
      2026-05-08 12:25:14
      中印泰馬集體說不 !國際足聯(lián)緊急訪華,央視死守底線 贊助商急了

      中印泰馬集體說不 !國際足聯(lián)緊急訪華,央視死守底線 贊助商急了

      影像溫度
      2026-05-07 10:26:34
      掀翻廣廈后山西卻傳3壞消息!張寧傷情不樂觀,內(nèi)線悍將恐遭重罰

      掀翻廣廈后山西卻傳3壞消息!張寧傷情不樂觀,內(nèi)線悍將恐遭重罰

      后仰大風車
      2026-05-08 08:10:15
      絕色美人艾梅柏:曾經(jīng)迷倒德普和馬斯克,如今帶著3個娃“隱居”

      絕色美人艾梅柏:曾經(jīng)迷倒德普和馬斯克,如今帶著3個娃“隱居”

      小書生吃瓜
      2026-05-02 22:22:47
      湖南瀏陽煙花廠爆炸事故最新通報,搜救完畢多人遇難

      湖南瀏陽煙花廠爆炸事故最新通報,搜救完畢多人遇難

      天空空啊
      2026-05-08 13:10:21
      當年千手觀音的聾啞人領舞,被富商苦追8年,如今她成了這副摸樣

      當年千手觀音的聾啞人領舞,被富商苦追8年,如今她成了這副摸樣

      石辰搞笑日常
      2026-05-06 01:25:36
      王暖暖被送醫(yī)搶救,護士反復喊她名字,16個小時前還好好的

      王暖暖被送醫(yī)搶救,護士反復喊她名字,16個小時前還好好的

      民宿體驗志
      2026-05-08 10:40:49
      吃他汀猝死的人增多?醫(yī)生含淚苦勸:天熱吃他汀,必須多注意4點

      吃他汀猝死的人增多?醫(yī)生含淚苦勸:天熱吃他汀,必須多注意4點

      墜入二次元的海洋
      2026-05-06 14:49:33
      再見,鞋王!41歲PJ·塔克宣布退役!!!

      再見,鞋王!41歲PJ·塔克宣布退役!!!

      柚子說球
      2026-05-08 10:30:36
      1200萬預賠款已到賬!瀏陽煙花廠爆炸遇難者,人均賠多少?

      1200萬預賠款已到賬!瀏陽煙花廠爆炸遇難者,人均賠多少?

      陳博世財經(jīng)
      2026-05-07 14:13:52
      2026-05-08 13:44:49
      智東西 incentive-icons
      智東西
      智東西,AI產(chǎn)業(yè)新媒體,專注報道人工智能的前沿技術發(fā)展,和技術應用帶來的千行百業(yè)產(chǎn)業(yè)變革。
      11770文章數(shù) 117062關注度
      往期回顧 全部

      科技要聞

      追趕星艦:中國商業(yè)火箭離SpaceX有多遠?

      頭條要聞

      "4只皮皮蝦1035元"店主事發(fā)次日病逝 家屬:不再開業(yè)

      頭條要聞

      "4只皮皮蝦1035元"店主事發(fā)次日病逝 家屬:不再開業(yè)

      體育要聞

      巴黎再進歐冠決賽,最尷尬的情況還是發(fā)生了

      娛樂要聞

      黃子佼獲緩刑4年,無需入獄服刑

      財經(jīng)要聞

      一覺醒來,美伊又打起來了

      汽車要聞

      雷克薩斯全新純電三排SUV 全新TZ全球首發(fā)

      態(tài)度原創(chuàng)

      時尚
      數(shù)碼
      親子
      教育
      家居

      裙子專場|| 一周想穿7天,沒想到它這么實用

      數(shù)碼要聞

      內(nèi)存漲價致手機行業(yè)大量產(chǎn)品延期/取消 涉及多款闊屏機

      親子要聞

      大女兒入選學校合唱團獨唱,這次挑了首英文歌,自信的樣子真亮眼

      教育要聞

      成長的勛章:藏在細節(jié)里的家教智慧——張敬家教好故事

      家居要聞

      流動的尺度 打破家的形式主義

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 五月天堂| 久久国产精品偷| 国产高清精品一区二区三区| 内射自拍| 中文av无码人妻一区二区三区| 亚洲啊V天堂在线观看2021| 日韩男人天堂| 96精品久久久久久久久久| 国产欧美精品一区二区三区四区 | 午夜精品久久久久久中宇| 国产日产久久高清欧美一区| 色欧美片视频在线观看| 四虎永久在线精品免费网站| av永久天堂一区二区三区| 日本japanese丰满少妇| 国产东北露脸熟妇| 蜜桃一区二区三区在线看| 中文字幕有码无码| 青青草免费成人| 龙胜| 成人免费乱码大片a毛片| 最新av在线网址| 国产精品毛片app| 安宁市| 日韩中文字幕人妻一区| 2021AV在线无码最新| 亚洲韩国精品无码一区二区三区| 一级做a爰片久久毛片4个| 国产亚洲一区二区手机在线观看| 亚洲精品无码久久久久久久| jiZZjiZZ少妇高潮喷水| 97成人精品视频在线播放| 日韩在线永久免费播放| 亚洲视频一区| 国产无码专区| wwwwwwww在线观看久久| 亚洲成在人线AV品善网好看| 国产av激情久久无码天堂| 中文字幕av高清片| 国产亚洲精品第一综合麻豆| 国产精品视频一品二区三|