<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      Mac跑MiniMax-M2.7,2條路徑對比

      0
      分享至

      今天聊一個很多 Mac 用戶關心的問題:MiniMax-M2.7 怎么在 Mac 上跑起來?

      MiniMax-M2.7 是什么來頭?

      先簡單回顧一下

      M2.7 是 MiniMax 最新的開源大模型,MoE 架構,總參數 228.7B,每 token 激活約 10B 參數,192K 上下文

      這貨最亮眼的幾個數據:

      • **SWE-Pro 56.22%**,和 GPT-5.3-Codex 打平

      • MLE Bench Lite 66.6%獎牌率,僅次于 Opus-4.6 和 GPT-5.4

      • 原生支持 Agent Teams,多智能體協作

      • Always-reasoning 模式,始終開啟思考鏈

      問題是——228B 參數,普通人怎么跑?答案是量化。但 MiniMax 的量化比一般模型坑多得多

      為什么標準量化在 MiniMax 上翻車?

      這是寫這篇文章最想說的一件事:標準 MLX 均勻量化在 MiniMax-M2.7 上完全失效——MMLU 直接降到 ~25%,基本等于隨機猜

      原因在于 MoE 架構的路由器(Router Gate)

      均勻量化連路由器一起壓了,導致 token 被分配到錯誤的專家上,整個模型就廢了

      所以 Mac 用戶想跑 M2.7,目前只有兩條靠譜的路

      路徑一:JANGTQ + MLX Studio(推薦!)

      JANGTQ(JANG TurboQuant)是目前最小體積、最高質量的 M2.7 Apple Silicon 量化方案,來自 JANGQ-AI 團隊

      核心思路:混合精度量化。路由專家 MLP(占 98% 參數)用 2-bit codebook + Hadamard 旋轉壓縮,而 Attention、共享專家、Router Gate 保持 8-bit 或 fp16。


      硬核數據:

      指標

      數值

      磁盤占用

      56.5 GB

      GPU 顯存

      56.5 GB

      MMLU(200題)

      91.5%

      速度(M3 Ultra)

      ~44 tok/s

      你沒看錯——2-bit 量化,只要 56.5GB,MMLU 居然能打到 91.5%。對比標準 MLX 量化的 ~25%,這差距簡直是天壤之別

      怎么跑:

      最簡單的方式是用 MLX Studio(內置了 JANGTQ 運行時和 Metal 內核):

      命令行方式也行:

      pip install jang-tools

      from huggingface_hub import snapshot_download
      from jang_tools.load_jangtq import load_jangtq_model
      from mlx_lm import generate

      model_path = snapshot_download("JANGQ-AI/MiniMax-M2.7-JANGTQ")
      model, tokenizer = load_jangtq_model(model_path)

      messages = [{"role": "user", "content": "用5句話解釋光合作用"}]
      prompt = tokenizer.apply_chat_template(messages, add_generation_prompt=True, tokenize=False)
      out = generate(model, tokenizer, prompt, max_tokens=600, verbose=True)

      # 剝離推理鏈獲取最終答案
      if""in out:
      out = out.split("")[-1].strip()
      print(out)

      硬件要求:

      機器

      最低內存

      預期速度

      M3 Ultra / M2 Ultra

      96 GB

      ~44 tok/s

      M4 Max

      96 GB

      ~35-40 tok/s

      M4 Pro

      64 GB

      ~25-30 tok/s(非常緊張)

      64GB 的 M4 Pro 理論上能跑,但會很緊張

      96GB 是比較舒服的起點

      路徑二:LM Studio + GGUF(最省心)

      如果你就想點幾下鼠標就開跑,LM Studio 是最簡單的選擇。

      LM Studio 已經上線了 MiniMax-M2.7 的 GGUF 版本,基于 llama.cpp b8778 量化。

      使用步驟:

      1. 下載安裝 LM Studio:https://lmstudio.ai/download

      2. 搜索minimax/minimax-m2.7

      3. 選擇量化版本下載

      4. 設置參數:Temperature=1.0(必須!)、Top K=40、Top P=0.95

      5. 開始對話

      GGUF 來源是lmstudio-community/MiniMax-M2.7-GGUF。如果追求更好的量化質量,Unsloth 提供了 22 個 Dynamic 2.0 量化版本,逐層差異化量化,質量全面優于標準 imatrix。

      但有個大問題:LM Studio 官方標注最低系統內存 138GB

      兩條路徑,怎么選?
      兩條路徑對比

      維度

      JANGTQ + MLX Studio

      LM Studio / GGUF

      最小磁盤

      56.5 GB

      ~108 GB

      最低內存

      64 GB

      138 GB

      MMLU 質量

      91.5%

      ~64-65%(4-bit)

      速度(M3 Ultra)

      ~44 tok/s

      待測

      易用性

      需安裝 jang-tools

      開箱即用

      生態兼容

      MLX 生態

      OpenAI 兼容 API

      我的建議:

      • 96GB 以下的 Mac→ 只能走 JANGTQ,別無選擇

      • 128GB+ 且需要 OpenAI 兼容 API→ LM Studio / GGUF 更方便

      • 追求最佳質量→ JANGTQ 碾壓,2-bit 打 4-bit,這個結果說實話我也很意外

      ?? 關鍵設置提醒

      不管走哪條路,這幾個參數必須注意:

      1. Temperature 必須設 1.0—— temp=0 會導致思考鏈死循環,模型會一直 下去停不了

      2. max_tokens ≥ 8192—— Always-reasoning 模型的思考過程需要足夠空間

      3. 內存必須大于模型文件大小—— 否則回退到硬盤卸載,速度斷崖式下降

      總結

      MiniMax-M2.7 在 Mac 上的本地部署,JANGTQ 是目前當之無愧的最優解——體積最小、質量最高。2-bit 量化能拿到 91.5% MMLU,這在我寫過的所有量化方案里都算炸裂級別的。

      LM Studio 勝在省心和生態兼容,但內存門檻太高。

      如果你手上有一臺 96GB+ 的 Mac,強烈建議先試試 JANGTQ

      56.5GB 下載完就能跑,44 tok/s 的速度日常使用完全夠了。

      .7

      制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      糖尿病一口番茄不能嘗?再次強調:不想得糖尿病腎病,遠離這6物

      糖尿病一口番茄不能嘗?再次強調:不想得糖尿病腎病,遠離這6物

      健康之光
      2026-05-11 16:35:09
      我60歲了絕經已經6年,被閨蜜拉著跟67歲退休醫生去云南玩8天

      我60歲了絕經已經6年,被閨蜜拉著跟67歲退休醫生去云南玩8天

      小虎新車推薦員
      2026-05-08 19:40:44
      青海17歲女學生溺亡!主動去的橋邊,知情人曝猛料,恐不止是意外

      青海17歲女學生溺亡!主動去的橋邊,知情人曝猛料,恐不止是意外

      北緯的咖啡豆
      2026-05-12 11:29:42
      女子線上買榴蓮破防,5房果開出3房幾乎沒肉的“榴蓮糖”,聯系客服后退款50%

      女子線上買榴蓮破防,5房果開出3房幾乎沒肉的“榴蓮糖”,聯系客服后退款50%

      大象新聞
      2026-05-12 22:46:09
      申花簽下馬萊加三年長約,鋒線補強球迷期待新賽季

      申花簽下馬萊加三年長約,鋒線補強球迷期待新賽季

      漫川舟船
      2026-05-13 00:16:35
      入住兩年,發現打再多柜子,都不如一個800庫好用,讓雜物全消失

      入住兩年,發現打再多柜子,都不如一個800庫好用,讓雜物全消失

      室內設計師有料兒
      2026-05-11 09:30:15
      特朗普上飛機前坦白,對華稱呼已變,美參議員:不能再向中國讓步

      特朗普上飛機前坦白,對華稱呼已變,美參議員:不能再向中國讓步

      觸摸史跡
      2026-05-13 01:59:17
      褲子上這兩根繩,一定還有它存在的道理!

      褲子上這兩根繩,一定還有它存在的道理!

      新住家居
      2026-05-12 06:06:10
      蚌埠演唱會驚天騙局?成龍20 分鐘撈金離場?觀眾花千元看場笑話

      蚌埠演唱會驚天騙局?成龍20 分鐘撈金離場?觀眾花千元看場笑話

      做一個合格的吃瓜群眾
      2026-05-12 15:10:23
      張本智和回到日本 當眾懺悔:本該贏下梁靖崑 心理和技術都有問題

      張本智和回到日本 當眾懺悔:本該贏下梁靖崑 心理和技術都有問題

      風過鄉
      2026-05-12 20:36:06
      南京一學區房小區24小時狂增250套!一學區房5天大降70萬元!

      南京一學區房小區24小時狂增250套!一學區房5天大降70萬元!

      科學發掘
      2026-05-13 00:01:50
      季后賽被橫掃后就退役!湖人離隊第一人!三年“躺賺”3300萬美元

      季后賽被橫掃后就退役!湖人離隊第一人!三年“躺賺”3300萬美元

      鳴哥說體育
      2026-05-12 18:44:49
      女子因18元奶茶被親姐拉黑,崩潰大哭:離婚帶娃5年,都看不起我

      女子因18元奶茶被親姐拉黑,崩潰大哭:離婚帶娃5年,都看不起我

      辣媒專欄記錄
      2026-05-11 08:21:59
      卡塞米羅驚人評價:貝爾比C羅更全面,梅西是防守者的噩夢

      卡塞米羅驚人評價:貝爾比C羅更全面,梅西是防守者的噩夢

      星耀國際足壇
      2026-05-13 00:14:08
      太神奇了!場場三分命中率五成以上,苦熬七年,終于能拿億元合同

      太神奇了!場場三分命中率五成以上,苦熬七年,終于能拿億元合同

      球毛鬼胎
      2026-05-12 21:38:02
      寶媽就兒子割包皮跟寶爸吵了八百回,網友說:割了能更持久?

      寶媽就兒子割包皮跟寶爸吵了八百回,網友說:割了能更持久?

      燈錦年
      2026-05-10 19:22:52
      以軍被炸上天,給全世界教訓:大意輕敵,再精銳也能輸得一塌糊涂

      以軍被炸上天,給全世界教訓:大意輕敵,再精銳也能輸得一塌糊涂

      愛吃醋的貓咪
      2026-05-10 22:06:14
      2026最火的6部韓劇,每部都太適合熬夜追了

      2026最火的6部韓劇,每部都太適合熬夜追了

      小Q侃電影
      2026-05-12 22:20:48
      專家:女性生育力“余額”無聲流失,35歲后呈斷崖式下降

      專家:女性生育力“余額”無聲流失,35歲后呈斷崖式下降

      南方都市報
      2026-05-12 08:48:40
      水谷隼徹底揭穿張本宇一家在日本受尊重的謊言!

      水谷隼徹底揭穿張本宇一家在日本受尊重的謊言!

      生活新鮮市
      2026-05-13 02:38:57
      2026-05-13 04:51:00
      Ai學習的老章 incentive-icons
      Ai學習的老章
      Ai學習的老章
      3395文章數 11150關注度
      往期回顧 全部

      數碼要聞

      Google發布全新AI原生筆記本產品線Googlebooks

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

      體育要聞

      騎士終于玩明白了?

      娛樂要聞

      白鹿風波升級!掉粉20萬評論區淪陷

      財經要聞

      利潤再腰斬 京東干外賣后就沒過過好日子

      科技要聞

      宇樹發布載人變形機甲,定價390萬元起

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      時尚
      教育
      本地
      藝術
      軍事航空

      普通人真該學學如何穿搭!多穿裙子比褲子更時髦,大方提氣質

      教育要聞

      求求你試試「5+1+1」學習法!!!

      本地新聞

      用蘇繡的方式,打開江西婺源

      藝術要聞

      震驚!他竟用鏡頭看透了所有女人的秘密!

      軍事要聞

      知情人士披露:美國或考慮恢復對伊朗軍事行動

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产成人免费高清直播| 久久人妻视频免费观看| 99免费在线观看视频| 亚洲精品成人福利网站| 亚洲日韩中文字幕天堂不卡| 国产精品自在在线午夜区app| 渭源县| 国产成人精品区一区二区| 三区在线视频| 伊人在线视频| 亚洲精品在线亚洲人妻| 亚洲一区二区三区无码久久| 日韩乱码一区| 亚洲中文字幕久久精品无码喷水| 午夜亚洲aⅴ无码高潮片苍井空| 国产三级在线一区二区| 亚洲中文字幕不卡无码| 无码激情亚洲一区| 亚洲最大三级网站| 少妇爆乳无码专区| 青草国产精品久久久久久久久| av国产剧情一区二区三区| A级毛片无码久久精品免费| 久久综合色一综合色88| 免费能看大奶子的黄色1片.| 国产乱子伦视频在线播放| 亚洲男人的天堂久久香蕉网| 成人一区专区在线观看| 久久九九国产精品怡红院| 一区二区三区精品视频免费播放 | 美女毛片一区二区三区四区| 污网站免费在线| 亚洲a∨国产av综合av下载| 欧美精品一二三区| 国产美女深夜福利在线一| 欧美顶级裸体met自慰| 丝袜a∨在线一区二区三区不卡| free性欧美精品videos | 国产精品导航一区二区| 午夜a福利| 成年女人色毛片|