<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>

<p id="tp1vn"></p>

<sub id="tp1vn"><p id="tp1vn"></p></sub>

<u id="tp1vn"><rp id="tp1vn"></rp></u>

<meter id="tp1vn"></meter>

<wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>

日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao

<em id="jgp37"></em>

<em id="jgp37"></em>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

Claude Opus 蒸餾Qwen3.6-35B-A3B，開源了，消費級顯卡輕松跑

2026-05-12 07:21:23　來源: Ai學習的老章

北京舉報

0

分享至

兄弟們，Claude Opus 蒸餾 Qwen3.6-35B-A3B 來了——Qwopus3.6-35B-A3B-v1，名字看著像是 Qwen 和 Opus 談了場戀愛生的孩子，跑在單張 5090 上能飆到 161.9 tok/s

模型主頁：huggingface.co/Jackrong/Qwopus3.6-35B-A3B-v1

Qwen3.6-35B-A3B 底模是什么

總參數 35B ，實際激活參數只有 3B
共有 256 個專家（experts）
原生支持 262k 超長上下文
架構特點： Gated DeltaNet 線性注意力 + 標準門控注意力混合
定位：高性能 Agent 編碼、深度推理、多模態任務
對比同門 27B 稠密版，吞吐直接起飛

MoE 架構的好處在這里體現得很明顯：推理時只激活一小部分參數，速度快、顯存省

Base Model Benchmark 精調做了什么

Jackrong 在Qwen3.6-35B-A3B上用三階段課程學習 SFT 做了精調：

第一階段（格式建立）
短到中等長度的格式穩定推理樣本，主要任務是把輸出格式和基本推理路徑固定下來，避免底模的風格被破壞

第二階段（復雜度提升 + 多教師蒸餾）
逐步加大復雜推理樣本比例，蒸餾數據來自一個 27B 教師模型——刻意選了跟底模風格接近的，防止能力跨度太大導致學不進去

第三階段（長上下文強化 + 抗漂移）
強化長上下文推理，同時保留 10% 短樣本回放，防止模型忘掉基本指令跟隨能力（災難性遺忘）

訓練方法：LoRA 精調，可訓參數約占總參數的 9%

? 作者自己也寫了：9% 是個有風險的配置——MoE 架構下這么高的可訓參數比例，訓練不穩定和權重合并沖突的概率會顯著上升

關鍵測評數據

Evaluation Screenshot 1

Evaluation Screenshot 2

Evaluation Screenshot 3

Evaluation Screenshot 4

Evaluation Screenshot 5

Evaluation Screenshot 6

速度是最大亮點：

RTX 5090 單卡 平均 161.9 tok/s
比同量級 27B 密集模型快 2.6 倍
對消費級單卡來說，這個吞吐率相當驚人

特別擅長的場景：

一鍵生成 HTML/CSS 前端 ：評測報告說這是目前最強的開源 one-shot 前端生成模型之一，生成的頁面帶復雜微交互和動效組件，功能完整、可直接用
復雜推理 + 長上下文 JSON 提取 ：修復了早期版本的 "thinking starvation" 問題，多步 Agent 規劃的結構化輸出更穩定
原生 Vision + Tool Calling ：如果要開視覺能力，需要把 mmproj.gguf 放到主 .gguf 同目錄下
262K 上下文 + 顯存基本不漲 ：歸功于 Gated DeltaNet 的線性注意力，序列拉再長，顯存也不會爆炸

還放出了 GGUF 量化版，本地跑非常省事

地址：Jackrong/Qwopus3.6-35B-A3B-v1-GGUF

?? 一個坑要先說清楚

如果你想在本地做 LoRA 微調或合并權重，注意：

? PEFT/LoRA + Transformers 5.x + Unsloth 補丁三者之間有已知兼容性問題

合并 LoRA 權重時可能報錯，類似：

ModuleNotFoundError: Could not import module 'Qwen3_5MoeForContinualGeneration'

MoE 專家層的權重結構跟普通密集模型差很多，容易觸發結構不匹配。如果要在本地精調，做好手動打補丁或降級特定庫版本的心理準備

老章怎么看

這個模型的價值點在于：把 35B 規模的 MoE 在消費級單卡上跑出了接近專業級的吞吐

對做 UI 生成、Agent 編排、長上下文推理的開發者來說，這個模型值得試一試。精調質量加上 MoE 的速度優勢，在同類社區模型里算是比較亮眼的

制作不易，如果這篇文章覺得對你有用，可否點個關注。給我個三連擊：點贊、轉發和在看。若可以再給我加個，謝謝你看我的文章，我們下篇再見！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

下個月的蘋果 WWDC，假如 iCloud 變成 iClaw......?

愛范兒 2026-05-11 18:15:10
0 跟貼 0
微軟報告引發市場爭議：Windows電腦比MacBook Neo更勝一籌？

財聯社 2026-05-12 11:48:14
4 跟貼 4

蘋果被曝Vision Pro團隊去年已拆分，Safari瀏覽器、Siri的AI升級成重點

智東西 2026-05-11 16:35:05
1 跟貼 1

DDR5暴漲627%的背后，AI正在“搶走”你的內存

鈦媒體APP 2026-05-12 10:47:07
14 跟貼 14
吧友賣高端顯卡回歸PS5！道出真相引無數玩家共鳴

游民星空 2026-05-11 21:11:04
12 跟貼 12

不上云、不租卡，如何優雅地在本地微調Qwen-VL-30B？

機器之心Pro 2026-01-13 12:57:27
0 跟貼 0

《異環》七彩虹iGame RTX 50系列顯卡DLSS測試：二游畫質新標桿

3DM游戲 2026-05-12 12:33:08
3 跟貼 3
沖刺3400億估值，翁荔親自出鏡，交出一款更像人的大模型

智東西 2026-05-12 15:33:00
3 跟貼 3

2500億美元的xAI死了，但SpaceXAI的算力游戲才剛開始

鈦媒體APP 2026-05-11 11:15:26
0 跟貼 0
13年不寫代碼，5天花200美元重建400萬美元產品——YC掌門人是怎么做到的？

華爾街見聞官方 2026-05-11 10:52:07
30 跟貼 30
從參數到外觀：汽車行業的最后一場競爭

基地邊緣BaseEdge 2026-05-08 17:48:10
1 跟貼 1
龍哥見狀趕緊打出手勢，樹上的狙擊手接到指令后

由你玩四年 2026-05-09 12:04:54
0 跟貼 0
ChatGPT、豆包集體翻車：AI沒有價值觀，只有「求生欲」

雷科技 2026-05-11 21:18:29
406 跟貼 406
Moltbot作者被Claude刁難后：MiniMax M2.1是最優秀的開源模型

量子位 2026-01-29 13:17:17
0 跟貼 0
姚來英已任中國煙草總公司總經理

界面新聞 2026-05-12 11:12:28
7939 跟貼 7939
007新作配置要求流出，這門檻是認真的？

晚星歸航2 2026-05-11 06:04:27
15 跟貼 15
游戲閃光彈炸壞主機？這鍋真不該游戲背

霧野尋蹤2 2026-05-10 17:28:39
1 跟貼 1
速度和節奏，到底哪個才是王道

神秘研究院 2026-05-08 16:59:01
0 跟貼 0
巫師3十年老游戲幀數翻三倍，民間大神整出DLSS 4.5黑科技

宇宙來信發 2026-05-11 20:04:36
0 跟貼 0
改了兩個導出設置，我的照片終于不再"變臉"了

硅嶼手記 2026-05-10 05:04:56
0 跟貼 0
卡帕西都整破防了：AI Coding沒門檻，可部署環節真嗯啊的難

量子位 2026-03-27 12:12:46
29 跟貼 29
開盒Claude Code的原來是中國00后！曾怒懟Anthropic竊取用戶代碼

量子位 2026-04-02 15:24:09
215 跟貼 215
UE 5.8預覽版來了：Mesh Terrain是亮點，但MegaLights才真香

霧野尋蹤2 2026-05-12 23:22:44
0 跟貼 0
中考物理 “坑王題”！這道滑輪題幾乎踩中所有坑，中考前必啃透

天物地理 2026-05-12 20:45:52
0 跟貼 0
上海的共享單車也有變速車了！騎起來“追風”快感拉滿，但起步費20元，網友吐槽“比打車還貴”

新聞晨報隨申Hi 2026-05-12 22:38:09
0 跟貼 0
多名車主感嘆"停車位縮水"：停車像在參加"極限挑戰"

都市快報橙柿互動 2026-05-12 15:26:35
1812 跟貼 1812
九寨溝將實行“雙向檢票”？工作人員：出園檢票并非新政策，一直嚴禁溝內住宿

上游新聞 2026-05-11 15:40:24
3041 跟貼 3041
絕殺！OpenAI正式接管人類耳朵，首個GPT-5級推理音頻模型來了

新智元 2026-05-12 19:36:49
6 跟貼 6
新聞要點，伊朗最高領袖會見，武裝部隊司令并下達指令！

搞笑的大耳朵 2026-05-11 16:34:59
0 跟貼 0
溫州一企業在蕪湖拿地二十年陷困局：區劃調整后，原招商承諾難兌現

澎湃新聞 2026-05-12 17:36:28
35 跟貼 35
法國新法落地：歸還?“260萬被搶文物”有多艱難？｜重建現場

新京報動新聞 2026-05-11 01:46:32
856 跟貼 856
便衣武警聽到指令，立即改變站姿

暴走的圖圖 2026-05-12 11:04:37
1 跟貼 1
營銷翻車，OPPO高級副總裁直降兩級

財天COVER 2026-05-12 18:32:19
6 跟貼 6
海軍新型末端防空反導系統現身指揮屏滿屏打上馬賽克

環球網資訊 2026-05-12 14:31:32
1266 跟貼 1266
遠程鎖電，監管強硬亮劍一鍋端8家車企，續航縮水竟出自廠家手筆

南宗歷史 2026-05-12 18:50:06
6 跟貼 6
廣州中考名額分配：約11.6萬名考生競爭3.2萬個名額

南方都市報 2026-05-12 15:40:10
85 跟貼 85
13歲女孩沉迷“二次元”，花光父親18萬積蓄買畫稿，最貴一張5400元，畫稿師：不知對方是未成年人，愿退費

環球網資訊 2026-05-12 19:26:13
395 跟貼 395
羅湖一小區使用近30年內部路或將收回？部門：超出紅線范圍

南方都市報 2026-05-12 11:51:22
332 跟貼 332
OpenAI前CTO創業的模型首秀，與面壁智能「撞車」了

智東西 2026-05-12 20:09:32
0 跟貼 0
安卓17更新：谷歌加速手機AI落地，還發了臺高端PC

雷科技 2026-05-13 04:12:52
0 跟貼 0

糖尿病一口番茄不能嘗？再次強調：不想得糖尿病腎病，遠離這6物

糖尿病一口番茄不能嘗？再次強調：不想得糖尿病腎病，遠離這6物

健康之光

2026-05-11 16:35:09

我60歲了絕經已經6年，被閨蜜拉著跟67歲退休醫生去云南玩8天

我60歲了絕經已經6年，被閨蜜拉著跟67歲退休醫生去云南玩8天

小虎新車推薦員

2026-05-08 19:40:44

青海17歲女學生溺亡！主動去的橋邊，知情人曝猛料，恐不止是意外

青海17歲女學生溺亡！主動去的橋邊，知情人曝猛料，恐不止是意外

北緯的咖啡豆

2026-05-12 11:29:42

女子線上買榴蓮破防，5房果開出3房幾乎沒肉的“榴蓮糖”，聯系客服后退款50%

女子線上買榴蓮破防，5房果開出3房幾乎沒肉的“榴蓮糖”，聯系客服后退款50%

大象新聞

2026-05-12 22:46:09

申花簽下馬萊加三年長約，鋒線補強球迷期待新賽季

申花簽下馬萊加三年長約，鋒線補強球迷期待新賽季

漫川舟船

2026-05-13 00:16:35

入住兩年，發現打再多柜子，都不如一個800庫好用，讓雜物全消失

入住兩年，發現打再多柜子，都不如一個800庫好用，讓雜物全消失

室內設計師有料兒

2026-05-11 09:30:15

特朗普上飛機前坦白，對華稱呼已變，美參議員：不能再向中國讓步

特朗普上飛機前坦白，對華稱呼已變，美參議員：不能再向中國讓步

觸摸史跡

2026-05-13 01:59:17

褲子上這兩根繩，一定還有它存在的道理！

褲子上這兩根繩，一定還有它存在的道理！

新住家居

2026-05-12 06:06:10

蚌埠演唱會驚天騙局？成龍20 分鐘撈金離場？觀眾花千元看場笑話

蚌埠演唱會驚天騙局？成龍20 分鐘撈金離場？觀眾花千元看場笑話

做一個合格的吃瓜群眾

2026-05-12 15:10:23

張本智和回到日本當眾懺悔：本該贏下梁靖崑心理和技術都有問題

張本智和回到日本當眾懺悔：本該贏下梁靖崑心理和技術都有問題

風過鄉

2026-05-12 20:36:06

南京一學區房小區24小時狂增250套！一學區房5天大降70萬元！

南京一學區房小區24小時狂增250套！一學區房5天大降70萬元！

科學發掘

2026-05-13 00:01:50

季后賽被橫掃后就退役！湖人離隊第一人！三年“躺賺”3300萬美元

季后賽被橫掃后就退役！湖人離隊第一人！三年“躺賺”3300萬美元

鳴哥說體育

2026-05-12 18:44:49

女子因18元奶茶被親姐拉黑，崩潰大哭：離婚帶娃5年，都看不起我

女子因18元奶茶被親姐拉黑，崩潰大哭：離婚帶娃5年，都看不起我

辣媒專欄記錄

2026-05-11 08:21:59

卡塞米羅驚人評價：貝爾比C羅更全面，梅西是防守者的噩夢

卡塞米羅驚人評價：貝爾比C羅更全面，梅西是防守者的噩夢

星耀國際足壇

2026-05-13 00:14:08

太神奇了！場場三分命中率五成以上，苦熬七年，終于能拿億元合同

太神奇了！場場三分命中率五成以上，苦熬七年，終于能拿億元合同

球毛鬼胎

2026-05-12 21:38:02

寶媽就兒子割包皮跟寶爸吵了八百回，網友說：割了能更持久？

寶媽就兒子割包皮跟寶爸吵了八百回，網友說：割了能更持久？

燈錦年

2026-05-10 19:22:52

以軍被炸上天，給全世界教訓：大意輕敵，再精銳也能輸得一塌糊涂

以軍被炸上天，給全世界教訓：大意輕敵，再精銳也能輸得一塌糊涂

愛吃醋的貓咪

2026-05-10 22:06:14

2026最火的6部韓劇，每部都太適合熬夜追了

2026最火的6部韓劇，每部都太適合熬夜追了

小Q侃電影

2026-05-12 22:20:48

專家：女性生育力“余額”無聲流失，35歲后呈斷崖式下降

專家：女性生育力“余額”無聲流失，35歲后呈斷崖式下降

南方都市報

2026-05-12 08:48:40

水谷隼徹底揭穿張本宇一家在日本受尊重的謊言！

水谷隼徹底揭穿張本宇一家在日本受尊重的謊言！

生活新鮮市

2026-05-13 02:38:57

Ai學習的老章

Ai學習的老章

3395文章數 11150關注度

往期回顧全部

數碼要聞

Google發布全新AI原生筆記本產品線Googlebooks

頭條要聞

特朗普稱將同中方討論對臺軍售和黎智英案外交部回應

頭條要聞

特朗普稱將同中方討論對臺軍售和黎智英案外交部回應

體育要聞

騎士終于玩明白了？

娛樂要聞

白鹿風波升級！掉粉20萬評論區淪陷

財經要聞

利潤再腰斬京東干外賣后就沒過過好日子

科技要聞

宇樹發布載人變形機甲，定價390萬元起

汽車要聞

吉利銀河“TT”申報圖曝光電動尾翼+激光雷達

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

藝術

旅游

本地

公開課

活久見！電棍與香鍋怒噴被擼圈開除后和解，祝Mlxg母親節日快樂

藝術要聞

震驚！他竟用鏡頭看透了所有女人的秘密！

旅游要聞

故宮擠滿游客，人人撐傘前行：寧愿熱到出汗，也要奔赴紫禁城！

本地新聞

用蘇繡的方式，打開江西婺源

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：人妻无码AⅤ不卡中文字幕| 国产在线精选免费视频8x| 自偷自拍亚洲综合精品| 92国产精品午夜福利| 欧美成人精品高清视频在线观看| 婷婷色爱区综合五月激情| 69影院少妇在线观看| 国产精品成人无码a 无码| 在线成人网站| 亚洲图片自拍偷图区| 亚洲区一区二| 激情综合亚洲色婷婷五月app| 欧美日韩国产另类图片区| 精品视频在线观看免费观看| 日韩aⅴ影视| 亚洲Av综合日韩精品久久久| 999国内精品永久免费视频| 国产丝袜一区二区三区在线不卡 | 福利小视频在线播放| 亚洲欧美国产国产一区二区三区| 黑人巨大无码中文字幕无码| 午夜AAAAA级岛国福利在线| 2021久久超碰国产精品最新| 体验区试看120秒啪啪免费| 久久香蕉超碰97国产精品| 日韩AV影视| 国产又爽又黄又舒服又刺激视频| 99久久无码一区人妻a黑| 人妻久久久| 成人网页在线观看| 把女邻居弄到潮喷的性经历| bt天堂新版中文在线| 97亚洲色| 亚洲熟妇中文字幕五十中出| 色翁荡熄又大又硬又粗又视频| 日本a在线播放| 欧美在线观看a| 日本高清无卡码一区二区久久| 欧美性爱视频免费在线观看| 国产精品国产对白熟妇| 高颜值午夜福利在线观看|

<sub id="9yuiy"><p id="9yuiy"></p></sub>

<rt id="9yuiy"><fieldset id="9yuiy"></fieldset></rt>

<wbr id="9yuiy"><var id="9yuiy"><th id="9yuiy"></th></var></wbr>

<dfn id="9yuiy"><form id="9yuiy"></form></dfn>

<strike id="9yuiy"></strike>