網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

新發(fā)代碼藏彩蛋！114個(gè)文件泄密 DeepSeek新模型為“MODEL1”？

2026-01-22 01:06:38　來(lái)源: AI先鋒官

北京舉報(bào)

分享至

作者｜子川

來(lái)源｜AI先鋒官

作為明星產(chǎn)品，必須得用放大鏡看！

正值DeepSeek-R1 發(fā)布一周年之際，DeepSeek 在 GitHub 上悄悄更新了一波代碼。

結(jié)果，眼尖的開(kāi)發(fā)者在 DeepSeek 核心的推理優(yōu)化庫(kù)FlashMLA中，發(fā)現(xiàn)了一個(gè)此前從未公開(kāi)過(guò)的神秘代號(hào)：“MODEL1”。

目前，行業(yè)內(nèi)普遍猜測(cè)，這極有可能就是DeepSeek即將發(fā)布的下一代旗艦?zāi)Ｐ汀?/p>

而這次曝光的“MODEL1”，到底是什么來(lái)頭？

首先，我們要知道它是怎么被發(fā)現(xiàn)的。

這次泄露的源頭，來(lái)自DeepSeek的一個(gè)開(kāi)源項(xiàng)目——FlashMLA。

可能大家對(duì)FlashMLA不太熟悉，這里給大家簡(jiǎn)單介紹一下。

這是DeepSeek自研工具，專門為英偉達(dá)GPU做深度優(yōu)化。

正是有了它，DeepSeek才能在模型架構(gòu)層面減少內(nèi)存占用，把GPU硬件的性能榨干到極致，從而實(shí)現(xiàn)了“低成本高性能”。

而在最近更新的代碼中，開(kāi)發(fā)者們發(fā)現(xiàn)在橫跨114個(gè)文件中，有28處都明確提到了“MODEL1”這個(gè)新標(biāo)識(shí)符。

在代碼邏輯里，“MODEL1”是與“V32”（也就是DeepSeek-V3.2）并列存在的。

這意味著，它絕不是V3版本的簡(jiǎn)單修補(bǔ)，而是一個(gè)采用了全新架構(gòu)的獨(dú)立模型。

根據(jù)技術(shù)大神的深度分析，“MODEL1”的核心變化主要體現(xiàn)在“回歸標(biāo)準(zhǔn)”和“極致效率”上。

以前的V3模型，為了追求極致性能，采用了一種比較特殊的576維設(shè)計(jì)，而“MODEL1”則切換回了512維的標(biāo)準(zhǔn)配置。

這樣做的好處非常明顯：它能更好地適配英偉達(dá)下一代Blackwell（SM100）芯片。

不僅如此，“MODEL1”還引入了更高級(jí)的“稀疏化”技術(shù)。

在代碼中，出現(xiàn)了大量針對(duì)FP8（8位浮點(diǎn)數(shù)）數(shù)據(jù)格式的解碼支持，以及鍵值（KV）緩存的優(yōu)化。

它能在處理極長(zhǎng)內(nèi)容時(shí)，智能地跳過(guò)不重要的計(jì)算步驟，同時(shí)利用FP8格式把記憶內(nèi)容進(jìn)行高保真壓縮。

這直接帶來(lái)的結(jié)果就是：內(nèi)存占用大幅降低，計(jì)算效率成倍提升。

這意味著，可以用更便宜的顯卡，就能跑得動(dòng)更強(qiáng)的模型。

那么，這個(gè)“MODEL1”到底是傳說(shuō)中的V4，還是推理模型R2？

目前行業(yè)內(nèi)主要有兩種看法。

一種觀點(diǎn)認(rèn)為，它是DeepSeek V4。

按照 DeepSeek 的命名慣例，在 V3.2 之后的旗艦級(jí)架構(gòu)跨越，邏輯上即為 V4。

并且此前就有外媒報(bào)道，DeepSeek計(jì)劃在2月（春節(jié)前后）發(fā)布新一代旗艦?zāi)Ｐ蚔4，且內(nèi)部測(cè)試顯示其編程能力已經(jīng)超越了市場(chǎng)上的頂級(jí)模型。

另一種觀點(diǎn)則認(rèn)為，它是DeepSeek R2。

最近一個(gè)月，DeepSeek團(tuán)隊(duì)連續(xù)發(fā)布了兩篇重磅技術(shù)論文，介紹了一種名為“優(yōu)化殘差連接（mHC）”的新訓(xùn)練方法，以及一種模仿生物大腦的“AI記憶模塊（Engram）”。

如果“MODEL1”整合了這些最新的黑科技，讓AI擁有了類似人類的記憶機(jī)制，那它極有可能就是備受期待的“推理之王”R2。

不論是V4還是R2，至少有一點(diǎn)可以確定，DeepSeek的新模型快發(fā)布了！

結(jié)合目前模型文件結(jié)構(gòu)來(lái)看，“MODEL1”很可能已接近訓(xùn)練完成或推理部署階段，正等待最終的權(quán)重凍結(jié)和測(cè)試驗(yàn)證。

這意味著，新模型的上線時(shí)間越來(lái)越近了。

那個(gè)曾在全球掀起波瀾的“DeepSeek時(shí)刻”還會(huì)在今年重現(xiàn)嗎？我們拭目以待！

掃碼邀請(qǐng)進(jìn)群，我們帶你一起來(lái)玩轉(zhuǎn)ChatGPT、GPT-4、文心一言、通義千問(wèn)、訊飛星火等AI大模型，順便學(xué)一些AI搞錢技能。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點(diǎn)推薦

Claude Code終于長(zhǎng)出調(diào)度臺(tái)：一個(gè)屏幕盯住所有AI會(huì)話，無(wú)需多開(kāi)

新智元 2026-05-12 12:35:45
0 跟貼 0
微軟提出Computer-Using World Model，教智能體理解動(dòng)作的后果

機(jī)器之心Pro 2026-03-09 11:59:44
0 跟貼 0

Claude Code 源碼泄露了，有人用Python復(fù)刻了一個(gè)極簡(jiǎn)版

機(jī)器之心Pro 2026-04-02 11:30:10
4 跟貼 4

960萬(wàn)人圍觀！Claude Code工程師談HTML“復(fù)興”：Agent時(shí)代，Markdown不夠用了

智東西 2026-05-12 12:41:12
12 跟貼 12
龍蝦退燒后，榮耀給它造了一個(gè)宇宙

量子位 2026-05-12 15:50:23
6 跟貼 6

TTS也要真人感！首個(gè)字級(jí)內(nèi)容、毫秒級(jí)停頓控制的語(yǔ)音合成系統(tǒng)

新智元 2026-05-12 19:36:35
0 跟貼 0

17歲少年泄露戰(zhàn)略重器

臧老師 2026-05-11 19:48:05
61 跟貼 61
一只太空螃蟹教孩子學(xué)Rust：20章故事書(shū)有了雙語(yǔ)交互版

硅嶼手記 2026-05-12 06:56:22
0 跟貼 0

公司斥巨資挖來(lái)的程序員，老板都不敢惹她，直到有幸看到她的技術(shù)

陌陌說(shuō)時(shí)尚 2026-05-09 09:48:18
0 跟貼 0
Valve內(nèi)部代碼泄露！Steam Machine四款配置、預(yù)約機(jī)制全部曝光

快科技 2026-05-12 14:50:13
2 跟貼 2
國(guó)外技術(shù)就是強(qiáng)悍，瑞士自動(dòng)迫擊炮系統(tǒng)，中國(guó)目前很難達(dá)到

松離搞笑家 2026-05-12 16:30:44
3 跟貼 3
一特斯拉Model 3服役7年跑了61萬(wàn)公里后，實(shí)測(cè)續(xù)航縮水34.2%

IT之家 2026-05-10 21:38:29
1048 跟貼 1048
特斯拉最后一輛Model S/X下線

不看車bukanche 2026-05-10 10:43:17
0 跟貼 0
終于來(lái)了！DeepSeek灰度測(cè)試聊天記錄搜索功能，非常實(shí)用

雷科技 2026-05-12 18:37:44
11 跟貼 11
姚來(lái)英已任中國(guó)煙草總公司總經(jīng)理

界面新聞 2026-05-12 11:12:28
7916 跟貼 7916
機(jī)關(guān)單位干部為境外間諜撰寫文章，一年內(nèi)泄露22篇，獲利兩萬(wàn)余元

星視頻 2026-05-11 14:40:04
0 跟貼 0
送文件撞破老板秘密，場(chǎng)面瞬間尷尬，我該怎么自救！

松鼠的搞笑日記 2026-05-11 10:58:54
1 跟貼 1
拼桌吃飯被詐騙700萬(wàn)，接下來(lái)我拿出一個(gè)工牌，對(duì)方瞬間傻眼了！

一休愛(ài)生活 2026-05-11 09:20:35
1 跟貼 1
這司機(jī)技術(shù)也不行

大哥搞笑配音 2026-05-12 16:03:47
4 跟貼 4
時(shí)間旅行者的孫女：一段被代碼截?cái)嗟?9年愛(ài)情

晚風(fēng)也遺憾 2026-05-12 11:41:45
0 跟貼 0
聰明的戰(zhàn)士駕駛智能魚(yú)雷，炸毀鬼子的軍艦

影中見(jiàn)影 2026-05-12 19:05:11
2 跟貼 2
我穿便裝到妻子家過(guò)年，被廳長(zhǎng)大舅哥使喚，警衛(wèi)員送來(lái)文件他腿軟

左允新鮮事 2026-05-11 10:47:31
0 跟貼 0
《極限競(jìng)速地平線6》PC遭偷跑官方已鎖定泄露源

3DM游戲 2026-05-12 09:17:08
1 跟貼 1
龍蝦軍團(tuán)有了最強(qiáng)「視力」！一眼看圖直接寫代碼-1

機(jī)器之心Pro 2026-04-02 16:56:32
0 跟貼 0
AReaL v1.0開(kāi)源，智能體強(qiáng)化學(xué)習(xí)「一鍵接入」

機(jī)器之心Pro 2026-03-05 14:46:18
0 跟貼 0
AI導(dǎo)演贏麻了兩行代碼“縫補(bǔ)”一生遺憾人類真要集體失業(yè)？

網(wǎng)易科技態(tài)度見(jiàn)聞 2026-05-11 18:11:04
0 跟貼 0
從能力到商品：Skills市場(chǎng)正在重塑開(kāi)發(fā)者的生產(chǎn)方式

36氪 2026-03-20 10:24:05
0 跟貼 0
搶在中方接機(jī)前，特朗普隨行人員名單變了，英偉達(dá)第一個(gè)被踢出局

影孖看世界 2026-05-12 21:58:56
1 跟貼 1
Anthropic CEO：如果我是25歲，不會(huì)選編程，會(huì)選

機(jī)器之心Pro 2026-04-18 12:00:00
0 跟貼 0
九寨溝將實(shí)行“雙向檢票”？工作人員：出園檢票并非新政策，一直嚴(yán)禁溝內(nèi)住宿

上游新聞 2026-05-11 15:40:24
2953 跟貼 2953
Steam客廳PC主機(jī)有四種套裝！還有全新防黃牛機(jī)制

Steam社區(qū) 2026-05-12 11:52:45
2 跟貼 2
多名車主感嘆"停車位縮水"：停車像在參加"極限挑戰(zhàn)"

都市快報(bào)橙柿互動(dòng) 2026-05-12 15:26:35
1812 跟貼 1812
嘴炮王者譚sir竟被邏輯女帝反殺成渣：愿大姐被歲月溫柔以待

解壓小劇場(chǎng) 2026-05-09 08:17:50
398 跟貼 398
美公開(kāi)文件：目擊者稱UFO走出身高不足1.2米生物

長(zhǎng)星寄明月 2026-05-11 04:35:33
0 跟貼 0
別了，黃仁勛！

李榮茂 2026-05-12 19:02:04
6 跟貼 6
智元?dú)⑦M(jìn)香港！2026成為部署態(tài)元年，機(jī)器人不再只會(huì)跳舞了

雷科技 2026-05-12 21:59:45
0 跟貼 0
OpenAI前CTO創(chuàng)業(yè)的模型首秀，與面壁智能「撞車」了

智東西 2026-05-12 20:09:32
0 跟貼 0
海外研選 | 大摩：2030年服務(wù)器CPU市場(chǎng)規(guī)模或達(dá)2830億美元

財(cái)聯(lián)社 2026-05-12 20:07:11
0 跟貼 0
大哥開(kāi)車秀導(dǎo)航，打敗智能的，竟然是最原始的它

笑出豬叫研究所 2026-05-12 17:39:49
3 跟貼 3
李想首度回應(yīng)造芯！棄用傳統(tǒng)GPU路線，200人團(tuán)隊(duì)苦干四年

車東西 2026-05-12 20:46:16
0 跟貼 0

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

新發(fā)代碼藏彩蛋！114個(gè)文件泄密 DeepSeek新模型為“MODEL1”？

宇樹(shù)發(fā)布載人變形機(jī)甲，定價(jià)390萬(wàn)元起

特朗普稱將同中方討論對(duì)臺(tái)軍售和黎智英案 外交部回應(yīng)

特朗普稱將同中方討論對(duì)臺(tái)軍售和黎智英案 外交部回應(yīng)

騎士終于玩明白了？

白鹿風(fēng)波升級(jí)！掉粉20萬(wàn)評(píng)論區(qū)淪陷

利潤(rùn)再腰斬 京東干外賣后就沒(méi)過(guò)過(guò)好日子

吉利銀河“TT”申報(bào)圖曝光 電動(dòng)尾翼+激光雷達(dá)

態(tài)度原創(chuàng)

活久見(jiàn)！電棍與香鍋怒噴被擼圈開(kāi)除后和解，祝Mlxg母親節(jié)日快樂(lè)

極簡(jiǎn)主義下的居住場(chǎng)域與空間

震驚！他竟用鏡頭看透了所有女人的秘密！

求求你試試「5+1+1」學(xué)習(xí)法!!!

知情人士披露：美國(guó)或考慮恢復(fù)對(duì)伊朗軍事行動(dòng)

特朗普稱將同中方討論對(duì)臺(tái)軍售和黎智英案外交部回應(yīng)

特朗普稱將同中方討論對(duì)臺(tái)軍售和黎智英案外交部回應(yīng)

利潤(rùn)再腰斬京東干外賣后就沒(méi)過(guò)過(guò)好日子

吉利銀河“TT”申報(bào)圖曝光電動(dòng)尾翼+激光雷達(dá)