屠龍少年終于歸來
DeepSeek 上一次讓全世界矚目,還是在去年的春節前發布 V3 和 R1。
這一年多,圈子里反復問同一個問題:DeepSeek 什么時候發新模型?
每次有風吹草動就一群人轉發,每次都是誤報,甚至還有一些公司等不及了開始公開喊話。
![]()
DeepSeek 儼然已經成為大模型開源社區的精神圖騰。
4月24日,DeepSeek V4 開源。屠龍少年終于回來了。
它一發布,全球開發者幾小時內就開始部署、微調、評測,連我們的程序員都自發地連夜接入到 ColaOS。
但和去年 V3 發布的時候比,今天的大模型的開源社區已經變得更加繁榮,Qwen、Kimi、GLM、MiniMax,在過去的一年里都在瘋狂地迭代和開源。
兩個模型,一個生態
就在 V4 發布的同一周,Kimi K2.6 也剛開源,兩者有很多相似之處,同樣是萬億參數,32B 激活,同樣是在 Coding 和 Agent 能力方面已經逼近海外旗艦模型。
在很多朋友的測試中,V4 似乎還存在不少的bug,可能和新上線部署未調試完成有關,總體口碑 K2.6 的整體效果比 V4 要更好一些,同時支持多模態,不需要再銜接一個圖片處理模型,方便了很多。
有趣的是,K2.6 用了 DeepSeek 開源的 MLA 注意力機制,把 KV Cache 壓縮率做到 93% 以上的架構,已經從 DeepSeek 的原創變成了業界標準。
V4 用了 Muon 優化器。這個優化器最早是獨立研究者提出的,月之暗面團隊做了關鍵改進,在萬億參數規模上驗證了穩定性,預訓練全程零 Loss Spike。
![]()
因為開源,技術自然流動。
相比美國那邊 A 社和 OpenAI 都在閉源中互卷,開源生態里是一副和諧促進的景象。
大模型估值的迷思
前天跟朋友吃飯才知道,DeepSeek 最新估值是 400 多億美金,并不是之前傳聞的 100 億。
100 億對于 DeepSeek 的價值來說,確實也太少了。
看看其他的幾家模型公司,已經上市的,智譜 500 億美金估值,MiniMax 300 億美金估值。
即將在港股上市的 Kimi 現在大約 200 億美金估值。
朋友們開玩笑說,錯過了 MiniMax 和智譜,不能再錯過 Kimi,都等著打新。
我們再看看海外,OpenAI 8500 億美金估值,Anthropic 甚至達到了離譜的一兆美金估值。
中國這幾家大模型公司的價格,只不過是個零頭而已。
這中間的差異是 20-50 倍,遠遠超過一個匯率。
![]()
到底是美國貴了,還是中國便宜了呢?
兩邊的市場自有各自的道理。
美國那邊的估值里有太多敘事溢價和 IPO 預期,但中國這邊也確實被低估了。當模型能力已經逼近甚至持平海外旗艦,當開源讓全球開發者都在用你的模型,20-50 倍的估值差距,顯然無法持續。
中美,開源與閉源
說到美國那邊,不得不聊幾句我最近的擔憂。
Anthropic 現在的狀態確實很猛,Claude Code 的能力有目共睹,產品發布速度也極快。但他們的價值觀讓人有點害怕,那種"只有我們能定義模型安全"的傲慢姿態,背后是對控制權的執念。
OpenAI 這邊,雖然以前大家調侃它是 ClosedAI,但比起 Anthropic 的封閉姿態都顯得要好一些了。
只是"好一些",還遠遠不夠。
通向 AGI 的大模型技術,如果由兩家閉源模型公司壟斷,那將是全人類的最大的風險。
模型必須開源開放,世界才有美好的未來。
還有一件不能忽略的事,就是國產芯片的適配。
現在國內缺卡現象太嚴重了,最近各家的 Coding Plan 都在紛紛漲價。
萬億大模型適配國產卡,是關乎整個生態能不能真正普及的問題。
DeepSeek、Kimi 等模型都在積極地做昇騰適配,這件事的意義甚至比模型的指標進步意義更大。
![]()
三年前,中國的大模型公司大多還未成立。
三年后,萬億參數的模型紛紛發布并開源。
屠龍少年,終于歸來,不過這次,不止一位。
文:Orange
圖:ColaOS
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.