2026年4月24日,DeepSeek把新一代V4推上臺面。外面一邊喊“終于來了”,一邊盯著它憋了15個月的沉默。
同一時間,行業里到處在比拼每周70到80小時的“硬扛”,DeepSeek卻被貼上“不打卡、六七點下班”的標簽。不加班的研究團隊,真能跑贏拼命三郎嗎?神秘的沉默,是在蓄力,還是在承壓?
![]()
大模型這行的日常,很多人早就熟了。會議一場接一場,迭代按周計算,指標像鬧鐘一樣催命,深夜燈光成了“努力”的裝飾。
頭部公司搶人更直接,核心算法、訓練、推理、工程架構,能打仗的那批人,幾乎都被放進“重點爭奪清單”。
在這種氛圍里,DeepSeek的節奏顯得反常。很多團隊把“熬”當成捷徑,它卻更像在做時間預算,把一天的高質量工作切得很硬。
![]()
梁文峰的邏輯也很“理工”。他把人的有效專注當成上限,把疲勞狀態下的決策當成風險,認為那會反過來浪費算力。
這句話聽上去像管理學雞湯,放在大模型訓練里就變得很現實。訓練一次就要燒掉大量資源,糟糕的判斷可能讓一堆卡白跑。
![]()
DeepSeek把“少熬夜”當成制度,不是為了躺平,更像把算力當成國之重器那樣精打細算,寧愿慢一點,也要把每一步踩實。
慢就意味著等待。R1當年震動行業后,外界盯著它下一步,心態很快分裂成兩派:一派等“王者歸來”,一派覺得“神話要散”。
最抓人的不是慢,而是靜。團隊從上到下長期低調,發布節奏像深海一樣,外界越喧鬧,它越像沒聽見。
![]()
這種安靜并非沒有代價。時間越長,圍繞它的想象越多,想象越多,落地時的落差就越容易被放大。
更現實的沖擊來自人。大模型不是流水線,真正決定上限的,往往是少數人的方法論和手感,核心作者的流動會直接改寫團隊的“內功”。
![]()
過去一段時間里,DeepSeek陸續出現關鍵成員離開:有人去了小米,有人被騰訊吸走,有人轉去字節,還有從早期一路跟著創業的人,去了自動駕駛創業公司。
這些去向不奇怪。巨頭在這一輪里展現的能力不止是錢,還有平臺、數據、產品入口、算力儲備、融資敘事,組合起來像一張更大的網。
獵頭圈的報價更像加速器。翻兩三倍的薪資只是起步,有的直接給到八位數總包,放在任何行業都足夠讓人認真重新計算人生。
![]()
DeepSeek并不窮,問題在于它曾經不靠融資,也就缺少一個人人看得懂的“標尺”。
期權這件事,在沒有清晰估值時很尷尬。員工手里拿著紙面承諾,卻沒法像上市公司那樣隨時對照價格,心里難免打鼓。
![]()
更刺眼的是對比。別的公司資本故事走得快,MiniMax、智譜等被市場高度關注,財富兌現的速度更快,賬面數字很容易變成真實身家。
當對比出現,選擇就變得像多選題:繼續在實驗室里磨長期問題,還是去更快兌現回報的地方。很多人不是不熱愛研究,只是扛不住現實。
在這種壓力下,梁文峰開始接受融資的可能性。外界報道里出現過一個很醒目的數字:3000億元估值。
![]()
估值高不高是一回事,更關鍵的是它意味著公司愿意把自己放進更透明的市場坐標里,讓“期權值多少”不再靠想象。
人才之外,還有一種更隱蔽的壓力,叫預期錯位。
很多人希望DeepSeek每次出手都像R1那樣“炸場”,模型一發就改寫輿論,順帶把同行逼到墻角。
![]()
這種期待很爽,技術規律卻不配合。大模型演進更像攀巖,真正的難點常常是穩定性、數據治理、后訓練策略、推理效率,屬于慢工活。
DeepSeek對自己的“使命感”也更硬核。它不僅追求智能上限,還把兩件事放進核心任務里。
一件是適配國產芯片跑大模型。V4發布后,華為昇騰很快同步支持,意味著它從架構到工程都在為國產算力生態預留空間。
![]()
另一件是更強調原創式探索。它愿意去做一些大廠不愿意碰、創業公司不敢碰的長期方向,像在研究樹上種“慢結果”。
這兩件事放在一起,解釋了它為什么不急著追熱點。外界想看“爆款”,它更像在搭“底座”,把中國自己的技術路線走穩。
![]()
也正因為路線不同,組織形態也不同。DeepSeek的內部不像典型互聯網公司那樣層層管理,更像一個大型實驗室。
據接近團隊的人描述,研究團隊規模過百,層級卻極少,基本只有梁文峰和研究員兩層。
沒有“二把手”的強勢中轉,意味著信息更直達,決策更像學術討論而非KPI博弈,代價是對創始人的組織能力要求極高。
![]()
更少的層級也帶來更大的自由度。研究員可以自由組隊,也能一個人啃長期問題,節奏像做課題,不像趕項目。
外界常見的打卡、硬績效、強deadline,在這里存在感很弱。它不靠“吼出來的速度”,更靠“磨出來的質量”。
![]()
梁文峰在團隊里的角色,也更像導師型負責人:一邊協調資源,一邊參與研究,成果署名方式更接近科研共同體的習慣。
這種氣質也解釋了他為什么顯得神秘。見過他的人常提到,他不像傳統意義的CEO,更像一個把注意力鎖在技術細節上的研究員。
這些細節拼起來,會讓人對“神話”兩個字產生新的理解。DeepSeek的傳奇不靠話術,更像靠一種反潮流的專注。
![]()
就連公益事件也帶著同樣的低調。2022年,幻方體系里曾出現過一位化名“一只平凡的小豬”的員工,以個人名義捐出1.38億元。
外界猜測身份猜到沸騰,相關方回應的態度卻很一致:捐款是匿名的,公司內部也未必知道是誰。
![]()
這件事的意義不在“是誰”,而在“這種文化”。能把巨額捐贈做得不張揚,說明團隊更看重事情本身,不太迷戀曝光。
把這些線索連成一條時間線,就能看見DeepSeek的真實處境。
R1之后的15個月,它用沉默換取打磨空間,外界則用想象給它抬高舞臺。
舞臺越高,風越大,核心成員的流失就越刺眼,巨頭的挖人像在最關鍵的骨架上拆螺絲。
![]()
它選擇用融資來對沖不確定性,用更明確的價值尺度穩住軍心,盡量把長期研究的“風險”變成可承受的成本。
它也用國產芯片適配來回答另一道大題:大模型不是一家公司自己的勝負,更是中國算力生態、工程能力、算法體系的整體進階。
![]()
很多人把“不加班”當成故事的噱頭,我更愿意把它當成一種資源觀。
當行業都在用時間堆產出時,它把高質量時間當成稀缺品,把算力當成硬通貨,把人當成需要保護的“長期資產”。
這種打法未必處處適用,卻對中國科技很有價值。中國不缺勤奮,缺的是把勤奮用在刀刃上的組織能力,缺的是敢把短期熱鬧換成長期領先的耐心。
![]()
V4在2026年4月24日到來,意味著它選擇繼續走這條路。路上有被挖人的疼,有預期錯位的噪音,也有組織形態帶來的不確定。
其實DeepSeek究竟靠什么“創造神話”,答案反而更樸素:靠少而精的專注、靠對算力與人才的節制使用、靠把國產生態納入主線任務。
![]()
大模型競賽不是比誰熬得更久,而是比誰更能把有限的時間、人才、算力,變成中國自己的長期優勢。
信息來源:
[1]科技連線|DeepSeek V4上線,AI世界正在改變的規則 澎湃新聞
[2]剛剛,直線猛拉!DeepSeek V4正式發布 中國基金報
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.