![]()
半年內,月之暗面估值翻 4 倍,融資超 39 億美元。
文丨程曼祺
編輯丨宋瑋
《晚點 LatePost》獨家獲悉,Kimi (月之暗面)即將完成新一輪 20 億美元融資,投后估值突破 200 億美元。本輪融資由美團龍珠領投,中國移動、CPE(源峰資本)等參投,其中僅龍珠就出手超 2 億美元。
今年 1 月和 2 月,Kimi 剛密集完成 3 輪融資 ,分別融了 5 億美元、 7 億美元和 7 億美元。算上這筆最新融資,不到半年里,Kimi 融資超 39 億美元,最新估值相比去年 11 月的約 43 億美元翻了 4 倍有余。
至此,Kimi 累計融資額已超 376 億人民幣,成為大模型創業公司中累計融資最多的公司。算上 IPO 募資,MiniMax 累計融資約 150 億人民幣,智譜約 130 億人民幣。截至 5 月 6 日午間休市,MiniMax 市值約 2100 億人民幣,智譜約 3470 億人民幣。
美團龍珠合伙人王新宇告訴我們,K2.5 模型更新后,Kimi ARR(年度經常性收入)在今年 3 月初突破 1 億美元,在 4 月繼續增長至超 2 億美元,付費訂閱和 API 調用都在加速。
完成新融資前夕,Kimi 最新模型 K2.6 在 4 月 20 日晚發布并開源。K2.6 強化了編程能力和 Agent 集群能力,可支持最多 300 個子 Agent 協作,Kimi 也開始同步測試 Claw 群組新功能。
這此前的一年多,Kimi 經歷了戰略、士氣和投融資行情的多方面觸底反彈。
2025 年 1 月 20 日,Kimi 發布推理模型 Kimi K1.5,對標 OpenAI o1 。同一天,DeepSeek 發布并開源 DeepSeek-R1。
盡管 K1.5 在一些 benchmark 上超越了當時的領先模型 GPT-4o 和 Claude 3.5 Sonnet ,但市場注意力幾乎全被 DeepSeek 吸引。隨后的 2025 年春節,DeepSeek 以 0 投放斬獲數千萬日活,一舉超越 2024 年大額投放的 Kimi,也一度超越了字節豆包。
那是 Kimi 的艱難時期。2025 年春節后,kimi 有了 3 個重要變化:
- 以 “持續拿到 SOTA(模型最佳表現)” 為最優先級目標。
- 大幅減少 C 端投放。
- 從閉源走向開源。
那之后,Kimi 在方向選擇和具體技術成果上都有不錯的表現。
選定 coding 和 Agent:“生產力優先” 落到了行動
和智譜類似,Kimi 是中國公司中較早開始側重編程能力的團隊,而編程又是通用 Agent 的最核心能力。
這與楊植麟一直說的 “生產力場景優先”、“效率場景優先” 一脈相承。但在 2024 年,Kimi 動作依然發散,也嘗試過海外 to C 產品和視頻生成。
2025 年后,Kimi 更加聚焦。這一年 7 月開源的 Kimi K2 和 2026 年 1 月至今的 K2.5 與 K2.6 都在持續強化編程和 Agent 能力。
其中,K2 是一款 Kimi 借鑒 DeepSeek 經驗,補課預訓練能力后的模型,采取了與 DeepSeek-V3 類似的 MoE(混合專家模型)與 MLA(Multi-Head Latent Attention,多頭潛在注意力)架構,把總參數擴展到 1T(萬億參數),強化了編程和多輪工具調用等 agent 能力。2 個月后,Kimi 推出 Agent 功能 “OK Computer”(后改名 Kimi Agent)。K2.5 則首次引入視覺能力,并開始支持智能體群模式。
![]()
Artificial Analysis 的綜合智能指數。 Kimi K2.6 低于 OpenAI、Anthropic 和 Google DeepMind 三家公司的新模型,高于 Meta 的 Muse 和 xAI 的 Grok。
K2.5 對編程和 Agent 的優化適用于 OpenClaw(業內稱 “龍蝦”),Kimi 也迅速在 2 月 15 日推出了云端龍蝦 Kimi Claw,支持低門檻的一鍵部署。
模型進化疊加產品更新,Kimi 今年以來的收入、訂閱用戶數大幅增長。
- 據全球支付平臺 Stripe 數據,自 2026 年 1 月底以來,Kimi 近 20 天收入超越 2025 年全年總和。其個人訂閱用戶 1 月支付訂單數環比增長超 8000%,2 月環比再漲超 120%。
- 據 Similarweb 數據,Kimi 海外 API 開放平臺在 K2.5 發布后日均訪問量暴漲 10-20 倍。
MuonClip、Attention Residuals,技術影響力顯現
在具體技術成果上,2025 年年初,Kimi 在 16B 的 Moonlight 模型上驗證了 Keller Jordan 2024 年開源的 Muon 優化器(原初版本是在 1.5B 模型上做驗證),后來又在 1T 規模的 K2 上提出 Muon 的一個改進版 MuonClip,后被廣泛采用。
Kimi 創始人楊植麟曾在多個公開場合提及這一成果,以此作為技術 “taste” 的例子。剛剛發布的 DeepSeek-V4 也使用了 Muon 優化器,并進一步提出了新改進。
Moonlight 共同一作之一 Jingyuan Liu 已于 2025 年年中加入 Meta,近期加入了 Thinking Machines Lab。
2025 年 10 月,Kimi 推出實驗性的線性注意力架構模型 Kimi-Liner。該模型在開源的 DeltNet Attention 基礎上做了進一步修改。
為更好探索線性注意力,Kimi 從 AI 研究者楊松林發起的 FLA 線性注意力開源社區中招募了貢獻頗多的活躍開發者張宇和陳廣宇。張宇是蘇州大學計算機科學與技術學院博士,陳廣宇是一位高中生。
2026 年 3 月,Kimi 提出 Attention Residuals(注意力殘差),它引入了 Transformer 中的注意力機制,解決傳統殘差連接(Residual Connection)的信息稀釋、訓練不穩定等痛點。殘差鏈接是深度神經網絡已使用十幾年的一項基礎技術。馬斯克在推特轉發了這個成果,“Impressive work from Kimi”。
Attention Residuals 有三位核心作者:Kimi 從 FLA 社區挖掘的陳廣宇和張宇,還有人稱 “蘇神” 的蘇劍林。他是大模型中廣泛使用的 RoPE(旋轉式位置編碼)的作者,獨自一人在廣州工作。
Attention Residuals 與 DeepSeek 2025 年年底的 mHC(Manifold-Constrained Hyper-Connections 流形約束超連接) 想實現的效果有相似之處。而 mHC 改進的 HC 又是字節跳動 Seed 團隊提出的。
HC、mHC、Attention Residuals,這些接連出現的技術改進是中國 AI 人才密度與競爭烈度的產物。
從 “太貴” 到 “好便宜”
2024 年底,《晚點 LatePost》曾在《中國大模型生存戰:巨頭圍剿,創業難熬》里提到,面對 “會跳舞的大象” 字節,中國一批大模型創業公司壓力巨大。
18 個月來,兩個關鍵事件使創業公司的 “一線生機” 逐漸打開。
一是 DeepSeek-R1 使開源模型生態真正繁榮、活躍,眾多開源模型之間的技術交流加速了大模型進化;二是 Agent 應用加快普及,同期上市的智譜、MiniMax 股價趁勢大漲,刺激更多資金涌向大模型行業。
目前,MiniMax 和智譜的市值在 2000~4000 億人民之間波動。這讓估值約 1400 億人民幣的 Kimi 成為一個熱門投資標的。
接下來,這些模型公司面臨的重要課題是繼續保持模型 SOTA 和驗證 “token” 經濟的商業模式。
模型能力的核心是人才。2026 年初,Kimi 創始人楊植麟在全員信中提到:2026 年公司平均激勵將是 2025 年的 200%,并計劃大幅上調期權回購額度 。
2026 年 4 月初,《晚點 LatePost》也報道了 Kimi 給實習生發期權 “穿越計劃”。由于 Kimi 估值在數月內就翻了 4 倍多、且尚未上市,它的期權變得有吸引力。
盡管如此,Kimi 現在正面臨不小的人才壓力,由于其在編程、 agent 等領域的優異表現和這一應用方向的白熱化競爭,Kimi 相關人員已成為競爭對手的重點挖角對象。
而在商業模式上,中國大模型創業公司普遍在用兩種方式賺取收入:一是通過 API 提供模型,按 token 實際用量來收費;二是基于自己的模型做應用,獲取按月/年定額的付費用戶。能否及時獲得高質量算力,能否以高效推理控制好成本,以及能否用產品體驗帶來 “溢價” 是證明商業模式的關鍵。獲得足夠多的錢是這一切的基礎。
題圖來源:Rush
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.