網易首頁 > 網易號 > 正文申請入駐

總理座談會兩大青年精英以萬億AI答卷驚艷全球

2026-04-30 15:12:36　來源: 魏家東

北京舉報

分享至

2026年4月下旬，全球AI圈被中國兩家創業公司的動作徹底點燃。周一，月之暗面開源萬億參數模型KimiK2.6；周四，深度求索帶著1.6萬億參數的DeepSeekV4登場。一周之內，兩個中國萬億級開源大模型先后落地，刷新全球紀錄。更讓人意外的是，這兩家公司的創始人——楊植麟和梁文鋒，都是廣東人。過去14個月，他們先后走進國務院總理李強的座談會，從“追硅谷”到“硅谷回頭看”，兩個廣東年輕人，正用技術答卷，撐起中國AI的半壁江山。

一、一周雙響：中國AI的“萬億時刻”

春節后就被調侃“下周一定”的DeepSeekV4，終于在4月24日官宣。1.6萬億參數、100萬token上下文、全量開源，直接打破開源模型的參數與上下文上限。技術文檔近60頁，字字硬核，而行業人翻完文檔才反應過來：這已經是本周第二個中國萬億開源模型。

4月20日，月之暗面的KimiK2.6率先開源，同樣是萬億參數MoE架構，支持300個子Agent協同工作，能自主拆解復雜長周期任務。上線僅幾天，就在OpenRouter平臺沖到全球調用量第一，力壓Claude、Gemini等海外巨頭。

兩個模型，路線互補：DeepSeek主攻深度推理、長文本理解和算力效率；Kimi專注多Agent集群、復雜工程落地。看似“內卷”，實則是中國AI的“雙向奔赴”——你補我短，我助你長，一起把中國開源模型的天花板越抬越高。

二、廣東雙雄：從潮汕與粵西走出的AI領軍人

14個月，兩場總理座談會，兩個廣東年輕人，先后坐在總理對面，交出“萬億答卷”。

楊植麟，1992年生于廣東汕頭，典型的“學霸天花板”。保送清華，CMU博士，師從蘋果AI研究負責人和DeepMind首席科學家，年紀輕輕就站在國際AI前沿。2023年創立月之暗面，2024年春節公司估值突破25億美元，33歲的他，成了中國AI最年輕的掌舵人之一。他的愿景是“承包一片森林，而不是種一棵樹”——不做單一模型，要建完整AI生態。

梁文鋒，1985年生于廣東湛江吳川，父親是小學老師。吳川一中高考狀元，浙大碩士，骨子里帶著粵西人的務實與敢闖。2015年創辦幻方量化，靠量化交易4年做到管理規模100億，2021年突破1000億。賺錢后他不搞虛的，悄悄囤算力：2021年“螢火二號”裝了約1萬張英偉達A100，當時國內有這規模GPU的公司不超過5家。2021年創辦深度求索，從量化大佬變身AI創業者，他說：“中國必然需要有人站到技術的前沿”。

一個從潮汕走進國際頂級實驗室，一個從粵西算力牌桌殺出，背景天差地別，卻在同一條賽道相遇，做出同樣的選擇：深耕基礎大模型，堅持開源，對標全球頂尖。

三、14個月同步：從技術撞車到生態共生

翻看過去15個月，DeepSeek和Kimi的動作同步到讓人懷疑“約好的”，三次關鍵節點，次次同頻。

2025年1月20日，同一天，DeepSeek開源推理模型R1，Kimi發布對標OpenAIo1的K1.5，相隔僅兩小時。西方媒體稱DeepSeekR1是AI界的“斯普特尼克時刻”，兩家成全球最早復現o1思維鏈的團隊。

2025年2月，前后腳發論文，都在改Transformer注意力機制：DeepSeek的NSA做原生稀疏注意力，Kimi的MoBA做混合塊注意力，一起解決長文本算力消耗高的行業痛點。

2026年4月，萬億模型同周上線，K2.6和V4接力炸場，全球開源模型前五，中國占四個，K2.6排第一，V4排第二。

更有意思的是技術“互用”：V4用的Muon優化器，是月之暗面去年在KimiK2上率先驗證的；K2.6底層的MLA注意力機制，來自DeepSeek。沒有封閉保密，只有開放共享，這不是內卷，是中國AI的“生態接力”。

今年3月，Kimi放出“注意力殘差”技術，動了Transformer的地基，海外技術圈炸鍋，馬斯克親自留言認可。硅谷編程之王Cursor的旗艦模型，底層用的是KimiK2.5；日本樂天“自研”的7000億參數模型，核心結構和DeepSeekV3幾乎一致。黃仁勛在英偉達發布會，拿DeepSeek和Kimi當性能基準；Meta發布新模型，對標名單里只有Llama4、DeepSeek-V3.1和Kimi-K2。

數據更直白：OpenRouter一季度統計，中國開源模型周Token調用量占比超60%，Kimi和DeepSeek穩居前三。HuggingFace報告顯示，中國開源模型全球下載量占比41%，位居全球第一。曾經追硅谷的中國AI，如今成了全球標桿。

四、破局算力：兩條路，一個方向

美國收緊高端GPU出口，算力卡脖子成中國AI最大難題。DeepSeek和Kimi，走出兩條不同卻同向的路。

DeepSeekV4明確用華為昇騰芯片推理，官方直言：“受限于高端算力，目前Pro服務吞吐有限，下半年昇騰950批量上市后，價格會大幅下調”。從訓練到推理，深度綁定國產算力，把模型優化和國產芯片特性深度結合，FP4精度適配昇騰950，提前布局“去美化”算力生態。

Kimi走“雙線并行”：一邊和英偉達深度合作，K2.5入選英偉達DGXStation官方支持清單；一邊全力適配國產芯片，K2.6開源當天，壁仞科技就完成適配，昇騰平臺也跑通多模態推理。今年4月，Kimi提出“Prefill-as-a-Service”分離式推理架構，核心就是推進國產芯片混合推理，不把雞蛋放一個籃子。

不賭單一路線，不困于算力封鎖，兩家公司用行動證明：擺脫卡脖子，不止一條路。國產算力和海外算力雙線布局，技術自主和生態開放同步推進，這是中國AI的破局智慧。

五、從追趕到引領：中國AI的黃金時代

兩年前，中國AI還在拼命追OpenAI、追英偉達、追硅谷；兩年后的今天，硅谷開始回頭看中國。

14個月前，梁文鋒第一次走進總理座談會，中國AI要證明的是“能不能做出世界級基礎模型”；14個月后，楊植麟走進同一場合，問題變成“被算力封鎖，能不能持續做、一起做，讓基礎能力躍遷成常態”。

答案，他們已經用行動給出：能。

梁文鋒說：“我們不是有意成為一條鯰魚，只是不小心成了一條鯰魚”。如今看來，這條“鯰魚”，帶著另一條“鯰魚”，攪動了全球AI的格局。

楊植麟的“森林”愿景，正在成真：這片森林里，已經長出DeepSeek和Kimi兩棵夠得著云層的大樹。而森林之下，還有智譜、千問、Minimax等無數小樹，一起扎根中國土壤，面向全球生長。

當“人工智能+”成為國家戰略，當中國AI從技術跟隨到全球引領，兩個廣東年輕人的故事，不是偶然，是時代必然。他們用技術證明：中國AI，能站在世界之巔；中國創新，能改寫全球規則。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.