2026年4月下旬,全球AI圈被中國兩家創業公司的動作徹底點燃。周一,月之暗面開源萬億參數模型KimiK2.6;周四,深度求索帶著1.6萬億參數的DeepSeekV4登場。一周之內,兩個中國萬億級開源大模型先后落地,刷新全球紀錄。更讓人意外的是,這兩家公司的創始人——楊植麟和梁文鋒,都是廣東人。過去14個月,他們先后走進國務院總理李強的座談會,從“追硅谷”到“硅谷回頭看”,兩個廣東年輕人,正用技術答卷,撐起中國AI的半壁江山。
![]()
一、一周雙響:中國AI的“萬億時刻”
春節后就被調侃“下周一定”的DeepSeekV4,終于在4月24日官宣。1.6萬億參數、100萬token上下文、全量開源,直接打破開源模型的參數與上下文上限。技術文檔近60頁,字字硬核,而行業人翻完文檔才反應過來:這已經是本周第二個中國萬億開源模型。
4月20日,月之暗面的KimiK2.6率先開源,同樣是萬億參數MoE架構,支持300個子Agent協同工作,能自主拆解復雜長周期任務。上線僅幾天,就在OpenRouter平臺沖到全球調用量第一,力壓Claude、Gemini等海外巨頭。
兩個模型,路線互補:DeepSeek主攻深度推理、長文本理解和算力效率;Kimi專注多Agent集群、復雜工程落地。看似“內卷”,實則是中國AI的“雙向奔赴”——你補我短,我助你長,一起把中國開源模型的天花板越抬越高。
二、廣東雙雄:從潮汕與粵西走出的AI領軍人
14個月,兩場總理座談會,兩個廣東年輕人,先后坐在總理對面,交出“萬億答卷”。
楊植麟,1992年生于廣東汕頭,典型的“學霸天花板”。保送清華,CMU博士,師從蘋果AI研究負責人和DeepMind首席科學家,年紀輕輕就站在國際AI前沿。2023年創立月之暗面,2024年春節公司估值突破25億美元,33歲的他,成了中國AI最年輕的掌舵人之一。他的愿景是“承包一片森林,而不是種一棵樹”——不做單一模型,要建完整AI生態。
梁文鋒,1985年生于廣東湛江吳川,父親是小學老師。吳川一中高考狀元,浙大碩士,骨子里帶著粵西人的務實與敢闖。2015年創辦幻方量化,靠量化交易4年做到管理規模100億,2021年突破1000億。賺錢后他不搞虛的,悄悄囤算力:2021年“螢火二號”裝了約1萬張英偉達A100,當時國內有這規模GPU的公司不超過5家。2021年創辦深度求索,從量化大佬變身AI創業者,他說:“中國必然需要有人站到技術的前沿”。
一個從潮汕走進國際頂級實驗室,一個從粵西算力牌桌殺出,背景天差地別,卻在同一條賽道相遇,做出同樣的選擇:深耕基礎大模型,堅持開源,對標全球頂尖。
三、14個月同步:從技術撞車到生態共生
翻看過去15個月,DeepSeek和Kimi的動作同步到讓人懷疑“約好的”,三次關鍵節點,次次同頻。
2025年1月20日,同一天,DeepSeek開源推理模型R1,Kimi發布對標OpenAIo1的K1.5,相隔僅兩小時。西方媒體稱DeepSeekR1是AI界的“斯普特尼克時刻”,兩家成全球最早復現o1思維鏈的團隊。
2025年2月,前后腳發論文,都在改Transformer注意力機制:DeepSeek的NSA做原生稀疏注意力,Kimi的MoBA做混合塊注意力,一起解決長文本算力消耗高的行業痛點。
2026年4月,萬億模型同周上線,K2.6和V4接力炸場,全球開源模型前五,中國占四個,K2.6排第一,V4排第二。
更有意思的是技術“互用”:V4用的Muon優化器,是月之暗面去年在KimiK2上率先驗證的;K2.6底層的MLA注意力機制,來自DeepSeek。沒有封閉保密,只有開放共享,這不是內卷,是中國AI的“生態接力”。
今年3月,Kimi放出“注意力殘差”技術,動了Transformer的地基,海外技術圈炸鍋,馬斯克親自留言認可。硅谷編程之王Cursor的旗艦模型,底層用的是KimiK2.5;日本樂天“自研”的7000億參數模型,核心結構和DeepSeekV3幾乎一致。黃仁勛在英偉達發布會,拿DeepSeek和Kimi當性能基準;Meta發布新模型,對標名單里只有Llama4、DeepSeek-V3.1和Kimi-K2。
數據更直白:OpenRouter一季度統計,中國開源模型周Token調用量占比超60%,Kimi和DeepSeek穩居前三。HuggingFace報告顯示,中國開源模型全球下載量占比41%,位居全球第一。曾經追硅谷的中國AI,如今成了全球標桿。
![]()
四、破局算力:兩條路,一個方向
美國收緊高端GPU出口,算力卡脖子成中國AI最大難題。DeepSeek和Kimi,走出兩條不同卻同向的路。
DeepSeekV4明確用華為昇騰芯片推理,官方直言:“受限于高端算力,目前Pro服務吞吐有限,下半年昇騰950批量上市后,價格會大幅下調”。從訓練到推理,深度綁定國產算力,把模型優化和國產芯片特性深度結合,FP4精度適配昇騰950,提前布局“去美化”算力生態。
Kimi走“雙線并行”:一邊和英偉達深度合作,K2.5入選英偉達DGXStation官方支持清單;一邊全力適配國產芯片,K2.6開源當天,壁仞科技就完成適配,昇騰平臺也跑通多模態推理。今年4月,Kimi提出“Prefill-as-a-Service”分離式推理架構,核心就是推進國產芯片混合推理,不把雞蛋放一個籃子。
不賭單一路線,不困于算力封鎖,兩家公司用行動證明:擺脫卡脖子,不止一條路。國產算力和海外算力雙線布局,技術自主和生態開放同步推進,這是中國AI的破局智慧。
五、從追趕到引領:中國AI的黃金時代
兩年前,中國AI還在拼命追OpenAI、追英偉達、追硅谷;兩年后的今天,硅谷開始回頭看中國。
14個月前,梁文鋒第一次走進總理座談會,中國AI要證明的是“能不能做出世界級基礎模型”;14個月后,楊植麟走進同一場合,問題變成“被算力封鎖,能不能持續做、一起做,讓基礎能力躍遷成常態”。
答案,他們已經用行動給出:能。
梁文鋒說:“我們不是有意成為一條鯰魚,只是不小心成了一條鯰魚”。如今看來,這條“鯰魚”,帶著另一條“鯰魚”,攪動了全球AI的格局。
楊植麟的“森林”愿景,正在成真:這片森林里,已經長出DeepSeek和Kimi兩棵夠得著云層的大樹。而森林之下,還有智譜、千問、Minimax等無數小樹,一起扎根中國土壤,面向全球生長。
當“人工智能+”成為國家戰略,當中國AI從技術跟隨到全球引領,兩個廣東年輕人的故事,不是偶然,是時代必然。他們用技術證明:中國AI,能站在世界之巔;中國創新,能改寫全球規則。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.