文 | AI唱反調
5 月 14 日上午 9 點 30 分,納斯達克的電子盤上,CBRS 的開盤價第一個跳了出來:350 美元。
這是 Cerebras Systems 上市發行價 185 美元的 1.89 倍,是 3 個月前 Tiger Global 領投 H 輪融資時 230 億美元估值的 4 倍,也是 18 個月前阿聯酋投資方 G42 持股引爆美國外資審查、招股書被迫撤回時賬面估值 40 億美元的 23 倍。
盤中股價一度沖到 386 美元,收盤報 311.07 美元,全稀釋市值約 950 億美元,單日漲幅 68.2%——成為繼 2019 年 Uber 之后美國規模最大的科技公司上市事件(CNBC,2026/5/14)。
![]()
Andrew Feldman 這天站在納斯達克現場。11 年前他把上一家公司 SeaMicro 以 3.34 億美元賣給了 AMD,敲鐘的時候做夢也不敢想這次的數字——一夜之間,他個人持股賬面市值越過了 10 億美元。
同一時刻,英偉達總部里,似乎沒有人召集應急會議。
第二天 5 月 15 日,CBRS 高開后一路走低,盤中下探 275 美元,收盤約 280 美元,單日跌 10%(CNBC,2026/5/15)。兩個交易日的振幅是 109%,從首日收盤的回吐幅度是 28%。市值 36 小時內從 950 億美元跌回 850 億美元區間。
媒體的敘事一邊倒地從"AI 上市潮復蘇"切換到"AI 估值泡沫"。但真正值得追問的不是 Cerebras 的價格,而是英偉達那邊為什么沒有動靜——Cerebras 的旗艦芯片,第三方測試里推理 Llama 3 70B 模型比英偉達旗艦 GPU B200 快 21 倍(Cerebras 官方 vs NextBigFuture 復測,2026),Feldman 的履歷漂亮、產品參數驚人。
講真,按"AI 時代的硬件顛覆"劇本,老黃應該至少召集一次內部會議。
但他沒有。
他還在北京吃,吃得不亦樂乎。
![]()
晶圓的誘惑
Cerebras 賣的是"算力的奇觀"。
英偉達的 B200 是把多顆芯片用高速互連技術拼起來,每顆芯片 2080 億個晶體管。Cerebras 反其道——把整張 12 英寸晶圓當成一顆芯片用。
一張晶圓通常會被切成幾百顆 GPU,Cerebras 不切,整張做成單芯片,叫做"晶圓級芯片"(Wafer Scale Engine,簡稱 WSE)。
第三代 WSE-3 單片集成4 萬億個晶體管、90 萬個計算核心、44GB 片上高速緩存、5 納米制程,是地球上現存最大的單芯片。
這兩條技術路線的差距,集中在內存帶寬這一個核心指標上:
![]()
簡單翻譯技術語言就是:英偉達的體系最貴的那一段,是顯存和芯片之間的數據搬運——一顆 GPU 裝不下整個模型,所以需要不停地把權重從外部高帶寬顯存(HBM3e)搬到計算核心去用,搬運速度越快、推理越快,于是英偉達每年砸最多的錢在顯存升級和高速互連上。
Cerebras 直接繞開了這道坎——它把整個模型權重塞進 44GB 的片上緩存,根本不需要搬運,計算核心就在權重旁邊。所以在跑 70B 到 405B 量級的模型時,單臺 Cerebras 系統的吞吐量比一臺裝 8 塊英偉達 B200 的服務器還高。
這是技術意義上的奇觀。Feldman 把 11 年前在 SeaMicro 做"高密度微型服務器"的邏輯(同一套人馬)放大到了 AI 芯片——SeaMicro 當年以 3.34 億美元賣給 AMD 時,AMD 給的判斷是"微型服務器路線賭錯了",5 年后產品線被關停。Feldman 這次把"集成度極限"的玩法換了個賽道做了一遍。
但這里有個關鍵前提藏在 Cerebras 自家白皮書最末頁的但書里:
"如果跑的模型裝不進單張晶圓,性能會遠遠差于帶高速互連的英偉達 B200 和 B300 系統。"(NextBigFuture 復測原文)
總的來說,模型必須能裝進一張晶圓才能跑得快。44GB 片上緩存聽起來很大,但 GPT-4 量級(1.8 萬億參數)、Llama 3.1-405B、Grok 3 這種參數規模的前沿模型,要么需要切分到多張晶圓上(損失了"全在片上"的優勢)、要么需要走晶圓和晶圓之間的鏈路(損失了"省掉外部顯存搬運"的優勢)。
Cerebras 的 21 倍速度優勢成立的工作負載,集中在 70B 到 405B 的中型模型推理 + 科學超算仿真——這是個真實的市場,但不是英偉達在的那個市場。
英偉達 2026 財年第四季度單季的數據中心收入是 623 億美元(計算業務 513 億 + 網絡業務 110 億),同比增長 58%。Cerebras 2025 年全年總營收是 5.1 億美元(招股書,Tom's Hardware 轉引)。兩個數字的倍數關系是 122 倍——而且英偉達這 623 億里,沒有任何一個工作負載是 Cerebras 能完整替代的:
?訓練:超大模型訓練需要數千卡互聯,Cerebras 的晶圓間鏈路成熟度遠遠不夠;
?推理:Cerebras 只能打中型模型,前沿模型(GPT-5、Claude Opus 4.7、Gemini 3.1 Ultra)跑不進 44GB;
?多模態 / 視頻生成:需要高速互連配合大顯存;
?客戶多樣性:B200 裝在亞馬遜、微軟、谷歌、甲骨文四朵公有云里,每家自己的工作負載都不一樣。
Cerebras 在中型模型推理這塊確實贏了。問題是這塊占英偉達數據中心收入的 5%-8%——老黃一個季度的零頭。
阿布扎比的房間
Cerebras 的招股書中藏著一組比技術更扎眼的數字:
![]()
表面上 G42 的占比從 85% 降到 24%,但 G42 把訂單"分賬"給了關聯方 MBZUAI——這是 G42 控股的研究型大學,2025 年 62% 營收來自這一家。兩者合并仍是 86%,實際上是同一個客戶用兩個殼付錢。
更要命的是MBZUAI 一家占應收賬款 77.9%。換句話說,Cerebras 不僅在賺阿聯酋的錢,連賬期都押在阿聯酋身上。
美國外資投資委員會 2024 年 9 月之所以讓 Cerebras 撤回第一版招股書,就是因為 G42 持有 Cerebras 投票權股份,觸發了"國家安全審查"。
直到 G42 把持股改為非投票權(2025 年 10 月),Cerebras 才能重新進入上市流程。Cerebras 的客戶和股東曾經是同一家阿布扎比公司——這種結構在傳統二級市場會被打 30%-40% 估值折扣。
英偉達的客戶結構是另一個極端:2024-2025 年它的數據中心收入里沒有任何單一客戶超過 13%(年報披露),微軟、Meta、亞馬遜、谷歌、甲骨文、特斯拉、xAI、Anthropic(5 月 6 日剛把 Anthropic 加進來,整租了 Musk 在田納西州孟菲斯建的算力中心)排排坐。
Blackwell GPU 的在手訂單是 360 萬臺,售罄到 2026 年中(Yahoo Finance,2026)。老黃上一次電話會議給出的判斷是:Blackwell + Rubin 兩個世代累計收入將達到 1 萬億美元(2025-2027 三年)。
把 Cerebras 的 86% 阿聯酋集中度和英偉達"全球公有云 + 全球前沿實驗室"的客戶矩陣放在一起,你就懂老黃為什么不開會:Cerebras 在跑的賽道,英偉達不僅沒在跑,而且不打算去跑。
中東主權基金的 AI 算力采購,2024-2026 年是一個真實的需求池(沙特公共投資基金 + 阿布扎比穆巴達拉 + G42 加起來公開承諾的 AI 基礎設施投入超過 5000 億美元),但這是個由政治訂單驅動的市場,不是技術性能驅動的市場。MBZUAI 選 Cerebras 不是因為速度快 21 倍,是因為 G42 是 Cerebras 股東、Cerebras 是 G42 的國家級 AI 工程合作伙伴。這種關系一旦因為地緣政治翻車——美國二次審查、Trump 中東政策轉向、阿聯酋倒向中國 AI 供應鏈——Cerebras 86% 的營收會在一個季度內蒸發。
而英偉達沒有這個風險。它的客戶分散度足以吸收任何單一客戶、單一地區、單一應用的崩潰。
CUDA 的院墻
Cerebras 撼不動英偉達的最后一道墻,叫 CUDA。
CUDA 是英偉達 2007 年開始推的 GPU 編程平臺——所有用 GPU 跑深度學習的代碼,必須先用 CUDA 寫、用 CUDA 編譯、調用 CUDA 的算子庫。英偉達過去 18 年的真正護城河,從來不是 GPU 性能,是這套 CUDA 軟件生態。
![]()
說白了,過去 15 年里,AI 圈寫代碼這件事默認就是寫 CUDA。PyTorch、TensorFlow、JAX、vLLM、DeepSpeed、Triton——所有主流深度學習框架的底層默認假設是英偉達硬件。300 萬開發者已經把"AI = CUDA"內化成肌肉記憶。這不是性能能解決的事,是遷移成本能不能承受的事。AMD 用 MI300X 砸了 4 年自家生態,目前的現實是 AMD 拿到了 5%-7% 的市場,剩下 90%+ 還在英偉達手里。
Cerebras 比 AMD 更難,因為它根本不是 GPU 架構。晶圓級芯片用的是"數據流"架構,不能直接跑 CUDA 代碼,必須用 Cerebras 自家的開發工具。一個客戶從英偉達遷到 Cerebras 不是寫幾個接口適配,是要把整套訓練和推理流程重寫一遍。
MBZUAI 愿意這么做,是因為它本來就是 Cerebras 的合作伙伴,沒有歷史包袱。但任何一家已經在英偉達上跑了 2 年模型的公司——微軟、Meta、Anthropic、xAI、OpenAI——都不會做這個遷移。
老黃過去幾次財報會議反復強調一個觀點:"英偉達是一家軟件公司,順便做芯片。"("NVIDIA is a software company that happens to build chips.")從財務結構上看這話是真的:英偉達數據中心收入里網絡業務 + 軟件業務的占比正在快速上升,2026 財年第四季度網絡業務單項收入 110 億美元,同比 +263%——這部分跟 GPU 算力沒關系,是生態稅。
Cerebras 賣的是快 21 倍的飛機,英偉達賣的是機場 + 油料 + 維修 + 飛行員培訓 + 空中交通管制。當一家航空公司可以選"快 21 倍但只有一個機場可以起降"或者"普通速度但全球任意機場"時,它會選哪個,老黃心里跟明鏡似的。
所以老黃為什么不慌這件事,到這里就講完了。
賽道不重合——Cerebras 贏的是中型模型推理和超算仿真,占英偉達數據中心收入 5%-8%,老黃的訓練、多模態、前沿模型推理三大主業,Cerebras 進不去。客戶不重合——Cerebras 86% 營收押在阿布扎比一個家族手里,英偉達把客戶分散到 4 大公有云 + 8 家前沿實驗室 + 全球整機廠。生態不重合——300 萬 CUDA 開發者構成的肌肉記憶,從來不是"快 21 倍的硬件"能跨過去的。
話說回來,Cerebras 上市這件事,本身對英偉達不是威脅,對排隊上市的 AI 公司才是預警。
Cerebras 招股書里那個 24%(G42)+ 62%(MBZUAI)的客戶集中度結構,是 OpenAI / Anthropic 在做路演時一定會被問到的鏡像問題——OpenAI 的 ChatGPT 個人訂閱 + 接口收入里,有多少來自微軟 Azure 的轉售?
Anthropic 季度增長 80 倍里,有多少來自普華永道、摩根大通這幾家關聯客戶?SpaceX 旗下的 xAI 把 Grok 推給 Apollo 資本和摩根士丹利內部試用,最后的付費轉化率有多少?
二級市場用 Cerebras 上市次日跌 10% 這件事,給一級市場寫了一張警告條:950 億美元估值的 AI 公司,沒有清晰的非關聯客戶結構 + 不能跨越英偉達生態壁壘的話,二級市場只給 24 小時蜜月期。
更有意思的是,站在 Cerebras 對面冷眼旁觀的不只是老黃。Anthropic 在 5 月 6 日宣布整租 Musk 在孟菲斯建的 Colossus 1 算力中心——那個數據中心裝的不是 Cerebras 的晶圓級芯片,是英偉達的 H100 + B200。
Anthropic 選擇把 Claude Code 的算力擴張押在英偉達上,而不是 Cerebras。這是 5 月這一周對 Cerebras 故事最沉默也最致命的一票反對。
講真,CBRS 周一 5 月 18 日開盤還能不能撐住 280 美元,已經是個次要問題。Feldman 11 年前在 SeaMicro 學過一遍的事——做出最快的硬件,不等于做出最賺錢的硬件——這次會不會再來一遍,沒人替他說話。
老黃連頭都沒回。這場比賽的勝負不在跑道上,在售票處——這一點,他比誰都清楚。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.