網易首頁 > 網易號 > 正文申請入駐

Cerebras 跑贏英偉達 21 倍，老黃還在北京吃吃吃

2026-05-18 08:43:10　來源: 鈦媒體APP

北京舉報

分享至

文 | AI唱反調

5 月 14 日上午 9 點 30 分，納斯達克的電子盤上，CBRS 的開盤價第一個跳了出來：350 美元。

這是 Cerebras Systems 上市發行價 185 美元的 1.89 倍，是 3 個月前 Tiger Global 領投 H 輪融資時 230 億美元估值的 4 倍，也是 18 個月前阿聯酋投資方 G42 持股引爆美國外資審查、招股書被迫撤回時賬面估值 40 億美元的 23 倍。

盤中股價一度沖到 386 美元，收盤報 311.07 美元，全稀釋市值約 950 億美元，單日漲幅 68.2%——成為繼 2019 年 Uber 之后美國規模最大的科技公司上市事件（CNBC，2026/5/14）。

Andrew Feldman 這天站在納斯達克現場。11 年前他把上一家公司 SeaMicro 以 3.34 億美元賣給了 AMD，敲鐘的時候做夢也不敢想這次的數字——一夜之間，他個人持股賬面市值越過了 10 億美元。

同一時刻，英偉達總部里，似乎沒有人召集應急會議。

第二天 5 月 15 日，CBRS 高開后一路走低，盤中下探 275 美元，收盤約 280 美元，單日跌 10%（CNBC，2026/5/15）。兩個交易日的振幅是 109%，從首日收盤的回吐幅度是 28%。市值 36 小時內從 950 億美元跌回 850 億美元區間。

媒體的敘事一邊倒地從"AI 上市潮復蘇"切換到"AI 估值泡沫"。但真正值得追問的不是 Cerebras 的價格，而是英偉達那邊為什么沒有動靜——Cerebras 的旗艦芯片，第三方測試里推理 Llama 3 70B 模型比英偉達旗艦 GPU B200 快 21 倍（Cerebras 官方 vs NextBigFuture 復測，2026），Feldman 的履歷漂亮、產品參數驚人。

講真，按"AI 時代的硬件顛覆"劇本，老黃應該至少召集一次內部會議。

但他沒有。

他還在北京吃，吃得不亦樂乎。

晶圓的誘惑

Cerebras 賣的是"算力的奇觀"。

英偉達的 B200 是把多顆芯片用高速互連技術拼起來，每顆芯片 2080 億個晶體管。Cerebras 反其道——把整張 12 英寸晶圓當成一顆芯片用。

一張晶圓通常會被切成幾百顆 GPU，Cerebras 不切，整張做成單芯片，叫做"晶圓級芯片"（Wafer Scale Engine，簡稱 WSE）。

第三代 WSE-3 單片集成4 萬億個晶體管、90 萬個計算核心、44GB 片上高速緩存、5 納米制程，是地球上現存最大的單芯片。

這兩條技術路線的差距，集中在內存帶寬這一個核心指標上：

簡單翻譯技術語言就是：英偉達的體系最貴的那一段，是顯存和芯片之間的數據搬運——一顆 GPU 裝不下整個模型，所以需要不停地把權重從外部高帶寬顯存（HBM3e）搬到計算核心去用，搬運速度越快、推理越快，于是英偉達每年砸最多的錢在顯存升級和高速互連上。

Cerebras 直接繞開了這道坎——它把整個模型權重塞進 44GB 的片上緩存，根本不需要搬運，計算核心就在權重旁邊。所以在跑 70B 到 405B 量級的模型時，單臺 Cerebras 系統的吞吐量比一臺裝 8 塊英偉達 B200 的服務器還高。

這是技術意義上的奇觀。Feldman 把 11 年前在 SeaMicro 做"高密度微型服務器"的邏輯（同一套人馬）放大到了 AI 芯片——SeaMicro 當年以 3.34 億美元賣給 AMD 時，AMD 給的判斷是"微型服務器路線賭錯了"，5 年后產品線被關停。Feldman 這次把"集成度極限"的玩法換了個賽道做了一遍。

但這里有個關鍵前提藏在 Cerebras 自家白皮書最末頁的但書里：

"如果跑的模型裝不進單張晶圓，性能會遠遠差于帶高速互連的英偉達 B200 和 B300 系統。"（NextBigFuture 復測原文）

總的來說，模型必須能裝進一張晶圓才能跑得快。44GB 片上緩存聽起來很大，但 GPT-4 量級（1.8 萬億參數）、Llama 3.1-405B、Grok 3 這種參數規模的前沿模型，要么需要切分到多張晶圓上（損失了"全在片上"的優勢）、要么需要走晶圓和晶圓之間的鏈路（損失了"省掉外部顯存搬運"的優勢）。

Cerebras 的 21 倍速度優勢成立的工作負載，集中在 70B 到 405B 的中型模型推理 + 科學超算仿真——這是個真實的市場，但不是英偉達在的那個市場。

英偉達 2026 財年第四季度單季的數據中心收入是 623 億美元（計算業務 513 億 + 網絡業務 110 億），同比增長 58%。Cerebras 2025 年全年總營收是 5.1 億美元（招股書，Tom's Hardware 轉引）。兩個數字的倍數關系是 122 倍——而且英偉達這 623 億里，沒有任何一個工作負載是 Cerebras 能完整替代的：

?訓練：超大模型訓練需要數千卡互聯，Cerebras 的晶圓間鏈路成熟度遠遠不夠；

?推理：Cerebras 只能打中型模型，前沿模型（GPT-5、Claude Opus 4.7、Gemini 3.1 Ultra）跑不進 44GB；

?多模態 / 視頻生成：需要高速互連配合大顯存；

?客戶多樣性：B200 裝在亞馬遜、微軟、谷歌、甲骨文四朵公有云里，每家自己的工作負載都不一樣。

Cerebras 在中型模型推理這塊確實贏了。問題是這塊占英偉達數據中心收入的 5%-8%——老黃一個季度的零頭。

阿布扎比的房間

Cerebras 的招股書中藏著一組比技術更扎眼的數字：

表面上 G42 的占比從 85% 降到 24%，但 G42 把訂單"分賬"給了關聯方 MBZUAI——這是 G42 控股的研究型大學，2025 年 62% 營收來自這一家。兩者合并仍是 86%，實際上是同一個客戶用兩個殼付錢。

更要命的是MBZUAI 一家占應收賬款 77.9%。換句話說，Cerebras 不僅在賺阿聯酋的錢，連賬期都押在阿聯酋身上。

美國外資投資委員會 2024 年 9 月之所以讓 Cerebras 撤回第一版招股書，就是因為 G42 持有 Cerebras 投票權股份，觸發了"國家安全審查"。

直到 G42 把持股改為非投票權（2025 年 10 月），Cerebras 才能重新進入上市流程。Cerebras 的客戶和股東曾經是同一家阿布扎比公司——這種結構在傳統二級市場會被打 30%-40% 估值折扣。

英偉達的客戶結構是另一個極端：2024-2025 年它的數據中心收入里沒有任何單一客戶超過 13%（年報披露），微軟、Meta、亞馬遜、谷歌、甲骨文、特斯拉、xAI、Anthropic（5 月 6 日剛把 Anthropic 加進來，整租了 Musk 在田納西州孟菲斯建的算力中心）排排坐。

Blackwell GPU 的在手訂單是 360 萬臺，售罄到 2026 年中（Yahoo Finance，2026）。老黃上一次電話會議給出的判斷是：Blackwell + Rubin 兩個世代累計收入將達到 1 萬億美元（2025-2027 三年）。

把 Cerebras 的 86% 阿聯酋集中度和英偉達"全球公有云 + 全球前沿實驗室"的客戶矩陣放在一起，你就懂老黃為什么不開會：Cerebras 在跑的賽道，英偉達不僅沒在跑，而且不打算去跑。

中東主權基金的 AI 算力采購，2024-2026 年是一個真實的需求池（沙特公共投資基金 + 阿布扎比穆巴達拉 + G42 加起來公開承諾的 AI 基礎設施投入超過 5000 億美元），但這是個由政治訂單驅動的市場，不是技術性能驅動的市場。MBZUAI 選 Cerebras 不是因為速度快 21 倍，是因為 G42 是 Cerebras 股東、Cerebras 是 G42 的國家級 AI 工程合作伙伴。這種關系一旦因為地緣政治翻車——美國二次審查、Trump 中東政策轉向、阿聯酋倒向中國 AI 供應鏈——Cerebras 86% 的營收會在一個季度內蒸發。

而英偉達沒有這個風險。它的客戶分散度足以吸收任何單一客戶、單一地區、單一應用的崩潰。

CUDA 的院墻

Cerebras 撼不動英偉達的最后一道墻，叫 CUDA。

CUDA 是英偉達 2007 年開始推的 GPU 編程平臺——所有用 GPU 跑深度學習的代碼，必須先用 CUDA 寫、用 CUDA 編譯、調用 CUDA 的算子庫。英偉達過去 18 年的真正護城河，從來不是 GPU 性能，是這套 CUDA 軟件生態。

說白了，過去 15 年里，AI 圈寫代碼這件事默認就是寫 CUDA。PyTorch、TensorFlow、JAX、vLLM、DeepSpeed、Triton——所有主流深度學習框架的底層默認假設是英偉達硬件。300 萬開發者已經把"AI = CUDA"內化成肌肉記憶。這不是性能能解決的事，是遷移成本能不能承受的事。AMD 用 MI300X 砸了 4 年自家生態，目前的現實是 AMD 拿到了 5%-7% 的市場，剩下 90%+ 還在英偉達手里。

Cerebras 比 AMD 更難，因為它根本不是 GPU 架構。晶圓級芯片用的是"數據流"架構，不能直接跑 CUDA 代碼，必須用 Cerebras 自家的開發工具。一個客戶從英偉達遷到 Cerebras 不是寫幾個接口適配，是要把整套訓練和推理流程重寫一遍。

MBZUAI 愿意這么做，是因為它本來就是 Cerebras 的合作伙伴，沒有歷史包袱。但任何一家已經在英偉達上跑了 2 年模型的公司——微軟、Meta、Anthropic、xAI、OpenAI——都不會做這個遷移。

老黃過去幾次財報會議反復強調一個觀點："英偉達是一家軟件公司，順便做芯片。"（"NVIDIA is a software company that happens to build chips."）從財務結構上看這話是真的：英偉達數據中心收入里網絡業務 + 軟件業務的占比正在快速上升，2026 財年第四季度網絡業務單項收入 110 億美元，同比 +263%——這部分跟 GPU 算力沒關系，是生態稅。

Cerebras 賣的是快 21 倍的飛機，英偉達賣的是機場 + 油料 + 維修 + 飛行員培訓 + 空中交通管制。當一家航空公司可以選"快 21 倍但只有一個機場可以起降"或者"普通速度但全球任意機場"時，它會選哪個，老黃心里跟明鏡似的。

所以老黃為什么不慌這件事，到這里就講完了。

賽道不重合——Cerebras 贏的是中型模型推理和超算仿真，占英偉達數據中心收入 5%-8%，老黃的訓練、多模態、前沿模型推理三大主業，Cerebras 進不去。客戶不重合——Cerebras 86% 營收押在阿布扎比一個家族手里，英偉達把客戶分散到 4 大公有云 + 8 家前沿實驗室 + 全球整機廠。生態不重合——300 萬 CUDA 開發者構成的肌肉記憶，從來不是"快 21 倍的硬件"能跨過去的。

話說回來，Cerebras 上市這件事，本身對英偉達不是威脅，對排隊上市的 AI 公司才是預警。

Cerebras 招股書里那個 24%（G42）+ 62%（MBZUAI）的客戶集中度結構，是 OpenAI / Anthropic 在做路演時一定會被問到的鏡像問題——OpenAI 的 ChatGPT 個人訂閱 + 接口收入里，有多少來自微軟 Azure 的轉售？

Anthropic 季度增長 80 倍里，有多少來自普華永道、摩根大通這幾家關聯客戶？SpaceX 旗下的 xAI 把 Grok 推給 Apollo 資本和摩根士丹利內部試用，最后的付費轉化率有多少？

二級市場用 Cerebras 上市次日跌 10% 這件事，給一級市場寫了一張警告條：950 億美元估值的 AI 公司，沒有清晰的非關聯客戶結構 + 不能跨越英偉達生態壁壘的話，二級市場只給 24 小時蜜月期。

更有意思的是，站在 Cerebras 對面冷眼旁觀的不只是老黃。Anthropic 在 5 月 6 日宣布整租 Musk 在孟菲斯建的 Colossus 1 算力中心——那個數據中心裝的不是 Cerebras 的晶圓級芯片，是英偉達的 H100 + B200。

Anthropic 選擇把 Claude Code 的算力擴張押在英偉達上，而不是 Cerebras。這是 5 月這一周對 Cerebras 故事最沉默也最致命的一票反對。

講真，CBRS 周一 5 月 18 日開盤還能不能撐住 280 美元，已經是個次要問題。Feldman 11 年前在 SeaMicro 學過一遍的事——做出最快的硬件，不等于做出最賺錢的硬件——這次會不會再來一遍，沒人替他說話。

老黃連頭都沒回。這場比賽的勝負不在跑道上，在售票處——這一點，他比誰都清楚。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.