![]()
亞馬遜CPU服務(wù)器規(guī)模同比增至三倍,仍出現(xiàn)供應(yīng)耗盡。
最開(kāi)始緊缺的是GPU,隨后是內(nèi)存,而如今緊缺的矛頭轉(zhuǎn)向了CPU。受Agentic AI爆發(fā)式增長(zhǎng)影響,CPU正面臨嚴(yán)重短缺。
據(jù)半導(dǎo)體行業(yè)分析機(jī)構(gòu)Semianalysis Dylan Patel指出,GPU已不再是云廠商的瓶頸,這一角色現(xiàn)已轉(zhuǎn)移至CPU。此前,用于AI的GPU僅執(zhí)行簡(jiǎn)單推理任務(wù),隨著新模型推出,任務(wù)形態(tài)發(fā)生根本性變化。Agentic AI如今被大量用于數(shù)據(jù)庫(kù)調(diào)用,以及物理仿真、模擬運(yùn)算等高度依賴CPU的任務(wù)。這些頻繁的數(shù)據(jù)庫(kù)訪問(wèn)與CPU密集型運(yùn)算,導(dǎo)致云數(shù)據(jù)中心CPU使用率急劇飆升。
盡管GPU在AI云端服務(wù)器中仍占據(jù)主導(dǎo)地位(例如單機(jī)柜1個(gè)CPU搭配 8 個(gè)GPU),但如今這一配比差距正在大幅縮小,GPU與CPU在服務(wù)器中趨于接近1:1配比,無(wú)論是強(qiáng)化學(xué)習(xí)訓(xùn)練還是智能體推理均是如此。
這種爆發(fā)式需求已導(dǎo)致GitHub等數(shù)據(jù)庫(kù)服務(wù)出現(xiàn)不穩(wěn)定。多名用戶反饋頻繁宕機(jī)、代碼提交頻繁失敗。情況非常糟糕。而造成這些情況的原因在于微軟將幾乎所有富余CPU資源全部外售:一部分用于內(nèi)部實(shí)驗(yàn)室,但更多是供給與 OpenAI、Anthropic簽約的外部機(jī)構(gòu)。最終導(dǎo)致微軟幾乎無(wú)CPU可用。其他多家廠商也出現(xiàn)相同狀況。
以往配置通常是:少量CPU支撐大量GPU,例如100兆瓦GPU算力僅需1兆瓦甚至更少的CPU支撐。而如今,無(wú)論是RLHF訓(xùn)練還是智能體推理,CPU與GPU功耗/算力配比已大幅趨近。結(jié)果就是:所有廠商的CPU都耗盡了,包括亞馬遜的CPU服務(wù)器規(guī)模。
Dylan表示,亞馬遜、微軟已將全部CPU供給賣(mài)給OpenAI、Anthropic 等AI公司。情況嚴(yán)峻到,盡管亞馬遜CPU服務(wù)器規(guī)模同比增至三倍,仍出現(xiàn)供應(yīng)耗盡,無(wú)法滿足未來(lái)新增需求。此外,隨著OpenAI從x86轉(zhuǎn)向Arm架構(gòu),Arm CPU受到的沖擊更為嚴(yán)重。此前亞馬遜Arm CPU資源相對(duì)充裕,而x86供給偏緊,企業(yè)便將代碼從x86遷移至 Arm。這一調(diào)整如今讓AI公司陷入被動(dòng)。
云CPU短缺正倒逼各廠商大幅擴(kuò)產(chǎn)以應(yīng)對(duì)爆發(fā)式需求,一場(chǎng)圍繞三大架構(gòu)的三足鼎立之爭(zhēng),已然箭在弦上。GPU巨頭英偉達(dá)在進(jìn)行CPU戰(zhàn)略布局,2021年英偉達(dá)發(fā)布了首款數(shù)據(jù)中心CPU Grace,當(dāng)時(shí)不少分析師認(rèn)為此舉只是分散精力。如今看來(lái),這一決策極具先見(jiàn)之明。新一代Vera CPU已投入量產(chǎn),英偉達(dá)在2026年2月與Meta達(dá)成多年協(xié)議,其中包括首次大規(guī)模部署獨(dú)立運(yùn)行的Grace CPU,不與GPU搭配,而是單獨(dú)為Meta的個(gè)人智能體AI提供算力支撐。英偉達(dá)還做出了意外的選擇:采用Arm架構(gòu),而非統(tǒng)治服務(wù)器市場(chǎng)數(shù)十年的x86指令集。這帶來(lái)了更優(yōu)的能效比,在數(shù)據(jù)中心向吉瓦級(jí)規(guī)模擴(kuò)張、電力成為核心制約因素的當(dāng)下,這一點(diǎn)至關(guān)重要。
AMD意外成為CPU需求爆發(fā)的最大受益者。其采用小芯片架構(gòu)的EPYC “Turin” 處理器,產(chǎn)能供不應(yīng)求。“過(guò)去6至9個(gè)月,需求增幅前所未有。”AMD數(shù)據(jù)中心業(yè)務(wù)負(fù)責(zé)人福里斯特?諾羅德認(rèn)為,短期內(nèi)需求沒(méi)有任何放緩或停止的跡象。
過(guò)去英特爾服務(wù)器市場(chǎng)份額一直在持續(xù)被AMD蠶食,如今正試圖發(fā)起一場(chǎng)絕地反擊,與英偉達(dá)合作,推出集成NVLink的定制版至強(qiáng)處理器,讓x86核心可在 Blackwell、Rubin GPU集群中擔(dān)任一致性主控節(jié)點(diǎn)。x86生態(tài)在AI時(shí)代依然具備不可替代的價(jià)值,企業(yè)向智能體AI轉(zhuǎn)型并非從零開(kāi)始,而是基于現(xiàn)有x86基礎(chǔ)設(shè)施演進(jìn)。
這次CPU供應(yīng)緊張是始料未及的,英特爾此前承認(rèn)公司產(chǎn)能完全受限,2026年第一季度庫(kù)存將降至歷史最低水平。作為應(yīng)對(duì),英特爾已降低低端消費(fèi)級(jí)PC市場(chǎng)優(yōu)先級(jí),將晶圓產(chǎn)能轉(zhuǎn)向數(shù)據(jù)中心產(chǎn)品。投行KeyBanc分析師則表示,AMD EPYC 服務(wù)器CPU 2026年全年產(chǎn)能近乎售罄。高端EPYC處理器交期已拉長(zhǎng)至8–10周。
值得關(guān)注的是,AMD、英特爾為云廠商供應(yīng)絕大部分x86芯片,英偉達(dá)也在加速擴(kuò)產(chǎn)其Vera CPU機(jī)柜,而這些都意味著DRAM供給仍將高度向AI傾斜,CPU產(chǎn)能也將全面向AI傾斜。這會(huì)直接導(dǎo)致面向消費(fèi)端、企業(yè)級(jí)的CPU生產(chǎn)線受擠壓,產(chǎn)能優(yōu)先供給AI領(lǐng)域。最終結(jié)果是:普通市場(chǎng)CPU供應(yīng)緊張、價(jià)格上漲,價(jià)高者得芯片。
*聲明:本文系原作者創(chuàng)作。文章內(nèi)容系其個(gè)人觀點(diǎn),我方轉(zhuǎn)載僅為分享與討論,不代表我方贊成或認(rèn)同,如有異議,請(qǐng)聯(lián)系后臺(tái)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.