來(lái)源:電子工程世界(EEWorld)作者:冀凱
舊金山梅森堡(Fort Mason),這個(gè)曾經(jīng)在內(nèi)戰(zhàn)時(shí)期作為海岸防御工事的設(shè)施,正在見(jiàn)證計(jì)算領(lǐng)域的一場(chǎng)攻堅(jiān)戰(zhàn)。
Arm CEO Rene Haas 站在臺(tái)上,宣布公司推出首款自主設(shè)計(jì)的量產(chǎn)數(shù)據(jù)中心 CPU —— Arm AGI CPU。關(guān)于 Arm 是否會(huì)“下場(chǎng)做芯片”的討論,過(guò)去幾年從未停止,而當(dāng)產(chǎn)品真正落地,這一問(wèn)題也從預(yù)期變?yōu)楝F(xiàn)實(shí),并再次引發(fā)業(yè)界討論。
這不僅是一顆芯片的誕生,更是 Arm 成立 35 年來(lái)最大的一次戰(zhàn)略轉(zhuǎn)型。過(guò)去三十年,Arm 是躲在蘋(píng)果、高通、亞馬遜背后的隱形巨人,只賣(mài)IP,不造芯片。而今天,Arm做了一件打破既有模式的里程碑。
受此消息影響,Arm股價(jià)上漲了18%。
當(dāng)開(kāi)始嘗試以更直接的方式參與計(jì)算基礎(chǔ)設(shè)施的構(gòu)建時(shí),問(wèn)題隨之而來(lái):在 x86 架構(gòu)長(zhǎng)期主導(dǎo)的數(shù)據(jù)中心市場(chǎng),Arm 的機(jī)會(huì)究竟來(lái)自哪里?資本市場(chǎng)又為何愿意為這種變化定價(jià)?
![]()
Arm CEO Rene Haas
復(fù)雜性與成本
長(zhǎng)期以來(lái),x86 架構(gòu)在服務(wù)器市場(chǎng)的主導(dǎo)地位,很大程度建立在單核性能與多線程能力之上。但在云計(jì)算進(jìn)入吉瓦(Gigawatt)時(shí)代的今天,這種以性能為核心的路徑開(kāi)始面臨新的約束。
Arm 云AI事業(yè)部執(zhí)行副總裁 Mohamed Awad表示,性能、擴(kuò)展與能效是Arm AGI CPU的關(guān)鍵,而對(duì)于x86,其認(rèn)為,“在部分場(chǎng)景中,x86 的復(fù)雜性正在轉(zhuǎn)化為成本。”
“x86背負(fù)著執(zhí)行開(kāi)銷(xiāo)與對(duì)老舊功能的兼容負(fù)擔(dān),它們選擇聚焦于模塊化、適配眾多不同市場(chǎng)與小眾場(chǎng)景。而我們則更加專(zhuān)注于提升能效、降低延遲,且不受過(guò)去的束縛,不受歷史包袱的牽絆。”Awad說(shuō)道,“我們不兼容 Lotus Notes 這類(lèi)老舊系統(tǒng),只聚焦數(shù)據(jù)中心 AGI 場(chǎng)景的核心需求:性能、擴(kuò)展與能效。”
在性能方面:性能的核心就是在每個(gè)時(shí)鐘周期內(nèi)完成更多運(yùn)算。每時(shí)鐘周期指令數(shù)(IPC)一直是 Arm 的強(qiáng)項(xiàng)。而傳統(tǒng) CPU,有時(shí)會(huì)通過(guò)提升主頻、開(kāi)啟超頻模式來(lái)在這一維度上競(jìng)爭(zhēng)。但現(xiàn)實(shí)是:主頻提升,功耗也會(huì)隨之飆升。超頻模式無(wú)法長(zhǎng)時(shí)間持續(xù)穩(wěn)定運(yùn)行,也無(wú)法在整顆芯片上全局生效。
在可擴(kuò)展性方面,Arm的CPU核心可實(shí)現(xiàn)線性擴(kuò)展,內(nèi)存與 I/O 子系統(tǒng)也專(zhuān)為匹配這些核心設(shè)計(jì),持續(xù)為其供給算力,每個(gè)核心獨(dú)享 6GB/s 的內(nèi)存帶寬。
Awad提到,x86需要通過(guò)多線程(SMT)來(lái)解決擴(kuò)展問(wèn)題,但是I/O與帶寬并不會(huì)翻倍,“只是把瓶頸轉(zhuǎn)移到了其他環(huán)節(jié),而且CPU 還需要額外負(fù)擔(dān)線程調(diào)度的開(kāi)銷(xiāo),最終導(dǎo)致性能下降、進(jìn)程資源不足。”
他表示,數(shù)據(jù)中心運(yùn)營(yíng)商為應(yīng)對(duì)非線性擴(kuò)展問(wèn)題,不得不將數(shù)據(jù)中心資源超額部署 30% 甚至更多。“而我們的架構(gòu)無(wú)需如此。”
在能效方面,Arm則是從手機(jī)和物聯(lián)網(wǎng)時(shí)代就構(gòu)建起了廣泛的認(rèn)可。
![]()
如圖所示,Awad在現(xiàn)場(chǎng)cue到了Arm與x86的對(duì)比,從性能、可擴(kuò)展性以及功耗三方面來(lái)看,均超過(guò)了x86,值得一提的是在性能評(píng)測(cè)中,打開(kāi)多線程反而性能下降。
Awad將這一設(shè)計(jì)思路總結(jié)為對(duì)資源利用率的極致壓縮。
![]()
從短板到可用的軟件生態(tài)
如果將時(shí)間撥回五年前,Arm 在數(shù)據(jù)中心的最大障礙并非硬件,而是軟件生態(tài)。
Awad也承認(rèn),當(dāng)時(shí) Arm 與 x86 在軟件成熟度上存在明顯差距。但過(guò)去幾年,隨著主流云廠商與開(kāi)源社區(qū)的持續(xù)投入,這一差距正在縮小。
“事實(shí)上,放眼全球 AI 應(yīng)用場(chǎng)景,絕大多數(shù) AI 部署均以 Arm CPU 作為核心架構(gòu),諸多 AI 核心軟件更是率先基于 Arm 架構(gòu)開(kāi)發(fā)。基于此,我們對(duì) Arm 在數(shù)據(jù)中心領(lǐng)域承載各類(lèi)現(xiàn)代工作負(fù)載的軟件生態(tài)布局充滿信心。”Awad說(shuō)道。
![]()
Arm Neoverse軟件生態(tài)系統(tǒng)
Meta軟件工程師Paul Saab分享其團(tuán)隊(duì)與 Arm 長(zhǎng)達(dá)十余年的合作歷程。早在 2014—2015 年,團(tuán)隊(duì)便已試水 Arm 架構(gòu),后因市場(chǎng)環(huán)境變化暫時(shí)擱置。2020年后,Saab憑借對(duì)技術(shù)趨勢(shì)的判斷,在未正式獲批的情況下?tīng)款^重啟項(xiàng)目,5 名工程師僅用 90 天便完成Arm系統(tǒng)移植。
面對(duì)初期芯片供給匱乏、生態(tài)不完善等難題,團(tuán)隊(duì)持續(xù)攻堅(jiān),歷時(shí)兩年半打造出具備商用價(jià)值的方案,目前相關(guān)負(fù)載在 Arm 平臺(tái)上已實(shí)現(xiàn)與主流方案相當(dāng)?shù)男阅埽颐客吣苄Т蠓I(lǐng)先。Saab以自己經(jīng)歷表示,如今在大模型技術(shù)加持下,遷移 Arm 的門(mén)檻已近乎為零,建議企業(yè)盡快布局。
智能體AI時(shí)代需要CPU
智能體AI(Agent AI)的爆發(fā),正在讓CPU回到舞臺(tái)中央。
在 AI 算力的討論中,GPU 往往是主角。但 Mohamed Awad 指出,在智能體AI 時(shí)代,這種觀念必須更新:“GPU 負(fù)責(zé)生成Token,而 CPU 負(fù)責(zé)分發(fā)Token。”
AI 系統(tǒng)正日益以全球規(guī)模持續(xù)運(yùn)行。在過(guò)去,人是計(jì)算環(huán)節(jié)的瓶頸——人們與系統(tǒng)的交互速度決定了工作推進(jìn)的速度。早期的AI基礎(chǔ)設(shè)施圍繞持續(xù)、高強(qiáng)度的工作負(fù)載構(gòu)建,包括大規(guī)模模型訓(xùn)練和高吞吐推理。在這樣的環(huán)境下,加速器自然而然地占據(jù)核心地位。但如今,這種模式已無(wú)法反映現(xiàn)實(shí)——在智能體 AI 時(shí)代,因?yàn)檐浖悄荏w可自主協(xié)同任務(wù)、與多個(gè)模型交互,并實(shí)時(shí)做出決策,這種局限性將不復(fù)存在。
隨著現(xiàn)代 AI 應(yīng)用在企業(yè)平臺(tái)與面向用戶的產(chǎn)品中不斷普及,其正日益轉(zhuǎn)向基于智能體打造。這類(lèi)系統(tǒng)具備持續(xù)運(yùn)行能力,可完成規(guī)劃、推理、信息檢索與行動(dòng)協(xié)同,并與用戶及各類(lèi)服務(wù)保持交互,在交互過(guò)程中持續(xù)實(shí)現(xiàn)自我學(xué)習(xí)。
AI系統(tǒng)不僅運(yùn)行模型,還需要在數(shù)據(jù)庫(kù)、Web 服務(wù)和應(yīng)用層之間實(shí)時(shí)編排工作流并處理數(shù)據(jù)。智能體不用休眠,它們會(huì)持續(xù)進(jìn)行任務(wù)調(diào)度、上下文檢索、內(nèi)存管理和行動(dòng)協(xié)調(diào)。
也正因此,我們可以看到Arm架構(gòu)CPU這些年的快速成長(zhǎng):亞馬遜云科技的第五代 Graviton 處理器的核心數(shù)是 Graviton4 的兩倍,達(dá)到 192 個(gè)核;Arm Neoverse CPU 的部署核心總數(shù)已超過(guò) 10 億;Arm 在頭部超大規(guī)模云服務(wù)提供商中的份額預(yù)計(jì)將接近 50%。
![]()
CPU也要滿足Token經(jīng)濟(jì)學(xué)
AI時(shí)代,數(shù)據(jù)中心正在變成“吞電獸”,根據(jù)國(guó)際能源署的統(tǒng)計(jì),2024年全球數(shù)據(jù)中心電力消耗約415太瓦時(shí)(TWh),占全球電力消耗的1.5%左右。預(yù)計(jì)到2030年,數(shù)據(jù)中心電力需求將增長(zhǎng)至約945太瓦時(shí),占全球電力總量的近3%。
能耗正在變成AI數(shù)據(jù)中心的關(guān)鍵,根據(jù)Arm估算結(jié)果,每GW的數(shù)據(jù)中心建設(shè),若從 x86 切換至 Arm 架構(gòu),資本支出 (CAPEX) 節(jié)省高達(dá) 100 億美元。
對(duì)投資者而言,AI影響本質(zhì)上是經(jīng)濟(jì)問(wèn)題,而非純技術(shù)問(wèn)題。在電力約束這一框架下,CPU與加速器的協(xié)同效率變得關(guān)鍵。如果調(diào)度能力不足,即便擁有高性能GPU,其利用率也可能受到限制。
Arm的邏輯在于,通過(guò)更高能效與可擴(kuò)展性的CPU設(shè)計(jì),提高整體系統(tǒng)的“每機(jī)架產(chǎn)出”。這一思路并非替代加速器,而是試圖提升其利用率,從而在系統(tǒng)層面改善經(jīng)濟(jì)性。事實(shí)上,如果沒(méi)有足夠的 CPU 來(lái)高效地編排工作負(fù)載,昂貴的 AI 加速器可能會(huì)處于閑置或低利用狀態(tài)。
商業(yè)邏輯的重構(gòu)
Arm 選擇在此時(shí)下場(chǎng)做芯片,也不可避免引發(fā)外界質(zhì)疑,畢竟這種既是客戶又是競(jìng)爭(zhēng)者的關(guān)系,在商業(yè)領(lǐng)域并不常見(jiàn)。
因此外界最直接的疑問(wèn)在于:Arm 是否會(huì)因?yàn)樽匝行酒鴽_擊既有客戶關(guān)系?在問(wèn)答環(huán)節(jié)中,Rene Haas 給出了回應(yīng)。他將 Arm 當(dāng)前的商業(yè)模式拆分為三個(gè)層次:一是傳統(tǒng)的 IP 授權(quán),仍然是高利潤(rùn)的基礎(chǔ)盤(pán);二是 CSS(計(jì)算子系統(tǒng)),為客戶提供更高集成度的半定制方案;三是最新推出的量產(chǎn)芯片,即 Arm AGI CPU。
這種分層,本質(zhì)上不是取代,更多是補(bǔ)位。
畢竟除了幾家大型互聯(lián)網(wǎng)廠商,還有更多廠商沒(méi)有制造芯片的能力,同時(shí),一些第三方Arm服務(wù)器芯片供應(yīng)商發(fā)展相對(duì)緩慢,所以在Agent AI時(shí)代,Arm需要以更直接的方式參與其中。
Awad補(bǔ)充道,在數(shù)據(jù)中心場(chǎng)景中,系統(tǒng)復(fù)雜度正在持續(xù)上升——從存儲(chǔ)卸載、網(wǎng)絡(luò)卸載,到頭節(jié)點(diǎn)調(diào)度與數(shù)據(jù)分發(fā),對(duì)不同類(lèi)型算力的需求高度分化。即便是大型云廠商,也很難覆蓋所有環(huán)節(jié)的自研。一個(gè)常被提及的例子是 Google:盡管其自研了 TPU,但依然大量采購(gòu) NVIDIA 的 GPU。自研與外采,從來(lái)不是替代關(guān)系,而是并行存在。
在這樣的結(jié)構(gòu)性缺口下,Arm試圖提供一種更靈活的供給方式。正如 Mohamed Awad 所強(qiáng)調(diào)的,客戶可以基于同一技術(shù)體系,在 IP、CSS 與整芯片之間做選擇,這也使Arm能夠參與更多價(jià)值環(huán)節(jié)。這也為其提出更高的增長(zhǎng)目標(biāo)提供了基礎(chǔ)——從版稅模式向部分整機(jī)價(jià)值轉(zhuǎn)移。
正是這種全方位的參與,也讓Arm提出了一個(gè)雄心勃勃的收入指引。Arm預(yù)計(jì)AGI CPU將在五年內(nèi)產(chǎn)生約150億美元的年收入,2031年公司營(yíng)收將達(dá)到250億美元,每股年收益達(dá)到9美元。
一次仍在進(jìn)行中的轉(zhuǎn)型
發(fā)布會(huì)上,Arm同時(shí)披露了后續(xù)產(chǎn)品路線與合作伙伴計(jì)劃,包括云廠商、AI公司以及OEM廠商的參與,同時(shí)也有包括Meta在內(nèi)的數(shù)家廠商成為Arm AGI CPU的首批客戶。
當(dāng) Rene Haas 在 Fort Mason 宣布這款芯片時(shí),更像是在確認(rèn)一件事:Arm 不再滿足于僅作為架構(gòu)提供者存在。
我很喜歡Haas在開(kāi)場(chǎng)白時(shí)的說(shuō)法“我們認(rèn)為 “Arm 無(wú)處不在” 這一主題格外貼切今天的會(huì)議。這也是我們深感自豪的一點(diǎn)——雖然在 Arm 的日常工作中未必時(shí)時(shí)想起,但其影響力卻真實(shí)而深遠(yuǎn),那就是我們的規(guī)模與體量。”Haas開(kāi)場(chǎng)時(shí)說(shuō)道,“全球擁有超過(guò) 2200 萬(wàn)軟件開(kāi)發(fā)者,他們既深耕垂直領(lǐng)域,又能跨生態(tài)共享技術(shù),這正是 Arm 獨(dú)一無(wú)二的魔力。全球沒(méi)有任何一家企業(yè),能像 Arm 生態(tài)這樣實(shí)現(xiàn)從邊緣到云端的全覆蓋。”
在數(shù)據(jù)中心市場(chǎng),Intel 與 AMD 所代表的 x86 體系依然穩(wěn)固,其生態(tài)與性能優(yōu)勢(shì)短期內(nèi)難以動(dòng)搖。但隨著工作負(fù)載結(jié)構(gòu)的變化,一些新的切入點(diǎn)正在出現(xiàn)。
事實(shí)上,x86 的圍墻依然厚重,但 Arm 已經(jīng)開(kāi)始拆掉其中的幾塊磚,正如它在其他行業(yè)開(kāi)始時(shí)所做的一樣。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.