公眾號(hào)記得加星標(biāo)??,第一時(shí)間看推送不會(huì)錯(cuò)過(guò)。
今天對(duì)于CPU基準(zhǔn)測(cè)試領(lǐng)域來(lái)說(shuō)是個(gè)值得慶祝的日子,因?yàn)闃?biāo)準(zhǔn)性能評(píng)估公司(SPEC:Standard Performance Evaluation Corporation)發(fā)布了其廣受歡迎的SPEC CPU基準(zhǔn)測(cè)試套件的最新版本。這款名為SPEC CPU 2026的套件是該組織眾多CPU基準(zhǔn)測(cè)試套件中的最新版本。憑借其嚴(yán)謹(jǐn)?shù)募夹g(shù)要求和廠商的大力支持,SPEC CPU 2026已成為業(yè)界領(lǐng)先的CPU性能基準(zhǔn)測(cè)試工具。因此,新版本的發(fā)布對(duì)于CPU和系統(tǒng)基準(zhǔn)測(cè)試領(lǐng)域來(lái)說(shuō)意義重大,因?yàn)樗俏磥?lái)十年衡量CPU性能最重要的基準(zhǔn)測(cè)試套件之一。
SPEC CPU 2026 是 SPEC CPU 九年來(lái)的首個(gè)全新版本,旨在對(duì) CPU 基準(zhǔn)測(cè)試套件進(jìn)行全面升級(jí)。該套件的大部分基準(zhǔn)測(cè)試已被棄用,取而代之的是更新的工作負(fù)載,即使是保留下來(lái)的少數(shù)測(cè)試也進(jìn)行了更新。一些常青軟件,例如開源編譯器和圖像處理庫(kù),其工作負(fù)載也進(jìn)行了更新,以適應(yīng)更現(xiàn)代的需求。最終結(jié)果是,盡管 SPEC CPU 2026 仍然遵循與其前代產(chǎn)品相同的高級(jí)設(shè)計(jì)目標(biāo),但其底層運(yùn)行的實(shí)際代碼自 Skylake、Zen 1 和 Cortex-A75 時(shí)代以來(lái)已經(jīng)發(fā)生了顯著變化。
![]()
除了技術(shù)上的嚴(yán)謹(jǐn)性,SPEC CPU 測(cè)試套件的另一大亮點(diǎn)在于其廣泛的行業(yè)參與;該基準(zhǔn)測(cè)試由一個(gè)幾乎囊括 CPU 領(lǐng)域所有巨頭的團(tuán)隊(duì)持續(xù)開發(fā),其中包括 AMD、Intel、Arm 和 SiFive。廠商的高度參與以及隨后對(duì)該套件的認(rèn)可,有助于提升 SPEC CPU 在業(yè)界的合法性和認(rèn)可度,因?yàn)闃I(yè)界普遍認(rèn)為它是一個(gè)公平的基準(zhǔn)測(cè)試——更重要的是,幾乎沒(méi)有人質(zhì)疑它的公平性。雖然這有時(shí)會(huì)帶來(lái)一些政治風(fēng)險(xiǎn),但也意味著該基準(zhǔn)測(cè)試在發(fā)布前經(jīng)過(guò)了極其嚴(yán)格的測(cè)試和驗(yàn)證,這再次鞏固了其合法性和實(shí)用性。
最后,在今天 SPEC CPU 2026 正式發(fā)布之前,該聯(lián)盟提前向我們提供了基準(zhǔn)測(cè)試的發(fā)布版本,以便我們?cè)u(píng)估其性能。因此,除了今天發(fā)布的高級(jí)別公告之外,我們還有相當(dāng)多的新數(shù)據(jù)需要仔細(xì)分析。那么,事不宜遲,讓我們開始吧。
SPEC CPU 快速回顧
過(guò)去二十年來(lái),SPEC CPU 和其他 SPEC 基準(zhǔn)測(cè)試的平均發(fā)布頻率約為每十年一次。盡管我們頻繁使用 SPEC CPU 和其他 SPEC 基準(zhǔn)測(cè)試,但我們卻很少有機(jī)會(huì)探討它們的起源或背后的設(shè)計(jì)決策。因此,如果您是第一次接觸到新的 SPEC CPU 基準(zhǔn)測(cè)試套件,以下是對(duì) SPEC CPU 及其重要性的簡(jiǎn)要介紹。
標(biāo)準(zhǔn)性能評(píng)估公司 (SPEC) 的使命正如其名。它是一個(gè)非營(yíng)利性行業(yè)聯(lián)盟,旨在組織制定行業(yè)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試。與其他行業(yè)聯(lián)盟一樣,SPEC 的宗旨并非自行開發(fā)測(cè)試,而是匯聚來(lái)自工業(yè)界和學(xué)術(shù)界的主要參與者,共同開發(fā)基準(zhǔn)測(cè)試套件。
![]()
在SPEC眾多基準(zhǔn)測(cè)試套件中,SPEC CPU無(wú)疑是最引人注目的。這不僅是因?yàn)樗鼩v史悠久——SPEC CPU是SPEC的首個(gè)基準(zhǔn)測(cè)試套件,早在1989年就已發(fā)布——還因?yàn)樗鼞?yīng)用廣泛。盡管SPEC CPU最初是為服務(wù)器和其他高性能系統(tǒng)設(shè)計(jì),但隨著處理器性能(以及內(nèi)存容量)的提升,它已被廣泛應(yīng)用于各種設(shè)備,包括臺(tái)式機(jī)、工作站,以及最近的移動(dòng)設(shè)備。因此,SPEC CPU已成為比較不同CPU架構(gòu)的主要基準(zhǔn)測(cè)試之一,用于評(píng)估各種CPU的性能、能效和架構(gòu)效率(IPC)。
![]()
SPEC CPU 基準(zhǔn)測(cè)試套件的普及源于其可移植性。它并非以特定平臺(tái)的預(yù)編譯二進(jìn)制文件形式分發(fā),而是完全以源代碼形式發(fā)布。因此,借助支持 C、C++ 和 Fortran 的現(xiàn)代編譯器工具鏈,可以在任何系統(tǒng)上編譯和運(yùn)行 SPEC CPU,而無(wú)需考慮 CPU 架構(gòu),甚至包括尚未出現(xiàn)的架構(gòu)。誠(chéng)然,這其中存在一些細(xì)微差別(例如,需要符合標(biāo)準(zhǔn)的編譯器),但這也就意味著該基準(zhǔn)測(cè)試不依賴于 SPEC 對(duì)特定平臺(tái)的支持,硬件開發(fā)人員可以立即使用并測(cè)試新的硬件特性,而無(wú)需等待上游發(fā)布新的二進(jìn)制文件。
由此可見,SPEC CPU 的獨(dú)特之處在于,它既是硬件的基準(zhǔn)測(cè)試,也是編譯器的基準(zhǔn)測(cè)試。由于源代碼是程序的完全可移植的高級(jí)實(shí)現(xiàn),因此不包含任何 CPU 內(nèi)部函數(shù)或其他架構(gòu)特定的代碼,基準(zhǔn)測(cè)試的結(jié)果完全取決于優(yōu)秀的編譯器能否將其轉(zhuǎn)換為快速高效的機(jī)器代碼。這意味著,通過(guò)改進(jìn)編譯器來(lái)提升 SPEC CPU 得分是完全可行的(對(duì)于自行開發(fā)編譯器的硬件廠商而言,這一點(diǎn)尤為重要),但關(guān)鍵在于,這些優(yōu)化不能僅僅針對(duì) SPEC,它們需要能夠惠及更廣泛的程序類型。
![]()
歸根結(jié)底,這與大多數(shù)其他 CPU 基準(zhǔn)測(cè)試程序有著顯著的區(qū)別,后者通常以預(yù)編譯二進(jìn)制文件的形式分發(fā)。實(shí)際上,那些基準(zhǔn)測(cè)試程序旨在衡量給定系統(tǒng)執(zhí)行特定機(jī)器代碼批次的性能,而 SPEC CPU 則專注于衡量算法和工作負(fù)載。這種區(qū)別對(duì)日常使用影響不大,但對(duì)于理解基準(zhǔn)測(cè)試程序的設(shè)計(jì)標(biāo)準(zhǔn)以及 SPEC 的最終目標(biāo)至關(guān)重要。
說(shuō)到設(shè)計(jì)標(biāo)準(zhǔn),值得注意的是,SPEC CPU 的設(shè)計(jì)目標(biāo)是盡可能地專注于 CPU 性能測(cè)試。這聽起來(lái)有點(diǎn)同義反復(fù),但也 凸顯了開發(fā)不涉及計(jì)算機(jī)設(shè)計(jì)其他方面的基準(zhǔn)測(cè)試需要投入多少精力 。SPEC CPU 并非全系統(tǒng)基準(zhǔn)測(cè)試(SPEC 有專門的 SPECworkstation 來(lái)負(fù)責(zé)這項(xiàng)工作),而是針對(duì) CPU 和內(nèi)存子系統(tǒng)的性能進(jìn)行基準(zhǔn)測(cè)試,其設(shè)計(jì)選擇旨在最大限度地減少其他方面的瓶頸。
![]()
具體來(lái)說(shuō),SPEC CPU 盡可能避免文件 I/O,以防止其成為性能瓶頸。基準(zhǔn)測(cè)試程序也經(jīng)過(guò)重新編寫或修改,以消除不確定的輸入和操作(例如硬件隨機(jī)數(shù)生成器和不穩(wěn)定的排序),確保其確定性。最終,甚至操作系統(tǒng)也被盡可能地排除在外:SPEC 的目標(biāo)是至少 95% 的基準(zhǔn)測(cè)試執(zhí)行時(shí)間都用于用戶空間代碼,從而避免基準(zhǔn)測(cè)試淪為操作系統(tǒng)的代理測(cè)試。
最后,工作負(fù)載的選擇旨在代表現(xiàn)代計(jì)算機(jī)的實(shí)際應(yīng)用場(chǎng)景,避免測(cè)試過(guò)時(shí)的軟件或?qū)W術(shù)界以外鮮有人問(wèn)津的算法。實(shí)際上,這意味著 SPEC CPU 基準(zhǔn)測(cè)試套件最終看起來(lái)更側(cè)重于服務(wù)器和工作站。它是一個(gè)可移植的無(wú)頭基準(zhǔn)測(cè)試,因此不包含用戶界面任務(wù)。盡管如此,該基準(zhǔn)測(cè)試套件的整體范圍仍然非常廣泛,其中 SPEC CPU 2026 是迄今為止最全面的。在最新版本的 52 個(gè)基準(zhǔn)測(cè)試中,涵蓋了編程/編譯、媒體、人工智能、電子設(shè)計(jì)、網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)和計(jì)算科學(xué)等工作負(fù)載。最終結(jié)果是,該基準(zhǔn)測(cè)試涵蓋了非常廣泛的算法,并進(jìn)而對(duì)主機(jī) CPU 的諸多不同方面進(jìn)行了壓力測(cè)試。
SPEC CPU 2026 有哪些新特性
拋開 SPEC CPU 的一般信息不談,SPEC CPU 2026 有哪些新內(nèi)容?簡(jiǎn)而言之:很多,但也沒(méi)有你想象的那么多。
自 SPEC CPU 2017 發(fā)布以來(lái)的九年間,計(jì)算機(jī)的性能和內(nèi)存容量持續(xù)提升。在服務(wù)器領(lǐng)域,英特爾 x86 架構(gòu)的壟斷地位已被 AMD、超大規(guī)模數(shù)據(jù)中心以及其他開發(fā)基于 Arm 架構(gòu)芯片的公司打破。就連 RISC-V 也從最初的大學(xué)科研項(xiàng)目發(fā)展成為如今功能齊全、足以構(gòu)建高性能處理器的指令集架構(gòu) (ISA)。因此,驅(qū)動(dòng)全球計(jì)算機(jī)發(fā)展的架構(gòu)發(fā)生了翻天覆地的變化,更不用說(shuō)這些架構(gòu)本身也在不斷演進(jìn)。
從宏觀角度來(lái)看,這是一個(gè)變化非常有限的時(shí)期。SPEC CPU 2017 需要應(yīng)對(duì)過(guò)去十年計(jì)算硬件的所有變化,主要是 Dennard 縮放的終結(jié)以及由此導(dǎo)致的 CPU 從單純追求核心速度轉(zhuǎn)向核心數(shù)量更多的趨勢(shì),而 2017 年至 2026 年這九年間并沒(méi)有出現(xiàn)類似的轉(zhuǎn)變。因此,盡管該聯(lián)盟之前需要對(duì) SPEC CPU 的許多方面進(jìn)行調(diào)整以跟上 CPU 設(shè)計(jì)的變化,但 SPEC CPU 2026 則無(wú)需如此。所以,盡管基準(zhǔn)測(cè)試套件在多個(gè)方面進(jìn)行了現(xiàn)代化改造,但它并沒(méi)有經(jīng)歷像 SPEC CPU 2017 發(fā)布時(shí)那樣的大規(guī)模變革。
SPEC CPU 2026 的重點(diǎn)是更廣泛的基準(zhǔn)測(cè)試,以反映 2026 年的現(xiàn)代工作負(fù)載,同時(shí)在規(guī)模和兼容性方面也保持領(lǐng)先。
![]()
2026 版基準(zhǔn)測(cè)試套件共包含 52 個(gè)測(cè)試項(xiàng)目,比 2016 版增加了 9 個(gè)。其中 38 個(gè)是全新的測(cè)試項(xiàng)目。只有 14 個(gè)測(cè)試項(xiàng)目保留自 2016 版,主要是一些常用軟件,例如 GCC、LLVM 和各種數(shù)據(jù)壓縮工具。即便如此,這些測(cè)試項(xiàng)目也都已更新,不僅使用了最新的代碼,還采用了更新、更深入的工作負(fù)載。
總共有 52 個(gè)基準(zhǔn)測(cè)試,內(nèi)容遠(yuǎn)超本文篇幅所能涵蓋。值得注意的是,Perl、x264 和 Blender 已從 2026 版測(cè)試套件中移除。取而代之的是 CPython、FLAC 和 SQLite 等新的基準(zhǔn)測(cè)試。此外,還有大量計(jì)算科學(xué)工作負(fù)載,以及一些新的行業(yè)工作負(fù)載,例如 FPGA 布局布線 (VPR)。
代碼總行數(shù)增加了一倍多,從約 710 萬(wàn)行增加到約 1670 萬(wàn)行。其中大部分代碼屬于 GCC、LLVM 和 FemFlow(一種有限元流體動(dòng)力學(xué)模擬程序)。
![]()
![]()
正如您所預(yù)期的,最新版本的測(cè)試套件也更新了基準(zhǔn)測(cè)試套件,使其使用更新的語(yǔ)言標(biāo)準(zhǔn)。SPEC CPU 2017 基于 C99、C++03 和 Fortran 2003,而 SPEC CPU 2026 基準(zhǔn)測(cè)試則基于 C18、C++17 和 Fortran 2018——這些標(biāo)準(zhǔn)都比前者新了大約 15 到 20 年。因此,構(gòu)成該測(cè)試套件的基準(zhǔn)測(cè)試都可以使用許多新的語(yǔ)言特性,最值得注意的是 C++ 線程(std::thread)和 Fortran 并發(fā)(DO_CONCURRENT)。后者的變化主要影響 SPECspeed 基準(zhǔn)測(cè)試,因?yàn)?SPECrate 會(huì)顯式運(yùn)行單個(gè)程序的多個(gè)副本,而不是在程序內(nèi)部使用多線程。
![]()
硬件要求也有所提高,主要是為了跟上系統(tǒng)內(nèi)存容量不斷增長(zhǎng)的步伐。SPECrate 每個(gè)實(shí)例仍然需要 2GB 內(nèi)存,這意味著該基準(zhǔn)測(cè)試套件的內(nèi)存需求會(huì)隨著 CPU 核心/線程數(shù)量的增加而迅速增長(zhǎng)。實(shí)際上,這意味著一臺(tái)現(xiàn)代高端桌面 CPU 需要 64GB 內(nèi)存(足以覆蓋 Arrow Lake 的全部 24 個(gè)核心或 Granite Ridge 的全部 32 個(gè) SMT 線程)。巧合的是,SPECspeed 的內(nèi)存需求也躍升至 64GB,這反映了其工作負(fù)載規(guī)模更大以及對(duì)多線程的更頻繁使用。需要注意的是,我們嘗試在一臺(tái)配備 128GB 內(nèi)存的 AMD Ryzen Threadripper 9980X 系統(tǒng)上運(yùn)行該測(cè)試,但由于內(nèi)存不足而失敗。
最后值得注意的是,SPEC CPU 組織再次延續(xù)了其選擇非主流架構(gòu)作為參考處理器的偏好。在 SPEC CPU 2026 測(cè)試中,參考處理器是聯(lián)想 ThinkSystem HR330A,它搭載了一顆 3.0GHz 的 Ampere eMAG 8180 處理器,這是一款 2018 年發(fā)布的 32 核 ARMv8 AArch64 架構(gòu)處理器,采用 Skylark CPU 內(nèi)核。這結(jié)束了 SPARC 處理器作為參考處理器的長(zhǎng)期歷史,但延續(xù)了使用非主流 CPU 內(nèi)核(例如 Intel 或 AMD x86、Arm Cortex)作為參考處理器的趨勢(shì)。
既然 SPEC CPU 2026 的亮點(diǎn)已經(jīng)介紹完畢,接下來(lái)讓我們來(lái)看看基準(zhǔn)測(cè)試性能。
SPEC CPU 2026 性能
為了初步了解 SPEC CPU 2026 的性能,我們快速瀏覽了我們手頭上仍運(yùn)行基于 Ubuntu 24.04 操作系統(tǒng)的系統(tǒng),這些系統(tǒng)可以立即使用,并且配置也比較相似。我們知道初始測(cè)試需要幾天時(shí)間才能完成,而距離今天解除禁令也只有幾天時(shí)間了。我們根據(jù)“四處走走看看哪些機(jī)器可以用于項(xiàng)目”的方法,選擇了以下機(jī)器:
Dell Pro Max 16 Plus – Intel Core 9 Ultra 285HX(Lion Cove + Skymont)
GMKtec EVO-X2 – AMD Ryzen AI Max+ 395 (Zen 5)
NVIDIA DGX Spark – NVIDIA GB10(Cortex-X925 + Cortex-A725)
這三款系統(tǒng)均配備 128GB 內(nèi)存,確保它們有足夠的內(nèi)存運(yùn)行基準(zhǔn)測(cè)試套件,并且在內(nèi)存容量方面大致相當(dāng)。Dell Pro Max 16 Plus 內(nèi)置高通 AI 加速器,因此,從 AI 性能方面來(lái)看,它們或許可以作為一組有用的對(duì)比對(duì)象。
就性能而言,我們力求選擇盡可能相似的系統(tǒng),但畢竟戴爾是筆記本電腦,而另外兩款系統(tǒng)是小型臺(tái)式機(jī)。因此,這并非完全公平的比較。不過(guò),這讓我們得以了解大致相似的 x86 系統(tǒng),以及一款性能相當(dāng)高的 Arm 系統(tǒng)。重要的是,我們還想測(cè)試這些架構(gòu)的 P 和 E 核心。我們運(yùn)行了一臺(tái) AmpereOne 192 核系統(tǒng),但由于我們實(shí)際上運(yùn)行的是一個(gè) 2×2 的測(cè)試矩陣,其中包含 LLVM20 和 LLVM2022 編譯并運(yùn)行 CPU2017 和 CPU2026,因此無(wú)法進(jìn)行測(cè)試。該測(cè)試矩陣直到上周晚些時(shí)候才開始,所以未能趕在今天解禁前完成。
請(qǐng)注意,這些是非官方成績(jī),根據(jù) SPEC 運(yùn)行規(guī)則,僅供參考。所有測(cè)試均在 Ubuntu 24.04 系統(tǒng)下進(jìn)行,使用 LLVM 編譯器的最新穩(wěn)定版本 20.1.8。我們測(cè)試的是基礎(chǔ)性能,而非峰值性能。LLVM22 的數(shù)據(jù)將在日后公布。
首先,我們來(lái)看一下單實(shí)例(1T)運(yùn)行 SPEC CPU 2026 SPECrate 測(cè)試的得分。我們分別在各自架構(gòu)的 P 核心和 E 核心(如果后者可用)上運(yùn)行了這些基準(zhǔn)測(cè)試。
![]()
首先,使用新的基準(zhǔn)測(cè)試套件和新的參考機(jī)器,得分大幅下降。到 2026 年,在我們測(cè)試的三款處理器中,針對(duì)此單線程工作負(fù)載速度最快的 CPU 核心是 NVIDIA GB10 處理器中的 Arm Cortex-X925。即便如此,其性能也僅為 2018 年左右參考機(jī)器的 5.5 倍。
總體而言,在比較P核心時(shí),NVIDIA平臺(tái)在整數(shù)和浮點(diǎn)運(yùn)算工作負(fù)載方面均表現(xiàn)最佳,比速度第二快的搭載Ryzen AI Max+ 395的Evo平臺(tái)高出約10%。此外,值得注意的是,兩款x86系統(tǒng)的性能非常接近,Intel和AMD分別在整數(shù)和浮點(diǎn)運(yùn)算性能方面交替領(lǐng)先。
至于E核心,這些數(shù)據(jù)也清晰地表明了英特爾和英偉達(dá)各自的E核心性能差異巨大。285HX芯片中的Skymont E核心性能與功能齊全的Lion Cove P核心相當(dāng)接近,性能達(dá)到后者的80%左右,而英偉達(dá)方面則差距更大。Cortex-A725核心的性能僅為Cortex-X925核心的45%到50%左右。
為了進(jìn)行更深入的分析,讓我們來(lái)看看各個(gè)基準(zhǔn)分?jǐn)?shù),首先從 inrate 開始。
![]()
雖然 Coretex-X925 取得了最高的平均分,但各項(xiàng)測(cè)試的結(jié)果卻更為復(fù)雜。NVIDIA 芯片內(nèi)部的 Arm 核心并非在所有基準(zhǔn)測(cè)試中都勝出,有時(shí)甚至落后于 Intel 和 AMD 的芯片。但這種情況僅偶爾發(fā)生。值得注意的是,NVIDIA 芯片在所有整數(shù)運(yùn)算工作負(fù)載中都沒(méi)有出現(xiàn)明顯的劣勢(shì),反而有幾項(xiàng)測(cè)試中它以顯著優(yōu)勢(shì)勝出。
與此同時(shí),即使在單一基準(zhǔn)測(cè)試層面,AMD 和 Intel 的芯片性能也相當(dāng)接近,盡管 Intel 芯片在某些方面略勝一籌,尤其是在編譯基準(zhǔn)測(cè)試中。
![]()
至于浮點(diǎn)運(yùn)算工作負(fù)載,競(jìng)爭(zhēng)格局相當(dāng)復(fù)雜。Cortex-X925 在這方面優(yōu)勢(shì)明顯不足,尤其是在 772.marian_r(一個(gè)神經(jīng)機(jī)器翻譯基準(zhǔn)測(cè)試)中,它與 AMD 的芯片差距巨大。雖然 AMD 的芯片在這里也遠(yuǎn)超 Intel,但這對(duì)于 Zen 5 芯片來(lái)說(shuō)無(wú)疑是一次巨大的勝利,彌補(bǔ)了它在接下來(lái)的基準(zhǔn)測(cè)試 782.lbm_r 中遭遇的慘敗。
現(xiàn)在,讓我們來(lái)看看當(dāng)這些 CPU 滿負(fù)荷運(yùn)行時(shí),運(yùn)行的 SPECrate 副本數(shù)量與它們的 CPU 核心數(shù)/SMT 插槽數(shù)一樣多時(shí),CPU 的性能和總吞吐量。
![]()
使用多個(gè) SPECrate 實(shí)例并讓相應(yīng)的 CPU 滿負(fù)荷運(yùn)行后,結(jié)果截然不同。在 CPU 滿負(fù)荷運(yùn)行時(shí),AMD Zen 5 系統(tǒng)在整數(shù)和浮點(diǎn)運(yùn)算測(cè)試中均優(yōu)于 Intel 和 NVIDIA/Arm 系統(tǒng)。盡管 AMD 系統(tǒng)理論上只有 16 個(gè) CPU 核心,而 Intel 和 NVIDIA 分別有 24 個(gè)和 20 個(gè)核心,但 AMD 系統(tǒng)卻擁有 16 個(gè)核心。然而,另一方面,AMD 芯片采用的是 16 個(gè) P 核心的同構(gòu)設(shè)計(jì),而 Intel 和 NVIDIA 芯片則通過(guò)混合使用 P 核心和 E 核心來(lái)實(shí)現(xiàn)各自的核心數(shù)量。
總的來(lái)說(shuō),我們?cè)趩尉€程測(cè)試中看到的較高浮點(diǎn)分?jǐn)?shù)在這里有所下降,因?yàn)檫@些系統(tǒng)已經(jīng)完全負(fù)載,對(duì)緩存和其他內(nèi)存資源的競(jìng)爭(zhēng)更加激烈(更不用說(shuō)電源和散熱預(yù)算了)。
![]()
再次查看各項(xiàng)測(cè)試的得分明細(xì),我們發(fā)現(xiàn)AMD系統(tǒng)在除一項(xiàng)之外的所有整數(shù)測(cè)試中都勝出,而最后一項(xiàng)測(cè)試的結(jié)果也基本持平。具體結(jié)果因測(cè)試而異,但AMD系統(tǒng)始終與其他芯片保持同步,甚至在少數(shù)情況下遙遙領(lǐng)先。
![]()
在浮點(diǎn)運(yùn)算基準(zhǔn)測(cè)試中,這種差距更加明顯,正如整體幾何平均分所暗示的那樣。AMD芯片在782.lbm_r測(cè)試中仍然落后(即使只使用一份SPECrate測(cè)試結(jié)果,它也表現(xiàn)不佳),但它在其他測(cè)試中通常遙遙領(lǐng)先于其他芯片。需要重申的是,這些測(cè)試機(jī)器并非完全相同,但這無(wú)疑讓AMD的表現(xiàn)看起來(lái)不錯(cuò)。
換一種方式來(lái)可視化,下圖展示了每個(gè)芯片的擴(kuò)展性與其單次測(cè)試得分的對(duì)比情況。
![]()
在這里我們?cè)俅慰吹?AMD 芯片的性能提升最為顯著,這無(wú)疑部分歸功于其對(duì) P 核心的獨(dú)家使用。
![]()
同時(shí),就浮點(diǎn)運(yùn)算性能而言,多核擴(kuò)展性總體較弱。所有三個(gè)系統(tǒng)在運(yùn)行單個(gè) SPECrate 實(shí)例時(shí)均表現(xiàn)出較低的性能擴(kuò)展性,這強(qiáng)烈表明浮點(diǎn)運(yùn)算工作負(fù)載對(duì)緩存、內(nèi)存和總線帶寬等共享資源提出了更高的要求。
由于這是新一代的基準(zhǔn)測(cè)試,接下來(lái)讓我們看看它與 SPEC CPU 2017 的比較。
SPEC CPU 2026 與 SPEC CPU 2017 對(duì)比
我們還想快速對(duì)比一下 SPEC CPU 2026 和 SPEC CPU 2017 的性能。由于 SPEC CPU 2017 的數(shù)據(jù)很多,我們認(rèn)為直接在兩個(gè)測(cè)試平臺(tái)上運(yùn)行系統(tǒng)并比較差異會(huì)很有意思。需要注意的是,這兩個(gè)基準(zhǔn)測(cè)試套件的得分并不直接可比,2026 和 2017 的得分之間也沒(méi)有官方的“縮放因子”。盡管如此,這仍然有助于突出每個(gè)系統(tǒng)在 SPEC CPU 2017 和 SPEC CPU 2026 之間的相對(duì)位置變化。
從單個(gè) SPECrate 樣本開始,以下是我們的 1T 結(jié)果。
![]()
對(duì)于整數(shù)運(yùn)算工作負(fù)載,三款系統(tǒng)的性能提升幅度都相當(dāng)接近。也就是說(shuō),在 SPEC CPU 2026 測(cè)試中,三款系統(tǒng)的得分均在 2017 年得分的 55% 到 58% 之間。然而,浮點(diǎn)運(yùn)算性能的下降更為明顯。英特爾系統(tǒng)不僅下降幅度更大,其 2026 年得分僅為 2017 年得分的 54%,并且在此基礎(chǔ)上進(jìn)一步下降。NVIDIA Arm 系統(tǒng)的下降幅度更大,其 2026 年得分僅為 2017 年得分的 46%。實(shí)際上,這意味著與 SPEC CPU 2017 相比,NVIDIA 系統(tǒng)在 SPEC CPU 2026 測(cè)試中落后于 AMD 和英特爾。(盡管它在 2026 年的整體 1T 性能表現(xiàn)最佳。)
![]()
同時(shí),運(yùn)行多個(gè) SPECrate 測(cè)試用例的比率則更為穩(wěn)定。所有結(jié)果均在 50% 左右,表明 SPEC CPU 2026 對(duì)多核吞吐量的壓力與對(duì)單核吞吐量的壓力相當(dāng)。此外,所有測(cè)試用例的性能下降幅度均不超過(guò) 51%。即使是 NVIDIA Arm 系統(tǒng),在 2026 fprate 測(cè)試中也達(dá)到了其 2017 fprate 性能的 52%。
最終,這些數(shù)值會(huì)因系統(tǒng)架構(gòu)和配置而異,因此不應(yīng)將其作為其他系統(tǒng)的經(jīng)驗(yàn)法則。這表明,在Arrow Lake、Strix Halo和GB10這三款芯片中,它們的相對(duì)排名基本保持不變。簡(jiǎn)而言之,雖然SPEC CPU 2026顯著改進(jìn)了基準(zhǔn)測(cè)試套件的底層工作負(fù)載,但到目前為止,我們尚未看到它改變當(dāng)代CPU之間的性能對(duì)比。
結(jié)語(yǔ)
雖然“更大更強(qiáng)”這個(gè)詞在業(yè)內(nèi)無(wú)疑已被濫用,但就 SPEC CPU 2026 而言,這卻是對(duì)這套基準(zhǔn)測(cè)試套件最貼切的描述。SPEC CPU 2026 包含 52 個(gè)現(xiàn)代基準(zhǔn)測(cè)試,代碼量是之前的兩倍多,并且工作負(fù)載旨在隨著最新處理器的性能和內(nèi)存容量而擴(kuò)展,因此它不僅比以往規(guī)模更大,而且更能代表現(xiàn)代計(jì)算工作負(fù)載。
從我們初步的基準(zhǔn)測(cè)試結(jié)果來(lái)看,最新的CPU基準(zhǔn)測(cè)試套件乍看之下似乎與之前的版本并沒(méi)有太大的變化。雖然該套件的大部分單項(xiàng)基準(zhǔn)測(cè)試都是全新的,但整體幾何平均得分始終穩(wěn)定在SPEC CPU 2017的50%左右,整數(shù)和浮點(diǎn)工作負(fù)載均是如此。
![]()
需要注意的是,這種擴(kuò)展性并不能保證在不同的 CPU 架構(gòu)和系統(tǒng)中都能實(shí)現(xiàn)。總體而言,雖然 SPEC CPU 2026 測(cè)試總體上強(qiáng)度更高,但它并沒(méi)有顯著改變我們?cè)诒疚闹袦y(cè)試的 Intel、AMD 和 NVIDIA 芯片的相對(duì)排名。也就是說(shuō),雖然 SPEC CPU 2026 為我們提供了更多(且非常有價(jià)值的)數(shù)據(jù)點(diǎn),讓我們能夠比較這些芯片的性能,但它目前并沒(méi)有改變桌面芯片的既定排名。此外,我們必須指出,由于我們這里使用的是 LLVM,我們預(yù)期各公司會(huì)推出比我們目前看到的更優(yōu)化的編譯器。這里測(cè)試的只是 LLVM20,但 LLVM22 略有不同,一些公司可能擁有更優(yōu)化的編譯器。
即使 SPEC CPU 2026 并未給當(dāng)前的 CPU 基準(zhǔn)測(cè)試領(lǐng)域帶來(lái)任何劇烈的變革,但距離上一版本發(fā)布已過(guò)去九年,能夠擁有一個(gè)包含更多現(xiàn)代工作負(fù)載的更新版本仍然是一件好事。尤其是在業(yè)界正著手設(shè)計(jì)和評(píng)估未來(lái)十年 CPU 之際。
*免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個(gè)人觀點(diǎn),半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點(diǎn),不代表半導(dǎo)體行業(yè)觀察對(duì)該觀點(diǎn)贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。
今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4398內(nèi)容,歡迎關(guān)注。
加星標(biāo)??第一時(shí)間看推送
![]()
![]()
求推薦
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.