網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

SPEC CPU 2026發(fā)布，更新了什么？

2026-05-06 09:39:12　來(lái)源: 半導(dǎo)體行業(yè)觀察

上海舉報(bào)

分享至

公眾號(hào)記得加星標(biāo)??，第一時(shí)間看推送不會(huì)錯(cuò)過(guò)。

今天對(duì)于CPU基準(zhǔn)測(cè)試領(lǐng)域來(lái)說(shuō)是個(gè)值得慶祝的日子，因?yàn)闃?biāo)準(zhǔn)性能評(píng)估公司（SPEC：Standard Performance Evaluation Corporation）發(fā)布了其廣受歡迎的SPEC CPU基準(zhǔn)測(cè)試套件的最新版本。這款名為SPEC CPU 2026的套件是該組織眾多CPU基準(zhǔn)測(cè)試套件中的最新版本。憑借其嚴(yán)謹(jǐn)?shù)募夹g(shù)要求和廠商的大力支持，SPEC CPU 2026已成為業(yè)界領(lǐng)先的CPU性能基準(zhǔn)測(cè)試工具。因此，新版本的發(fā)布對(duì)于CPU和系統(tǒng)基準(zhǔn)測(cè)試領(lǐng)域來(lái)說(shuō)意義重大，因?yàn)樗俏磥?lái)十年衡量CPU性能最重要的基準(zhǔn)測(cè)試套件之一。

SPEC CPU 2026 是 SPEC CPU 九年來(lái)的首個(gè)全新版本，旨在對(duì) CPU 基準(zhǔn)測(cè)試套件進(jìn)行全面升級(jí)。該套件的大部分基準(zhǔn)測(cè)試已被棄用，取而代之的是更新的工作負(fù)載，即使是保留下來(lái)的少數(shù)測(cè)試也進(jìn)行了更新。一些常青軟件，例如開源編譯器和圖像處理庫(kù)，其工作負(fù)載也進(jìn)行了更新，以適應(yīng)更現(xiàn)代的需求。最終結(jié)果是，盡管 SPEC CPU 2026 仍然遵循與其前代產(chǎn)品相同的高級(jí)設(shè)計(jì)目標(biāo)，但其底層運(yùn)行的實(shí)際代碼自 Skylake、Zen 1 和 Cortex-A75 時(shí)代以來(lái)已經(jīng)發(fā)生了顯著變化。

除了技術(shù)上的嚴(yán)謹(jǐn)性，SPEC CPU 測(cè)試套件的另一大亮點(diǎn)在于其廣泛的行業(yè)參與；該基準(zhǔn)測(cè)試由一個(gè)幾乎囊括 CPU 領(lǐng)域所有巨頭的團(tuán)隊(duì)持續(xù)開發(fā)，其中包括 AMD、Intel、Arm 和 SiFive。廠商的高度參與以及隨后對(duì)該套件的認(rèn)可，有助于提升 SPEC CPU 在業(yè)界的合法性和認(rèn)可度，因?yàn)闃I(yè)界普遍認(rèn)為它是一個(gè)公平的基準(zhǔn)測(cè)試——更重要的是，幾乎沒(méi)有人質(zhì)疑它的公平性。雖然這有時(shí)會(huì)帶來(lái)一些政治風(fēng)險(xiǎn)，但也意味著該基準(zhǔn)測(cè)試在發(fā)布前經(jīng)過(guò)了極其嚴(yán)格的測(cè)試和驗(yàn)證，這再次鞏固了其合法性和實(shí)用性。

最后，在今天 SPEC CPU 2026 正式發(fā)布之前，該聯(lián)盟提前向我們提供了基準(zhǔn)測(cè)試的發(fā)布版本，以便我們?cè)u(píng)估其性能。因此，除了今天發(fā)布的高級(jí)別公告之外，我們還有相當(dāng)多的新數(shù)據(jù)需要仔細(xì)分析。那么，事不宜遲，讓我們開始吧。

SPEC CPU 快速回顧

過(guò)去二十年來(lái)，SPEC CPU 和其他 SPEC 基準(zhǔn)測(cè)試的平均發(fā)布頻率約為每十年一次。盡管我們頻繁使用 SPEC CPU 和其他 SPEC 基準(zhǔn)測(cè)試，但我們卻很少有機(jī)會(huì)探討它們的起源或背后的設(shè)計(jì)決策。因此，如果您是第一次接觸到新的 SPEC CPU 基準(zhǔn)測(cè)試套件，以下是對(duì) SPEC CPU 及其重要性的簡(jiǎn)要介紹。

標(biāo)準(zhǔn)性能評(píng)估公司 (SPEC) 的使命正如其名。它是一個(gè)非營(yíng)利性行業(yè)聯(lián)盟，旨在組織制定行業(yè)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試。與其他行業(yè)聯(lián)盟一樣，SPEC 的宗旨并非自行開發(fā)測(cè)試，而是匯聚來(lái)自工業(yè)界和學(xué)術(shù)界的主要參與者，共同開發(fā)基準(zhǔn)測(cè)試套件。

在SPEC眾多基準(zhǔn)測(cè)試套件中，SPEC CPU無(wú)疑是最引人注目的。這不僅是因?yàn)樗鼩v史悠久——SPEC CPU是SPEC的首個(gè)基準(zhǔn)測(cè)試套件，早在1989年就已發(fā)布——還因?yàn)樗鼞?yīng)用廣泛。盡管SPEC CPU最初是為服務(wù)器和其他高性能系統(tǒng)設(shè)計(jì)，但隨著處理器性能（以及內(nèi)存容量）的提升，它已被廣泛應(yīng)用于各種設(shè)備，包括臺(tái)式機(jī)、工作站，以及最近的移動(dòng)設(shè)備。因此，SPEC CPU已成為比較不同CPU架構(gòu)的主要基準(zhǔn)測(cè)試之一，用于評(píng)估各種CPU的性能、能效和架構(gòu)效率（IPC）。

SPEC CPU 基準(zhǔn)測(cè)試套件的普及源于其可移植性。它并非以特定平臺(tái)的預(yù)編譯二進(jìn)制文件形式分發(fā)，而是完全以源代碼形式發(fā)布。因此，借助支持 C、C++ 和 Fortran 的現(xiàn)代編譯器工具鏈，可以在任何系統(tǒng)上編譯和運(yùn)行 SPEC CPU，而無(wú)需考慮 CPU 架構(gòu)，甚至包括尚未出現(xiàn)的架構(gòu)。誠(chéng)然，這其中存在一些細(xì)微差別（例如，需要符合標(biāo)準(zhǔn)的編譯器），但這也就意味著該基準(zhǔn)測(cè)試不依賴于 SPEC 對(duì)特定平臺(tái)的支持，硬件開發(fā)人員可以立即使用并測(cè)試新的硬件特性，而無(wú)需等待上游發(fā)布新的二進(jìn)制文件。

由此可見，SPEC CPU 的獨(dú)特之處在于，它既是硬件的基準(zhǔn)測(cè)試，也是編譯器的基準(zhǔn)測(cè)試。由于源代碼是程序的完全可移植的高級(jí)實(shí)現(xiàn)，因此不包含任何 CPU 內(nèi)部函數(shù)或其他架構(gòu)特定的代碼，基準(zhǔn)測(cè)試的結(jié)果完全取決于優(yōu)秀的編譯器能否將其轉(zhuǎn)換為快速高效的機(jī)器代碼。這意味著，通過(guò)改進(jìn)編譯器來(lái)提升 SPEC CPU 得分是完全可行的（對(duì)于自行開發(fā)編譯器的硬件廠商而言，這一點(diǎn)尤為重要），但關(guān)鍵在于，這些優(yōu)化不能僅僅針對(duì) SPEC，它們需要能夠惠及更廣泛的程序類型。

歸根結(jié)底，這與大多數(shù)其他 CPU 基準(zhǔn)測(cè)試程序有著顯著的區(qū)別，后者通常以預(yù)編譯二進(jìn)制文件的形式分發(fā)。實(shí)際上，那些基準(zhǔn)測(cè)試程序旨在衡量給定系統(tǒng)執(zhí)行特定機(jī)器代碼批次的性能，而 SPEC CPU 則專注于衡量算法和工作負(fù)載。這種區(qū)別對(duì)日常使用影響不大，但對(duì)于理解基準(zhǔn)測(cè)試程序的設(shè)計(jì)標(biāo)準(zhǔn)以及 SPEC 的最終目標(biāo)至關(guān)重要。

說(shuō)到設(shè)計(jì)標(biāo)準(zhǔn)，值得注意的是，SPEC CPU 的設(shè)計(jì)目標(biāo)是盡可能地專注于 CPU 性能測(cè)試。這聽起來(lái)有點(diǎn)同義反復(fù)，但也凸顯了開發(fā)不涉及計(jì)算機(jī)設(shè)計(jì)其他方面的基準(zhǔn)測(cè)試需要投入多少精力。SPEC CPU 并非全系統(tǒng)基準(zhǔn)測(cè)試（SPEC 有專門的 SPECworkstation 來(lái)負(fù)責(zé)這項(xiàng)工作），而是針對(duì) CPU 和內(nèi)存子系統(tǒng)的性能進(jìn)行基準(zhǔn)測(cè)試，其設(shè)計(jì)選擇旨在最大限度地減少其他方面的瓶頸。

具體來(lái)說(shuō)，SPEC CPU 盡可能避免文件 I/O，以防止其成為性能瓶頸。基準(zhǔn)測(cè)試程序也經(jīng)過(guò)重新編寫或修改，以消除不確定的輸入和操作（例如硬件隨機(jī)數(shù)生成器和不穩(wěn)定的排序），確保其確定性。最終，甚至操作系統(tǒng)也被盡可能地排除在外：SPEC 的目標(biāo)是至少 95% 的基準(zhǔn)測(cè)試執(zhí)行時(shí)間都用于用戶空間代碼，從而避免基準(zhǔn)測(cè)試淪為操作系統(tǒng)的代理測(cè)試。

最后，工作負(fù)載的選擇旨在代表現(xiàn)代計(jì)算機(jī)的實(shí)際應(yīng)用場(chǎng)景，避免測(cè)試過(guò)時(shí)的軟件或?qū)W術(shù)界以外鮮有人問(wèn)津的算法。實(shí)際上，這意味著 SPEC CPU 基準(zhǔn)測(cè)試套件最終看起來(lái)更側(cè)重于服務(wù)器和工作站。它是一個(gè)可移植的無(wú)頭基準(zhǔn)測(cè)試，因此不包含用戶界面任務(wù)。盡管如此，該基準(zhǔn)測(cè)試套件的整體范圍仍然非常廣泛，其中 SPEC CPU 2026 是迄今為止最全面的。在最新版本的 52 個(gè)基準(zhǔn)測(cè)試中，涵蓋了編程/編譯、媒體、人工智能、電子設(shè)計(jì)、網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)和計(jì)算科學(xué)等工作負(fù)載。最終結(jié)果是，該基準(zhǔn)測(cè)試涵蓋了非常廣泛的算法，并進(jìn)而對(duì)主機(jī) CPU 的諸多不同方面進(jìn)行了壓力測(cè)試。

SPEC CPU 2026 有哪些新特性

拋開 SPEC CPU 的一般信息不談，SPEC CPU 2026 有哪些新內(nèi)容？簡(jiǎn)而言之：很多，但也沒(méi)有你想象的那么多。

自 SPEC CPU 2017 發(fā)布以來(lái)的九年間，計(jì)算機(jī)的性能和內(nèi)存容量持續(xù)提升。在服務(wù)器領(lǐng)域，英特爾 x86 架構(gòu)的壟斷地位已被 AMD、超大規(guī)模數(shù)據(jù)中心以及其他開發(fā)基于 Arm 架構(gòu)芯片的公司打破。就連 RISC-V 也從最初的大學(xué)科研項(xiàng)目發(fā)展成為如今功能齊全、足以構(gòu)建高性能處理器的指令集架構(gòu) (ISA)。因此，驅(qū)動(dòng)全球計(jì)算機(jī)發(fā)展的架構(gòu)發(fā)生了翻天覆地的變化，更不用說(shuō)這些架構(gòu)本身也在不斷演進(jìn)。

從宏觀角度來(lái)看，這是一個(gè)變化非常有限的時(shí)期。SPEC CPU 2017 需要應(yīng)對(duì)過(guò)去十年計(jì)算硬件的所有變化，主要是 Dennard 縮放的終結(jié)以及由此導(dǎo)致的 CPU 從單純追求核心速度轉(zhuǎn)向核心數(shù)量更多的趨勢(shì)，而 2017 年至 2026 年這九年間并沒(méi)有出現(xiàn)類似的轉(zhuǎn)變。因此，盡管該聯(lián)盟之前需要對(duì) SPEC CPU 的許多方面進(jìn)行調(diào)整以跟上 CPU 設(shè)計(jì)的變化，但 SPEC CPU 2026 則無(wú)需如此。所以，盡管基準(zhǔn)測(cè)試套件在多個(gè)方面進(jìn)行了現(xiàn)代化改造，但它并沒(méi)有經(jīng)歷像 SPEC CPU 2017 發(fā)布時(shí)那樣的大規(guī)模變革。

SPEC CPU 2026 的重點(diǎn)是更廣泛的基準(zhǔn)測(cè)試，以反映 2026 年的現(xiàn)代工作負(fù)載，同時(shí)在規(guī)模和兼容性方面也保持領(lǐng)先。

2026 版基準(zhǔn)測(cè)試套件共包含 52 個(gè)測(cè)試項(xiàng)目，比 2016 版增加了 9 個(gè)。其中 38 個(gè)是全新的測(cè)試項(xiàng)目。只有 14 個(gè)測(cè)試項(xiàng)目保留自 2016 版，主要是一些常用軟件，例如 GCC、LLVM 和各種數(shù)據(jù)壓縮工具。即便如此，這些測(cè)試項(xiàng)目也都已更新，不僅使用了最新的代碼，還采用了更新、更深入的工作負(fù)載。

總共有 52 個(gè)基準(zhǔn)測(cè)試，內(nèi)容遠(yuǎn)超本文篇幅所能涵蓋。值得注意的是，Perl、x264 和 Blender 已從 2026 版測(cè)試套件中移除。取而代之的是 CPython、FLAC 和 SQLite 等新的基準(zhǔn)測(cè)試。此外，還有大量計(jì)算科學(xué)工作負(fù)載，以及一些新的行業(yè)工作負(fù)載，例如 FPGA 布局布線 (VPR)。

代碼總行數(shù)增加了一倍多，從約 710 萬(wàn)行增加到約 1670 萬(wàn)行。其中大部分代碼屬于 GCC、LLVM 和 FemFlow（一種有限元流體動(dòng)力學(xué)模擬程序）。

正如您所預(yù)期的，最新版本的測(cè)試套件也更新了基準(zhǔn)測(cè)試套件，使其使用更新的語(yǔ)言標(biāo)準(zhǔn)。SPEC CPU 2017 基于 C99、C++03 和 Fortran 2003，而 SPEC CPU 2026 基準(zhǔn)測(cè)試則基于 C18、C++17 和 Fortran 2018——這些標(biāo)準(zhǔn)都比前者新了大約 15 到 20 年。因此，構(gòu)成該測(cè)試套件的基準(zhǔn)測(cè)試都可以使用許多新的語(yǔ)言特性，最值得注意的是 C++ 線程（std::thread）和 Fortran 并發(fā)（DO_CONCURRENT）。后者的變化主要影響 SPECspeed 基準(zhǔn)測(cè)試，因?yàn)?SPECrate 會(huì)顯式運(yùn)行單個(gè)程序的多個(gè)副本，而不是在程序內(nèi)部使用多線程。

硬件要求也有所提高，主要是為了跟上系統(tǒng)內(nèi)存容量不斷增長(zhǎng)的步伐。SPECrate 每個(gè)實(shí)例仍然需要 2GB 內(nèi)存，這意味著該基準(zhǔn)測(cè)試套件的內(nèi)存需求會(huì)隨著 CPU 核心/線程數(shù)量的增加而迅速增長(zhǎng)。實(shí)際上，這意味著一臺(tái)現(xiàn)代高端桌面 CPU 需要 64GB 內(nèi)存（足以覆蓋 Arrow Lake 的全部 24 個(gè)核心或 Granite Ridge 的全部 32 個(gè) SMT 線程）。巧合的是，SPECspeed 的內(nèi)存需求也躍升至 64GB，這反映了其工作負(fù)載規(guī)模更大以及對(duì)多線程的更頻繁使用。需要注意的是，我們嘗試在一臺(tái)配備 128GB 內(nèi)存的 AMD Ryzen Threadripper 9980X 系統(tǒng)上運(yùn)行該測(cè)試，但由于內(nèi)存不足而失敗。

最后值得注意的是，SPEC CPU 組織再次延續(xù)了其選擇非主流架構(gòu)作為參考處理器的偏好。在 SPEC CPU 2026 測(cè)試中，參考處理器是聯(lián)想 ThinkSystem HR330A，它搭載了一顆 3.0GHz 的 Ampere eMAG 8180 處理器，這是一款 2018 年發(fā)布的 32 核 ARMv8 AArch64 架構(gòu)處理器，采用 Skylark CPU 內(nèi)核。這結(jié)束了 SPARC 處理器作為參考處理器的長(zhǎng)期歷史，但延續(xù)了使用非主流 CPU 內(nèi)核（例如 Intel 或 AMD x86、Arm Cortex）作為參考處理器的趨勢(shì)。

既然 SPEC CPU 2026 的亮點(diǎn)已經(jīng)介紹完畢，接下來(lái)讓我們來(lái)看看基準(zhǔn)測(cè)試性能。

SPEC CPU 2026 性能

為了初步了解 SPEC CPU 2026 的性能，我們快速瀏覽了我們手頭上仍運(yùn)行基于 Ubuntu 24.04 操作系統(tǒng)的系統(tǒng)，這些系統(tǒng)可以立即使用，并且配置也比較相似。我們知道初始測(cè)試需要幾天時(shí)間才能完成，而距離今天解除禁令也只有幾天時(shí)間了。我們根據(jù)“四處走走看看哪些機(jī)器可以用于項(xiàng)目”的方法，選擇了以下機(jī)器：

Dell Pro Max 16 Plus – Intel Core 9 Ultra 285HX（Lion Cove + Skymont）

GMKtec EVO-X2 – AMD Ryzen AI Max+ 395 (Zen 5)

NVIDIA DGX Spark – NVIDIA GB10（Cortex-X925 + Cortex-A725）

這三款系統(tǒng)均配備 128GB 內(nèi)存，確保它們有足夠的內(nèi)存運(yùn)行基準(zhǔn)測(cè)試套件，并且在內(nèi)存容量方面大致相當(dāng)。Dell Pro Max 16 Plus 內(nèi)置高通 AI 加速器，因此，從 AI 性能方面來(lái)看，它們或許可以作為一組有用的對(duì)比對(duì)象。

就性能而言，我們力求選擇盡可能相似的系統(tǒng)，但畢竟戴爾是筆記本電腦，而另外兩款系統(tǒng)是小型臺(tái)式機(jī)。因此，這并非完全公平的比較。不過(guò)，這讓我們得以了解大致相似的 x86 系統(tǒng)，以及一款性能相當(dāng)高的 Arm 系統(tǒng)。重要的是，我們還想測(cè)試這些架構(gòu)的 P 和 E 核心。我們運(yùn)行了一臺(tái) AmpereOne 192 核系統(tǒng)，但由于我們實(shí)際上運(yùn)行的是一個(gè) 2×2 的測(cè)試矩陣，其中包含 LLVM20 和 LLVM2022 編譯并運(yùn)行 CPU2017 和 CPU2026，因此無(wú)法進(jìn)行測(cè)試。該測(cè)試矩陣直到上周晚些時(shí)候才開始，所以未能趕在今天解禁前完成。

請(qǐng)注意，這些是非官方成績(jī)，根據(jù) SPEC 運(yùn)行規(guī)則，僅供參考。所有測(cè)試均在 Ubuntu 24.04 系統(tǒng)下進(jìn)行，使用 LLVM 編譯器的最新穩(wěn)定版本 20.1.8。我們測(cè)試的是基礎(chǔ)性能，而非峰值性能。LLVM22 的數(shù)據(jù)將在日后公布。

首先，我們來(lái)看一下單實(shí)例（1T）運(yùn)行 SPEC CPU 2026 SPECrate 測(cè)試的得分。我們分別在各自架構(gòu)的 P 核心和 E 核心（如果后者可用）上運(yùn)行了這些基準(zhǔn)測(cè)試。

首先，使用新的基準(zhǔn)測(cè)試套件和新的參考機(jī)器，得分大幅下降。到 2026 年，在我們測(cè)試的三款處理器中，針對(duì)此單線程工作負(fù)載速度最快的 CPU 核心是 NVIDIA GB10 處理器中的 Arm Cortex-X925。即便如此，其性能也僅為 2018 年左右參考機(jī)器的 5.5 倍。

總體而言，在比較P核心時(shí)，NVIDIA平臺(tái)在整數(shù)和浮點(diǎn)運(yùn)算工作負(fù)載方面均表現(xiàn)最佳，比速度第二快的搭載Ryzen AI Max+ 395的Evo平臺(tái)高出約10%。此外，值得注意的是，兩款x86系統(tǒng)的性能非常接近，Intel和AMD分別在整數(shù)和浮點(diǎn)運(yùn)算性能方面交替領(lǐng)先。

至于E核心，這些數(shù)據(jù)也清晰地表明了英特爾和英偉達(dá)各自的E核心性能差異巨大。285HX芯片中的Skymont E核心性能與功能齊全的Lion Cove P核心相當(dāng)接近，性能達(dá)到后者的80%左右，而英偉達(dá)方面則差距更大。Cortex-A725核心的性能僅為Cortex-X925核心的45%到50%左右。

為了進(jìn)行更深入的分析，讓我們來(lái)看看各個(gè)基準(zhǔn)分?jǐn)?shù)，首先從 inrate 開始。

雖然 Coretex-X925 取得了最高的平均分，但各項(xiàng)測(cè)試的結(jié)果卻更為復(fù)雜。NVIDIA 芯片內(nèi)部的 Arm 核心并非在所有基準(zhǔn)測(cè)試中都勝出，有時(shí)甚至落后于 Intel 和 AMD 的芯片。但這種情況僅偶爾發(fā)生。值得注意的是，NVIDIA 芯片在所有整數(shù)運(yùn)算工作負(fù)載中都沒(méi)有出現(xiàn)明顯的劣勢(shì)，反而有幾項(xiàng)測(cè)試中它以顯著優(yōu)勢(shì)勝出。

與此同時(shí)，即使在單一基準(zhǔn)測(cè)試層面，AMD 和 Intel 的芯片性能也相當(dāng)接近，盡管 Intel 芯片在某些方面略勝一籌，尤其是在編譯基準(zhǔn)測(cè)試中。

至于浮點(diǎn)運(yùn)算工作負(fù)載，競(jìng)爭(zhēng)格局相當(dāng)復(fù)雜。Cortex-X925 在這方面優(yōu)勢(shì)明顯不足，尤其是在 772.marian_r（一個(gè)神經(jīng)機(jī)器翻譯基準(zhǔn)測(cè)試）中，它與 AMD 的芯片差距巨大。雖然 AMD 的芯片在這里也遠(yuǎn)超 Intel，但這對(duì)于 Zen 5 芯片來(lái)說(shuō)無(wú)疑是一次巨大的勝利，彌補(bǔ)了它在接下來(lái)的基準(zhǔn)測(cè)試 782.lbm_r 中遭遇的慘敗。

現(xiàn)在，讓我們來(lái)看看當(dāng)這些 CPU 滿負(fù)荷運(yùn)行時(shí)，運(yùn)行的 SPECrate 副本數(shù)量與它們的 CPU 核心數(shù)/SMT 插槽數(shù)一樣多時(shí)，CPU 的性能和總吞吐量。

使用多個(gè) SPECrate 實(shí)例并讓相應(yīng)的 CPU 滿負(fù)荷運(yùn)行后，結(jié)果截然不同。在 CPU 滿負(fù)荷運(yùn)行時(shí)，AMD Zen 5 系統(tǒng)在整數(shù)和浮點(diǎn)運(yùn)算測(cè)試中均優(yōu)于 Intel 和 NVIDIA/Arm 系統(tǒng)。盡管 AMD 系統(tǒng)理論上只有 16 個(gè) CPU 核心，而 Intel 和 NVIDIA 分別有 24 個(gè)和 20 個(gè)核心，但 AMD 系統(tǒng)卻擁有 16 個(gè)核心。然而，另一方面，AMD 芯片采用的是 16 個(gè) P 核心的同構(gòu)設(shè)計(jì)，而 Intel 和 NVIDIA 芯片則通過(guò)混合使用 P 核心和 E 核心來(lái)實(shí)現(xiàn)各自的核心數(shù)量。

總的來(lái)說(shuō)，我們?cè)趩尉€程測(cè)試中看到的較高浮點(diǎn)分?jǐn)?shù)在這里有所下降，因?yàn)檫@些系統(tǒng)已經(jīng)完全負(fù)載，對(duì)緩存和其他內(nèi)存資源的競(jìng)爭(zhēng)更加激烈（更不用說(shuō)電源和散熱預(yù)算了）。

再次查看各項(xiàng)測(cè)試的得分明細(xì)，我們發(fā)現(xiàn)AMD系統(tǒng)在除一項(xiàng)之外的所有整數(shù)測(cè)試中都勝出，而最后一項(xiàng)測(cè)試的結(jié)果也基本持平。具體結(jié)果因測(cè)試而異，但AMD系統(tǒng)始終與其他芯片保持同步，甚至在少數(shù)情況下遙遙領(lǐng)先。

在浮點(diǎn)運(yùn)算基準(zhǔn)測(cè)試中，這種差距更加明顯，正如整體幾何平均分所暗示的那樣。AMD芯片在782.lbm_r測(cè)試中仍然落后（即使只使用一份SPECrate測(cè)試結(jié)果，它也表現(xiàn)不佳），但它在其他測(cè)試中通常遙遙領(lǐng)先于其他芯片。需要重申的是，這些測(cè)試機(jī)器并非完全相同，但這無(wú)疑讓AMD的表現(xiàn)看起來(lái)不錯(cuò)。

換一種方式來(lái)可視化，下圖展示了每個(gè)芯片的擴(kuò)展性與其單次測(cè)試得分的對(duì)比情況。

在這里我們?cè)俅慰吹?AMD 芯片的性能提升最為顯著，這無(wú)疑部分歸功于其對(duì) P 核心的獨(dú)家使用。

同時(shí)，就浮點(diǎn)運(yùn)算性能而言，多核擴(kuò)展性總體較弱。所有三個(gè)系統(tǒng)在運(yùn)行單個(gè) SPECrate 實(shí)例時(shí)均表現(xiàn)出較低的性能擴(kuò)展性，這強(qiáng)烈表明浮點(diǎn)運(yùn)算工作負(fù)載對(duì)緩存、內(nèi)存和總線帶寬等共享資源提出了更高的要求。

由于這是新一代的基準(zhǔn)測(cè)試，接下來(lái)讓我們看看它與 SPEC CPU 2017 的比較。

SPEC CPU 2026 與 SPEC CPU 2017 對(duì)比

我們還想快速對(duì)比一下 SPEC CPU 2026 和 SPEC CPU 2017 的性能。由于 SPEC CPU 2017 的數(shù)據(jù)很多，我們認(rèn)為直接在兩個(gè)測(cè)試平臺(tái)上運(yùn)行系統(tǒng)并比較差異會(huì)很有意思。需要注意的是，這兩個(gè)基準(zhǔn)測(cè)試套件的得分并不直接可比，2026 和 2017 的得分之間也沒(méi)有官方的“縮放因子”。盡管如此，這仍然有助于突出每個(gè)系統(tǒng)在 SPEC CPU 2017 和 SPEC CPU 2026 之間的相對(duì)位置變化。

從單個(gè) SPECrate 樣本開始，以下是我們的 1T 結(jié)果。

對(duì)于整數(shù)運(yùn)算工作負(fù)載，三款系統(tǒng)的性能提升幅度都相當(dāng)接近。也就是說(shuō)，在 SPEC CPU 2026 測(cè)試中，三款系統(tǒng)的得分均在 2017 年得分的 55% 到 58% 之間。然而，浮點(diǎn)運(yùn)算性能的下降更為明顯。英特爾系統(tǒng)不僅下降幅度更大，其 2026 年得分僅為 2017 年得分的 54%，并且在此基礎(chǔ)上進(jìn)一步下降。NVIDIA Arm 系統(tǒng)的下降幅度更大，其 2026 年得分僅為 2017 年得分的 46%。實(shí)際上，這意味著與 SPEC CPU 2017 相比，NVIDIA 系統(tǒng)在 SPEC CPU 2026 測(cè)試中落后于 AMD 和英特爾。（盡管它在 2026 年的整體 1T 性能表現(xiàn)最佳。）

同時(shí)，運(yùn)行多個(gè) SPECrate 測(cè)試用例的比率則更為穩(wěn)定。所有結(jié)果均在 50% 左右，表明 SPEC CPU 2026 對(duì)多核吞吐量的壓力與對(duì)單核吞吐量的壓力相當(dāng)。此外，所有測(cè)試用例的性能下降幅度均不超過(guò) 51%。即使是 NVIDIA Arm 系統(tǒng)，在 2026 fprate 測(cè)試中也達(dá)到了其 2017 fprate 性能的 52%。

最終，這些數(shù)值會(huì)因系統(tǒng)架構(gòu)和配置而異，因此不應(yīng)將其作為其他系統(tǒng)的經(jīng)驗(yàn)法則。這表明，在Arrow Lake、Strix Halo和GB10這三款芯片中，它們的相對(duì)排名基本保持不變。簡(jiǎn)而言之，雖然SPEC CPU 2026顯著改進(jìn)了基準(zhǔn)測(cè)試套件的底層工作負(fù)載，但到目前為止，我們尚未看到它改變當(dāng)代CPU之間的性能對(duì)比。

結(jié)語(yǔ)

雖然“更大更強(qiáng)”這個(gè)詞在業(yè)內(nèi)無(wú)疑已被濫用，但就 SPEC CPU 2026 而言，這卻是對(duì)這套基準(zhǔn)測(cè)試套件最貼切的描述。SPEC CPU 2026 包含 52 個(gè)現(xiàn)代基準(zhǔn)測(cè)試，代碼量是之前的兩倍多，并且工作負(fù)載旨在隨著最新處理器的性能和內(nèi)存容量而擴(kuò)展，因此它不僅比以往規(guī)模更大，而且更能代表現(xiàn)代計(jì)算工作負(fù)載。

從我們初步的基準(zhǔn)測(cè)試結(jié)果來(lái)看，最新的CPU基準(zhǔn)測(cè)試套件乍看之下似乎與之前的版本并沒(méi)有太大的變化。雖然該套件的大部分單項(xiàng)基準(zhǔn)測(cè)試都是全新的，但整體幾何平均得分始終穩(wěn)定在SPEC CPU 2017的50%左右，整數(shù)和浮點(diǎn)工作負(fù)載均是如此。

需要注意的是，這種擴(kuò)展性并不能保證在不同的 CPU 架構(gòu)和系統(tǒng)中都能實(shí)現(xiàn)。總體而言，雖然 SPEC CPU 2026 測(cè)試總體上強(qiáng)度更高，但它并沒(méi)有顯著改變我們?cè)诒疚闹袦y(cè)試的 Intel、AMD 和 NVIDIA 芯片的相對(duì)排名。也就是說(shuō)，雖然 SPEC CPU 2026 為我們提供了更多（且非常有價(jià)值的）數(shù)據(jù)點(diǎn)，讓我們能夠比較這些芯片的性能，但它目前并沒(méi)有改變桌面芯片的既定排名。此外，我們必須指出，由于我們這里使用的是 LLVM，我們預(yù)期各公司會(huì)推出比我們目前看到的更優(yōu)化的編譯器。這里測(cè)試的只是 LLVM20，但 LLVM22 略有不同，一些公司可能擁有更優(yōu)化的編譯器。

即使 SPEC CPU 2026 并未給當(dāng)前的 CPU 基準(zhǔn)測(cè)試領(lǐng)域帶來(lái)任何劇烈的變革，但距離上一版本發(fā)布已過(guò)去九年，能夠擁有一個(gè)包含更多現(xiàn)代工作負(fù)載的更新版本仍然是一件好事。尤其是在業(yè)界正著手設(shè)計(jì)和評(píng)估未來(lái)十年 CPU 之際。

*免責(zé)聲明：本文由作者原創(chuàng)。文章內(nèi)容系作者個(gè)人觀點(diǎn)，半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點(diǎn)，不代表半導(dǎo)體行業(yè)觀察對(duì)該觀點(diǎn)贊同或支持，如果有任何異議，歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。

今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4398內(nèi)容，歡迎關(guān)注。

加星標(biāo)??第一時(shí)間看推送

求推薦

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.