網易首頁 > 網易號 > 正文申請入駐

NVIDIA Vera Rubin POD：7 個芯片、5 個機架級系統、1 臺 AI 超級計算機

2026-04-24 18:20:07　來源: NVIDIA英偉達中國

北京舉報

分享至

AI 是由 Token 驅動的。每個提示、推理步驟和智能體交互都會生成 Token。過去一年，Token 的消耗量增長了數倍，現在每年已超過 1 億億 Token。雖然 Token 的大部分由人類與 AI 交互生成，但在新時代，大多數 Token 將由 AI 與 AI 交互生成。

現代智能體系統可規劃任務、調用工具、執行代碼、檢索數據，并在由多個 AI 智能體參與的連續多步驟工作流中進行協同。這些交互會生成大量推理 Token，擴大 KV 占用緩存，并且需要基于 CPU 的沙盒環境來測試和驗證加速計算系統生成的結果。這對 GPU、CPU、縱向擴展（scale-up）域、橫向擴展（scale-out）網絡和存儲提出了低延遲、高吞吐量的要求。

為這些現代智能體系統提供有價值的智能，需要一組專門構建的機架級系統，這些系統作為一個統一的 AI 超級計算機協同運行。

隆重推出 NVIDIA Vera Rubin POD

NVIDIA Vera Rubin 通過對涵蓋計算、網絡和存儲的七款芯片進行極致協同設計，構建了迄今最復雜的 POD 級 AI 平臺。該平臺包含 40 個機架、1200 萬億個晶體管、近 20,000 個 NVIDIA 裸片、1,152 個 NVIDIA Rubin GPU、60 exaflops 和 10 PB/s 的縱向擴展總帶寬。

Vera Rubin POD 引入了五種全新的專用機架級擴展系統，適用于需要高吞吐量、超低延遲推理、高密度 CPU 沙盒和大規模上下文內存存儲的代理式 AI 工作負載。這些機架共同構成了一個統一的系統，將為全球最具能效和和成本效益的數據中心提供動力支持。

NVIDIA Vera Rubin POD 包含 5 個機架級系統、1 臺 AI 超級計算機、1 臺 NVIDIA MGX 機架架構和生態系統

POD 中的每個芯片都通過第三代 NVIDIA MGX 機架進行擴展，并由 80 多家 NVIDIA MGX 生態系統合作伙伴組成的全球供應鏈提供支持。由于所有 NVIDIA MGX 機架在供電、冷卻和機械結構上保持一致，因此可以實現快速部署和無縫過渡。

本文將介紹 NVIDIA Vera Rubin POD，其由五個專用機架級系統組成，基于第三代 NVIDIA MGX 機架架構構建，專為代理式 AI 時代打造。

通過以下幾個方面具體了解：

隆重推出 NVIDIA Vera Rubin POD
- NVIDIA Vera Rubin NVL72 GPU 機架：四大擴展定律平臺
- NVIDIA Groq 3 LPX 機架：推理加速器機架
- NVIDIA Vera CPU 機架：大規模代理式 AI 和強化學習
- NVIDIA BlueField-4 STX 存儲機架：AI 原生存儲
- NVIDIA Spectrum-6 SPX 以太網機架：網絡機架
第三代 NVIDIA MGX 機架級架構
- 實現彈性和可擴展性
- 確保從芯片到電網的峰值能效
- 釋放更多計算能源預算
- 開放標準
NVIDIA MGX NVL 機架
- NVIDIA Vera Rubin NVL72 的簡化設計
- NVIDIA Vera Rubin Ultra NVL576
- NVIDIA Kyber NVL1152：下一代
NVIDIA MGX ETL 機架
- NVIDIA Spectrum-X 以太網 spine
- 芯片間 spine 直連
NVIDIA Vera Rubin DSX AI 工廠平臺

以上為摘要內容，點擊鏈接閱讀完整內容：NVIDIA Vera Rubin POD：7 個芯片、5 個機架級系統、1 臺 AI 超級計算機 - NVIDIA 技術博客

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.