NVIDIA DGX Rubin 系統(tǒng)整合了 NVIDIA 在計(jì)算、網(wǎng)絡(luò)和軟件領(lǐng)域的最新突破,將推理 token 成本降至 NVIDIA Blackwell 平臺的十分之一,可加速從推理和訓(xùn)練到長上下文推理的任意 AI 工作負(fù)載。
![]()
在 CES 上,NVIDIA 推出了 Rubin 平臺,該平臺由六款全新芯片組成,旨在打造一臺超凡的 AI 超級計(jì)算機(jī),專為加速代理式 AI、混合專家模型(MoE)以及長上下文推理而設(shè)計(jì)。
Rubin 平臺通過先進(jìn)的協(xié)同設(shè)計(jì)方法,將六款芯片——NVIDIA Vera CPU、Rubin GPU、NVLink 6 交換機(jī)、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太網(wǎng)交換機(jī)——進(jìn)行了有機(jī)整合,從而加速訓(xùn)練過程并降低推理 token 生成成本。
不論是企業(yè)還是研究環(huán)境,DGX SuperPOD 都可作為部署基于 Rubin 系統(tǒng)的基礎(chǔ)架構(gòu)設(shè)計(jì)參考方案。
NVIDIA DGX 平臺將從 NVIDIA 計(jì)算到網(wǎng)絡(luò)再到軟件的整個技術(shù)棧整合為一個統(tǒng)一協(xié)同的系統(tǒng),消除了基礎(chǔ)設(shè)施集成的負(fù)擔(dān),使團(tuán)隊(duì)能夠?qū)W⒂?AI 創(chuàng)新和業(yè)務(wù)成果。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“當(dāng)前訓(xùn)練和推理的 AI 計(jì)算需求不斷飆升,Rubin 的問世恰逢其時。”
基于 Rubin 的 DGX SuperPOD 部署將集成:
- NVIDIA DGX Vera Rubin NVL72 或 DGX Rubin NVL8 系統(tǒng)
- NVIDIA BlueField-4 DPU,用于構(gòu)建安全、軟件定義的基礎(chǔ)設(shè)施
- NVIDIA 推理上下文記憶存儲平臺,支持下一代推理工作負(fù)載
- NVIDIA ConnectX-9 SuperNIC
- NVIDIA Quantum-X800 InfiniBand 與 NVIDIA Spectrum-X 以太網(wǎng)
- NVIDIA Mission Control,用于 AI 基礎(chǔ)設(shè)施的自動化編排與運(yùn)維
DGX SuperPOD 長期以來一直是大型 AI 基礎(chǔ)設(shè)施的藍(lán)圖。Rubin 平臺的問世將成為新一代 AI 工廠的起點(diǎn)——這些系統(tǒng)旨在實(shí)現(xiàn)跨數(shù)千步推理,并以顯著降低的成本交付智能,助力企業(yè)構(gòu)建下一代尖端模型、多模態(tài)系統(tǒng)和代理式 AI 應(yīng)用。
以上為摘要內(nèi)容,點(diǎn)擊鏈接閱讀完整內(nèi)容:NVIDIA DGX SuperPOD 為基于 Rubin 的系統(tǒng)奠定基礎(chǔ) | NVIDIA 英偉達(dá)博客
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.