![]()
GTC 2026 演講中,黃仁勛傳遞的核心信息很明確。
即 AI 正進入“推理與智能體時代”,數(shù)據(jù)中心正在從計算中心演變?yōu)樯a(chǎn) Token 的“AI 工廠”。
圍繞這一趨勢,英偉達發(fā)布了從 GPU 架構(gòu)、數(shù)據(jù)處理軟件庫、AI 超級計算平臺到智能體軟件棧的一整套基礎(chǔ)設(shè)施。
黃仁勛說,黃仁勛說,AI 正在進入一個數(shù)萬億美元規(guī)模的基礎(chǔ)設(shè)施時代,而英偉達就是這個時代的“基建總包商”。
當(dāng)天發(fā)布的一系列技術(shù)——Feynman 架構(gòu)、Vera Rubin 超級 AI 平臺、數(shù)據(jù)處理核心庫 cuDF / cuVS、AI 工廠基礎(chǔ)設(shè)施 DSX、智能體平臺 NemoClaw 等,真實的構(gòu)成了一套完整的 AI 基建技術(shù)棧。
一、CUDA20年:英偉達真正的護城河
演講一開始,黃仁勛并沒有談新產(chǎn)品,而是回顧了 CUDA 誕生 20 年的歷史。
![]()
他的核心觀點是,英偉達最難復(fù)制的優(yōu)勢,不是 GPU,而是 CUDA 的安裝基數(shù)。
過去 20 年,CUDA 建立了一個龐大的軟件生態(tài):關(guān)鍵數(shù)據(jù)、全球數(shù)億塊GPU 運行 CUDA、數(shù)千種工具、編譯器、框架與庫,及開源生態(tài)的數(shù)十萬項目。
而 CUDA增長邏輯是一個典型的飛輪效應(yīng)。
安裝基數(shù) → 開發(fā)者 → 新算法 → 新市場 → 更多公司 → 更大安裝基數(shù)……
這套飛輪已經(jīng)跑了 20 年。
其直接結(jié)果是,計算成本持續(xù)下降。
黃仁勛舉了一個很典型的例子,
六年前發(fā)布的 Ampere GPU,在云上的價格甚至還在上漲。
原因很簡單,軟件持續(xù)優(yōu)化,讓舊 GPU 的價值不斷提高。
因此 CUDA 帶來的并不僅是性能提升,而是長期下降的算力成本曲線。
這也是為什么英偉達愿意持續(xù)支持每一塊舊GPU。
因為安裝基數(shù)越大,飛輪越快。
二、AI 時代最重要的一張圖:數(shù)據(jù)處理
黃仁勛表示,本場演講最重要的一張圖,其實與 GPU 無關(guān),而是數(shù)據(jù)處理架構(gòu)。
![]()
他指出,AI 正在徹底改變?nèi)驍?shù)據(jù)處理體系。
數(shù)據(jù)可以分為兩類:
一是結(jié)構(gòu)化數(shù)據(jù),企業(yè)傳統(tǒng) IT 的核心。
典型技術(shù)如 SQL、Spark、Pandas 等。
典型平臺如Snowflake、Databriks、Amazon Web Services、Microsoft、Google 等。
這些系統(tǒng)本質(zhì)上都在處理 DataFrame(數(shù)據(jù)框)。
它們是企業(yè)運營的 “事實來源(Ground Truth)”。
二是非結(jié)構(gòu)化數(shù)據(jù),全球約 90% 的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù)。包括視頻、語音、圖像、文檔、PDF等。
過去的問題是,計算機無法理解它們,而 AI 改變了這一點。
多模態(tài)模型可以解析語義、閱讀文檔、理解視頻、解析語音,從而把非結(jié)構(gòu)化數(shù)據(jù)變成可計算的數(shù)據(jù)。
為此,英偉達為此推出兩項核心技術(shù)。
即cuDF,GPU加速的 DataFrame計算庫, 用于結(jié)構(gòu)化數(shù)據(jù)和cuVS,向量搜索與語義計算庫, 用于 非結(jié)構(gòu)化數(shù)據(jù)
這兩者將成為未來 AI 數(shù)據(jù)基礎(chǔ)設(shè)施的核心軟件層。
他舉了一個重要案例,IBM 已經(jīng)在其數(shù)據(jù)平臺 watsonx.data 中集成 cuDF。
這意味著,AI 正在重新定義整個數(shù)據(jù)處理產(chǎn)業(yè)。
三、AI 原生公司的爆發(fā)
過去一年,AI 創(chuàng)業(yè)進入歷史性階段。
數(shù)據(jù)顯示,2025年,AI創(chuàng)業(yè)融資1500億美元,且融資規(guī)模從千萬級→數(shù)十億美元級。
背后就是海量算力的需求。
黃仁勛把這一輪技術(shù)浪潮與三次計算革命類比:
計算平臺
誕生公司
PC
微軟
互聯(lián)網(wǎng)
移動云
Amazon / Meta
現(xiàn)在,AI 也將誕生新一代巨頭。
他認為, AI 爆發(fā)的三大原因是,ChatGPT 開啟生成式 AI,推理模型出現(xiàn),及AI agent 爆發(fā)。
ChatGPT 讓計算模式從檢索轉(zhuǎn)為生成,推理模型讓AI開始具備思考、規(guī)劃和解析的能力,Token 使用量爆炸式增長。
Agent時代開啟,以Claude Code為代表。
從此 AI 可以閱讀代碼、編譯、測試、自動迭代,甚至一個任務(wù)可以自動運行數(shù)百次實驗。
關(guān)于推理時代催生的算力需求,黃仁勛給出一個驚人的數(shù)字:
過去兩年,計算需求增長10000倍,使用量增長 100 倍。
而他個人感受是,真實需求增長接近 100 萬倍。
![]()
四、Token 成本成為核心指標(biāo)
在 AI 時代,數(shù)據(jù)中心的角色正在改變。
過去是存儲 + 計算,而未來是 Token 工廠。
衡量效率的指標(biāo)也變成,tokens / watt(每瓦生成 token 數(shù))
研究機構(gòu) SemiAnalysis 的評估顯示,從Hopper H200 → Grace Blackwell NVLink 72,英偉達系統(tǒng)每瓦性能提升約 35 倍。
![]()
分析師 Dylan Patel 認為,實際接近 50 倍。
軟件優(yōu)化同樣關(guān)鍵。
僅通過更新軟件棧,生成速度可以從700 token/s 提升到5000 token/s,性能提升約7倍。
黃仁勛給出一個非常現(xiàn)實的計算,建設(shè)一個 1GW 數(shù)據(jù)中心,15 年攤銷成本約400億美元。
因此,企業(yè)必須保證運行效率最高的計算系統(tǒng),否則 Token 成本就會失控。
他的結(jié)論非常直接:
NVIDIA 的 Token 成本目前“不可觸碰”。
五、Vera Rubin:AI 超級計算機
本次演講的另一個高潮是 Vera Rubin AI 平臺。
![]()
這是一個完整的 AI 超級計算系統(tǒng)。
2 萬顆 NVIDIA 芯片、40 機架、1152 個 Rubin GPU、60 exaflops 算力、10PB/s 帶寬。
目前合作伙伴包括 OpenAI、Anthtopic、Meta、Mistral AI 等。
黃仁勛說:
以前我發(fā)布產(chǎn)品時,手里舉的是一塊 GPU。
現(xiàn)在我發(fā)布的是一整臺超級計算機。
Vera Rubin 代表的是,完整的垂直整合 AI 系統(tǒng)
包括:GPU、CPU、網(wǎng)絡(luò)、存儲、軟件棧等。
其中新的 Vera CPU 也首次亮相。
它是,全球首個采用 LPDDR5 的數(shù)據(jù)中心 CPU
目標(biāo)是,極致能效比。
六、下一代 GPU:Feynman
英偉達還首次詳細介紹了下一代架構(gòu),F(xiàn)eynman GPU。
![]()
其關(guān)鍵升級集中在 內(nèi)存與封裝。
如,定制HBM
可能采用定制HBM4E,或提前布局 HBM5
并允許把 GPU邏輯直接嵌入存儲芯片。
新CPU架構(gòu):Rosa
Feynman平臺將配套 Rosa CPU。
這個名字致敬了兩位科學(xué)家,Rosalyn Sussman Yalow 和 Rosalind Franklin。
Rosa CPU 的角色是Agentic AI 調(diào)度中樞。
具體負責(zé)協(xié)調(diào)GPU、內(nèi)存、網(wǎng)絡(luò)和 Token 流。
七、AI 工廠操作系統(tǒng):DSX
隨著 AI 基礎(chǔ)設(shè)施規(guī)模擴大,其建設(shè)方式也在發(fā)生變化。
現(xiàn)在的數(shù)據(jù)中心在建造前就會,先在數(shù)字世界里建一遍。
使用的工具包括Simcenter STAR-CCM+、Cadence Design Systems和 ETAP。
英偉達推出的新平臺NVIDIA DSX,目標(biāo)是成為AI 工廠的操作系統(tǒng)。
![]()
它可以模擬數(shù)據(jù)中心、優(yōu)化電力、化散熱、動態(tài)調(diào)度算力,甚至根據(jù)電網(wǎng)壓力自動調(diào)整功耗。
八、Agent 時代的軟件:NemoClaw
對開發(fā)者影響最大的,是智能體軟件棧。
黃仁勛重點提到了開源項目,OpenClaw。
他認為 OpenClaw 的意義類似Linux、Kubernetes、HTML,可以被看作Agent 時代的操作系統(tǒng)。
功能包括任務(wù)拆解、子 Agent 協(xié)作、工具調(diào)用、文件系統(tǒng)訪問、多模態(tài)交互等。
![]()
英偉達在此基礎(chǔ)上推出了 NVIDIA NemoClaw, 新增能力包括 企業(yè)安全策略、 網(wǎng)絡(luò)防護、 隱私路由、 治理系統(tǒng)集成等, 目標(biāo)是,讓企業(yè)安全部署 AI Agent。
![]()
九、AI 生態(tài):300萬開源模型
黃仁勛最后談到 AI 生態(tài)。
目前全球開放模型規(guī)模,已接近300 萬個。
英偉達也發(fā)布了一系列基礎(chǔ)模型,如Nemotron(語言模型)、Cosmos(世界模型)、GR00T(機器人模型)、BioNeMo(生物 AI)。
目標(biāo)是,推動主權(quán) AI(Sovereign AI)。
同時英偉達還宣布成立 Nemotron Coalition。
![]()
合作伙伴包括Cursor、LangChain、Perplexity AI、Mistral AI。
結(jié)語:AI 的三大浪潮
![]()
在演講最后,黃仁勛總結(jié)稱, AI 正同時經(jīng)歷 三場革命。
一是, AI 推理與 AI 工廠;
二是, Agentic AI(智能體);
三是, Physical AI(機器人)。
當(dāng)計算、模型和基礎(chǔ)設(shè)施三者同時成熟時,AI 產(chǎn)業(yè)將進入一個全新的時代。
而英偉達顯然希望成為這個時代的基礎(chǔ)設(shè)施核心。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.