網易首頁 > 網易號 > 正文申請入駐

大學買不到GPU怪我？黃仁勛斯坦福現場火力全開：是你們體制的錯！

2026-05-15 14:00:58　來源: AI科技大本營

北京舉報

分享至

過去 60 年的計算底座已被徹底顛覆，“把 GPU 比作原子彈極其愚蠢。”

編譯 | 王啟隆

出品丨AI 科技大本營（ID：rgznai100）

最近，黃仁勛回到母校斯坦福，參與了一場訪談形式的客座講座。臺下盯著他的，不只是學生，還有一整代正在被 AI 改寫職業命運的人。

大家表面上在問課程、開源、芯片、算力，真正想問的，其實是另一件事，過去那套計算機世界的規則，是不是已經翻篇了？如果真的翻篇了，我們該拿什么去追下一局？

這是個焦慮的時代。馬斯克為 xAI 重金組建超大計算集群，硅谷大廠為了搶奪 H100 和 B200 芯片互不相讓，加上跨國半導體出口管制的博弈愈演愈烈，整個行業都籠罩在極度的算力焦慮之中。而黃仁勛這次給出的回答，很少是溫和的。

一開口就把背景拉到 60 多年那么長，說過去我們熟悉的計算，本質上更像一種預錄制系統，圖像是提前做好的，軟件是提前寫好的，響應也是按既定路徑發生的。但現在，計算正變成一種實時生成的東西。它不只是執行命令，而是在理解語境、生成反饋、調用工具，甚至開始具備一點點像「思考」的能力。

順著這個判斷往下推，變化就不只是模型變強了，也不只是多了一波 AI 創業機會，而是從軟件怎么寫、芯片怎么造、公司怎么組織，到大學該怎么教學生，全都得重來一遍。

這是一篇難得的對話。黃仁勛把自己這幾十年怎么判斷技術浪潮、怎么扛過錯誤、怎么設計系統、怎么理解競爭，掰開了講給一群即將下場的人聽。

要點速覽

AI 不是給舊計算范式加一層外掛，而是在把過去 60 多年的計算模型整套改寫。過去的計算更像「預錄制」，現在的計算越來越像「實時生成」，這會連帶改變軟件、芯片、組織形態和教育方式。
co-design 時最核心的一層，不只是軟硬協同這四個字，而是把算法、編譯器、框架、芯片、網絡、存儲放在同一張桌子上一起優化。英偉達過去十年的巨大躍遷，本質上就來自這種極端協同設計。
最前沿的商業模型今天確實最好用，但另一方面，開源依然是語言平權、行業拓邊和 AI 安全的必要基礎。尤其在生物、自動駕駛、機器人這些領域，如果沒有人先把基礎模型和訓練方法做出來，下游生態根本起不來。
MFU 高低本身不是一個好指標，真正該看的，是系統最終交付了多少有價值的 token、每瓦特能換來多少實際智能輸出，而不是 flops 漂不漂亮。
未來大學不可能只靠預先寫好的教材跟上 AI 的速度。AI 不只是一個要學的對象，它本身就該成為課程體系和學習過程的一部分。
AI 時代最重要的能力不是追熱點，而是重新理解系統。誰能更早看清新的計算模式、圍繞它重組技術和資源，誰才更可能吃到下一階段最大的紅利。

過去熟知的計算是“預錄制”的，現在一切都是實時“生成”的

主持人：我們正身處一場比納斯卡賽車還要狂飆突進的全球競賽中，而這多少得“怪”你——老黃就像一位布道師，給了我們所需的全部算力、能量，甚至更多，讓我們度過了我生命中最瘋狂的 12 個月——相信在座的許多人也有同感。而這一切，才剛剛開始。你對待每一件事都傾注了極大的熱情，包括去年的課程，以及每一次我有幸與你交流時，你總是把大量的時間留給學生和創業者。謝謝你。我們直接切入正題好嗎？

黃仁勛：好，我們開始吧。

主持人：好的，我們來個快問快答。什么是“軟硬件協同設計”（Co-design）？它為什么如此重要？

黃仁勛：我稍后就來回答這個問題。當下是投身計算機科學的最好時代。原因顯而易見：計算技術正在經歷一場過去 60 多年來前所未有的徹底顛覆。

過去 64 年來，你們所使用的計算機、我們的計算模型、對計算機的認知、計算機的架構、編寫和運行程序的方式，甚至將計算機推向市場和應用領域的思路，自 IBM System/360 問世以來，基本沒有發生過根本性的改變。事實上，我當年學習計算機架構的啟蒙教材，就是 System/360 的手冊。

雖然從個人電腦到互聯網、移動設備再到云計算，很多東西都變了，但計算模型——也就是計算機科學的底層根基——直到今天才迎來了真正的巨變。這是有史以來第一次，編寫軟件的方式、處理神經網絡與傳統軟件的差異，以及應用程序所能達到的邊界，都發生了翻天覆地的變化。一切都截然不同了。

從最高維度來看，一個最簡單的理解方式是：過去我們熟知的計算，本質上是“預錄制”的（pre-recorded）。無論是圖像、視頻還是軟件，基本上都是事先準備好的內容。但現在，一切都是實時“生成”的（generated）。實時生成的美妙之處在于，它可以與你當下的語境保持高度一致，并給出恰如其分的反饋；它不僅能執行你的明確指令，還能真正響應你的意圖。從這個意義上說，計算機已經發生了本質的蛻變。

那么問題來了，這對整個技術棧的每一層意味著什么？從現代軟件的開發方式、方法論，到你如何組織一家公司來開發軟件，都已被徹底顛覆。我們使用的工具、思考代碼的路徑完全變了。運行軟件的方式——無論是運行神經網絡還是編譯后的二進制文件——也大相徑庭。

那么，這對計算機系統、網絡和存儲意味著什么？對架構其上的軟件棧和云服務又意味著什么？當然，在應用層面，它又解鎖了什么？剛才有人提到我們剛剛開源了一款名為Alpamayo的軟件。我在自動駕駛領域已經深耕了大約 13 年，無人駕駛出租車遍地開花的時代真的要來了。未來，所有能移動的物體都將實現機器人化。

這就是一個典型的例子：在深度學習和人工智能出現之前，我們根本不敢想象能實現這樣的應用。這是一個巨大的突破口，讓我恍然大悟：“啊哈！過去那些我們需要依靠計算機視覺來解決的難題，現在終于有了根本性的解法。”

所以，你需要重新思考其中的每一個環節。什么是軟件工程師？如何重組公司架構？AI 時代的計算機到底是什么樣的？如何去設計它的架構？一直延伸到你能用它做什么，以及你會把它部署在哪里。這一切都被重構了。對我而言，這段旅程其實始于 15 年前。我有幸接觸到了該領域的一些早期研究，就像所有斯坦福的學生一樣，你把問題拆解，從第一性原理出發去推導，最終得出結論：一切都變了。

所以，在座的計算機科學專業的同學們，你們真正見證了 AI 變得實用化的第一代。幾年前，我們還停留在生成式 AI 的階段。大家知道，生成式 AI 不僅讓生成圖像、文本摘要和翻譯變得很酷，它還賦予了機器“思考”的能力。當我看到生成式 AI 時，別人看到的是它能畫圖，我當然也欣賞這一點，但我看到的是：既然它能以圖像的形式生成思想，既然它能生成思想，它就能進行推理。在 GPT 問世之后，AI 具備思考能力已經成為不爭的事實。

接下來的問題是：你該如何訓練、微調一個 AI，讓它能夠一步步地進行推理？又該如何以半監督的方式，在極大規模上教會它做到這一點？這些都是你需要解決的工程難題。但在你看到 GPT 的那一刻，你就會感嘆：“啊哈，機器思考的時代近在咫尺了。”

思考，其實就是生成供內部消耗的 Token；而生成供外部消耗的 Token，則被稱為“工具調用”（tool use）。所以，在兩年前 GPT 誕生之后，我們能預見到今天的局面其實并不困難。當然，這期間涌現了海量的技術發明，許多了不起的人做出了驚人的貢獻，但你幾乎能提前預見到這一刻的到來。

現在，我們擁有了智能體系統（agentic systems）。那么接下來呢？如果未來的計算機不再是被動響應你的指令，不再是按需購買，世界會變成什么樣？今天的計算，本質上是“按需計算”。“按需”（on-demand）這個詞正是我們這一代人發明的，用來定義我們使用計算機的方式。按需使用的分時計算機演變成了云計算，而云計算自然也是按需的。但在未來的智能體世界里，這些計算機將是持續運行的。當計算機 24 小時永不停歇地運轉時，世界會發生什么？云服務會變成什么樣？你的個人電腦會變成什么樣？所有這些系統又將何去何從？

這又是一次重新思考一切的絕佳機會。這就是我的開場白：因為我們所做出的改變，計算機科學的一切都變了，每一個科學領域的一切也都變了。現在是重返校園學習的最好時機。

加入 AMD AI 開發者計劃，免費領 50 小時云算力券

進入官方群月月抽顯卡、AIPC，好運不停！

協同設計與現代教育

主持人：我準備把提問權交給學生們了。首先是關于協同設計（co-design），這是投票第一的問題。

黃仁勛：協同設計非常有趣。簡單來說，在過去，我們將計算進行了抽象分層，設計微處理器的人只管設計微處理器，做編譯器的人只管做編譯器，搞編程語言的人只管搞編程語言，以此類推。大家都知道這一點，我們甚至將它們劃分成了不同的學科。

但這帶來了一個問題，而這個問題的解法恰恰誕生在斯坦福。RISC（精簡指令集）的魅力何在？約翰·軒尼詩（John Hennessy）教授那項偉大研究的精髓是什么？它的精髓就在于，你必須將編譯器和微處理器架構和諧地“協同設計”。否則，你可能會造出一個極其緊湊、各項指標都優化到極致的微處理器，但遺憾的是，它極難編譯，甚至根本無法編譯。

所以，他們創造了一種更簡單的指令集，將這種簡單性暴露給編譯器，讓編譯器能更好地生成代碼。事實證明，一臺經過協同設計的簡單機器，加上一個優秀的編譯器，其性能遠超兩個各自獨立優化到極致的系統。這非常“斯坦福”，這是你們的學術傳承，也是軒尼詩教授留下的偉大印記。

順著這個思路想：在通用計算時代結束之后，會發生什么？為什么計算機科學中的每一個問題，都非得用通用設備來解決不可？某種程度上你可以說，如果有通用設備，那當然最好。然而，面對一些極端的難題——無論是早期的計算機圖形學，還是分子動力學、量子化學、流體動力學、大型介觀多物理場問題，亦或是深度學習——這些問題的計算強度實在太大了。你為什么還要用一臺通用計算機去硬扛呢？

所以，這里最大的洞察是：如果你同時懂算法、懂計算機系統、懂編譯器、懂框架，還懂芯片架構，并且你能同時對這所有層級進行全局優化，結果會怎樣？事實勝于雄辯。這就是我剛才描述的做法所帶來的結果。英偉達可能是有史以來第一家將“極端協同設計”貫徹到底的計算機系統公司。我們真正在 CPU、GPU、網絡、交換機和存儲等所有層面上進行了全面的協同設計。

你問我們得到了什么？你們都知道以前的摩爾定律。摩爾定律大約是每 18 個月性能翻一番，算下來差不多是 5 年提升 10 倍，10 年提升 100 倍。那是摩爾定律的黃金時代。在座的計算機科學家都知道，支撐摩爾定律的一個底層概念叫“登納德縮放定律”（Dennard scaling）。但登納德縮放定律在幾年前——其實大概十年前——就已經耗盡了潛力，盡管我們一直在試圖壓榨它。

在過去的十年里，如果你僅僅依賴微處理器的自然迭代，不去碰軟件，只享受半導體和微處理器設計帶來的速度提升，最好的情況下你只能獲得 100 倍的性能增長。但由于登納德縮放定律失效和摩爾定律的基本終結，你在這十年里實際上可能只獲得了 10 倍左右的提升。

但在英偉達的協同設計下，我們在十年內實現了 100 萬倍的性能提升。100 萬倍！當你面對如此龐大的數字時，究竟是 10 萬倍還是 100 萬倍已經不重要了。正是因為我們在 10 年內獲得了 100 萬倍的性能躍升，讓計算規模以如此驚人的速度膨脹，AI 研究人員才會說：“我們干脆把整個互聯網的數據都拿來用吧！為什么還要費心去篩選和創造數據？直接把世界上所有的數據都喂給計算機就行了。”

這就是當你能以極其瘋狂的速度完成某件事時，所帶來的巨大突破。打個比方，如果你能以光速旅行，那你選擇住在哪里根本不重要。如果你能在 10 分鐘內從紐約飛到加州，我們的自由度、社會的方方面面都會被徹底顛覆，對吧？同理，如果你能讓計算速度提升 100 萬倍，關于計算的一切就都改變了。這才是真正的巨大突破。因為協同設計，因為英偉達的這種路徑，我們極大地加速了計算，從而創造了這種無限豐饒的機遇，讓所有人都能重新構想未來。

主持人：酷。我有一堆追問，但我忍住了。僅僅一個詞就引出了這么精彩的回答。

黃仁勛：在英偉達工作就是這種體驗。你拋給我一個詞，我能跟你滔滔不絕講上半個小時，因為我有太多的東西想跟你們分享。

主持人：下一個問題是：面對行業的劇變，教育應該如何演進？它正在發生改變嗎？

黃仁勛：這是一個極其出色的問題。答案很明確：AI 必須成為你們課程體系的一部分。不僅僅是去學習 AI，更是要用 AI 來輔助教學。

如你所知，教科書的問題在于，編寫它需要耗費巨大的心血。我在斯坦福上學時，軒尼詩教授還在寫他的那本經典教材。當時全都是手寫稿，感覺他每周都在寫一章。我甚至不知道他是怎么做到一周寫一章的，但隨著時間的推移，所有的筆記最終匯編成了第一版教科書。那肯定花了好幾年的時間。

我認為，大學和那些預先編寫好的教科書，已經不可能跟得上 AI 實時生成信息和知識的速度了。所以，未來的教育必定是兩者的結合。我不知道你們怎么樣，但如果沒有 AI，我已經沒法學習了。我不僅讓 AI 幫我讀論文，讀完之后，我還會讓它去閱讀與之相關的一大堆衍生論文。這樣一來，它就變成了一個超級研究員。首先我讓它做總結，問它一些基礎問題，然后我就像和一位專屬研究員對話一樣，去深入探討這篇論文。很多人沒有意識到這一點。大多數人依然認為 AI 只是用來總結文檔的，但在總結的過程中，AI 實際上學到了很多東西。我真心希望 AI 能夠與課程體系深度融合。

不過，我也要為教科書辯護一句：第一性原理是永遠不會變的。歸根結底，Mead 和 Conway（VLSI 設計先驅）的方法論依然像過去一樣堅如磐石。確實，過去那種追求恒定電流密度、恒定功率密度的縮放過程，以及與現代半導體設計相關的所有設計優化，我們基本上已經挖掘到頭了。現在已經沒有什么東西是完全等比例縮放（ISO）的了。但了解我們從何而來依然大有裨益。我依然鼓勵大家去領悟第一性原理。

我在斯坦福求學時，就已經在 AMD 工作并設計微處理器了。能夠同時看到工業界的實際設計方法，與學術界關于如何設計這些東西的第一性原理，這種感覺非常棒。我非常享受這種雙管齊下的狀態，這讓我學到了更多。這意味著，當你在使用緊跟時代、結合現實語境的 AI 時，如果你同時也在學習第一性原理的知識，你就會獲得和我當年一樣美妙的體驗。

透明系統的美妙之處在于，每個人都可以去審查它、拷問它

主持人：下一個問題是：你對開源有什么看法？開源如何保持在技術的前沿？

黃仁勛：這其實涉及兩個層面：一是閉源專有軟件與開源軟件的對比，二是我做開源的真實意圖。我先談談我的意圖。

首先，英偉達消耗的 Anthropic 和 OpenAI 的 Token 數量可能比任何人都多。原因很簡單，我們要做大量的代碼編寫和芯片設計，現在我們 100% 的工程師都在智能體的輔助下工作。我希望他們使用最新一代的工具與智能體協作，從而徹底重塑英偉達的工作方式。

所以第一點，如果你能用 OpenAI 和 Anthropic 的 AI，我強烈建議你去用，因為它們真的非常有用。它們運行得極好，而且還在不斷進化。如你所知，大語言模型是內在的核心技術，但云服務是一個完整的產品，云代碼是圍繞它構建的一整套生態系統。這個生態在不斷完善，模型也在不斷變強。你不太可能去 GitHub 上隨便下載一個開源模型，就能達到同樣驚艷的效果。所以我強烈推薦大家使用現成的、前沿的商業 AI 模型，我們自己也是這么做的。

那么問題來了：既然如此，我們為什么還要如此努力地推進開源模型？原因在于，語言模型至關重要，它們代表了人類智能的代碼化。我們非常渴望實現自我自動化，這是極為重要的一環。但你需要明白，AI 的本質是學習信息的表征（representation）、意義和結構。那么信息存在于哪里呢？就在我們此刻對話的周遭世界中。

之所以存在結構，是因為你每天醒來看到的世界大體上是相同的，否則一切就成了毫無意義的白噪音。生物系統和物理系統之所以有結構，是因為只有基于結構，我才能學習到更高維度的表征。如果我能學到這種表征，我就能駕馭它。這說得通吧？正因為我能學習語言的表征，所以我能生成語言，駕馭語言，并將它投入使用。

我想把同樣的邏輯應用到化學、蛋白質、基因、物理學、物理系統，比如機器人領域。請注意，你表征所有這些事物的方式是截然不同的，因為它們的結構不同，維度也不同。你訓練它們的方式也會有天壤之別，對吧？因為你不可能憑空變出一個包含海量化學或物理數據的“人類語言互聯網語料庫”。所以，你必須為這些領域發明全新的策略。

我們決定在一些基礎支柱領域傾注心血。因為英偉達具備這樣的人才和規模，我們有能力在多個不同領域，向世界交付第一批極具價值的“藝術品”——數據、模型以及訓練方法。其中一些領域我非常看重：第一個當然是Nemotron語言模型，我稍后會解釋為什么我們要親自下場做語言模型；第二個是BioNeMo，專攻生物學；第三個是剛才有人提到的Alpamayo，專攻自動駕駛和 AI 導航；第四個是GR00T，專攻人形機器人關節控制和通用機器人 AI；最后是氣候科學，也就是介觀多物理場模擬。

我們決定在所有這些不同的領域充當拓荒者。原因在于，如果沒我們帶頭，這些領域的科學家根本不具備構建基礎模型所需的算力規模和底層技術。所以我們決定挺身而出。正是因為我們的努力，我們激活了醫療保健行業，激活了生命科學領域。現在，世界上每一家自動駕駛汽車公司都在與我們合作，無論哪家公司，其底層都有英偉達的影子。我們讓整個生態系統真正繁榮了起來，現在我們正在推進機器人領域，等等。如果我們不邁出第一步去構建基礎模型，下游的整個產業就很難被激活。所以，這本質上是為了拓展 AI 的邊界，實現這種能力的民主化。

至于我們為什么要做語言模型，原因有兩個。第一，世界上有太多的社會和群體，他們語言的受眾規模不夠大，不足以讓其他商業公司將其作為首要任務。那些大公司可能會讓模型懂一點瑞典語，但不太可能把瑞典語放在最高優先級，因為這個國家雖然不小，但也沒那么大。中文當然被照顧得很好，印度的某些方言也被照顧得很好。但你知道，世界上還有 230 多種其他語言。對于這海量的其他語言，除非你發自內心地在乎，否則它們永遠得不到頂級的支持。人類的智慧，無論其人口規模大小，都應該被珍視。所以，我們打造了一個接近前沿水平的大語言模型——Nemotron，并且我們把一切都開源了。這樣一來，如果有人想把它微調成自己選擇的任何語言，都易如反掌。

第二個原因非常關鍵：我們希望將這些語言模型與特定領域的模型融合，因為這里面包含著人類的先驗知識（human priors）。例如，Alpamayo 就是一個將語言模型與世界模型融合的產物。一方面，它是專門為檢測汽車、道路等元素而設計的；但另一方面，我們堅信，如果 AI 模型（也就是 Alpamayo 這個自動駕駛模型）能夠像人類一樣進行推理，能夠利用人類的先驗知識去思考，那么它成長為一個極其優秀且安全的駕駛系統所需的“經驗值”就會大幅降低。它需要的訓練數據量會顯著減少。我們已經證明了這一點：Alpamayo 可能是世界上最高效的自動駕駛系統之一，它僅僅積累了幾百萬英里的經驗，而不是幾十億英里。這就足以說明這套系統是真的管用。

總之，我給了一個長篇大論的回答，把問題徹底拆解了。你沒法指望我只用一兩句話打發你。但開源模型真的非常重要。還有最后一點：如果你希望 AI 是安全可靠的，它就必須是開源的。原因很簡單：你無法防御一個黑盒，也無法為一個黑盒提供安全保障。你更不能把一個能力極強但完全不透明的黑盒，塞進你的關鍵系統里。當然，有很多方法可以緩解這種不透明性。比如，你可以要求它在執行任何操作之前，必須向你一步步地解釋它的推理過程；在采取行動之前，必須先拿出一個計劃。但問題是，它隨時可能撒謊。

透明系統的美妙之處在于，每個人都可以去審查它、拷問它。如果你有一個透明的開源系統，研究人員就可以自由地使用它。如果你有一個透明的系統，未來防御超級智能體網絡攻擊的方式，顯然不是去陷入一場“看誰的模型版本更高”的軍備競賽——你搞出一個 7.0 版本的攻擊模型，我如果拿不出 8.0 就只能被動挨打，然后你又搞出 9.0，雙方互相折磨到發瘋。這顯然不是最聰明的做法。

最聰明的防御策略是：面對這些可怕的賽博攻擊，我們將部署數以百萬計、十億計、極其廉價的微型 AI 組成蜂群，系統性地將威脅包圍起來。就像構建一個巨大的防御穹頂。例如，Nemotron Nano就被廣泛應用于網絡安全領域。所有的網絡安全公司都在使用 Nemotron Nano，因為它速度極快且成本極低，你可以訓練它來檢測網絡攻擊，然后直接部署數萬億個這樣的微型衛士。

算力利用率（MFU）高還是低？我希望它永遠處于低位

主持人：順著開源擴展這個話題，一月份我們見面時，討論了“開源擴展”（open scaling）這個話題。我們談到了瓶頸：數據是一個瓶頸，算力是另一個瓶頸。我們在 GTC 大會上共同宣布了一個實驗項目，也就是“聯邦擴展”（coalition scaling）的構想。

所以，接下來的問題是如何提高算力的利用率，因為算力正變得越來越稀缺。

上周有消息稱，xAI 的一份內部備忘錄顯示，他們的孟菲斯集群池的 MFU（模型算力利用率）只有11%，這意味著大約有110 億的算力資源處于閑置狀態。

或許你可以談談為什么我們要嘗試聯邦擴展這個實驗，以及在沒有那種能夠打通上下游進行極致優化的垂直整合公司的情況下，我們該如何提高開源生態系統的算力利用率？

黃仁勛：你們知道 MFU 是什么嗎？其實，單看 MFU 這個指標是完全錯誤的。它僅僅代表了你在執行任務時消耗的浮點運算（flops）的百分比。不幸的是，對于任何指標而言，如果你衡量錯了對象，你就會得出錯誤的結論。

如果你問我，我個人是希望 MFU 高還是低？我希望它永遠處于低位。因為我想讓系統足夠聰明，實現“超額配置”（overprovisioned），這樣它才能運轉自如。正因為我做了超額配置，所以我才會有那么多看似閑置的算力。

原因在于，在這些大規模數據中心里，計算的運作方式是這樣的：你擁有算力（flops）、內存帶寬、內存容量和網絡帶寬。在任何給定的時間點，總有一個環節會成為瓶頸。你真正應該做的是，在所有環節上都進行超額配置，這樣才能避開阿姆達爾定律（Amdahl's law）的詛咒，否則你將永遠在與阿姆達爾定律搏斗。但是，如果你是按照峰值需求而不是基礎負載來配置資源，那么當負載處于低谷時，那些超額配置的算力自然會閑置。然而，在關鍵時刻，系統會瞬間飆升到 100% 的 MFU，盡管這只是一小段時間。可如果在這一小段時間里，你沒有那些超額配置的算力儲備來支撐，那么這“一小段時間”的卡頓，就會變成極其漫長的煎熬。

主持人：那么對于那些試圖訓練模型的團隊來說，你看到了什么情況？算力現在很便宜嗎？

黃仁勛：不，算力本身是很便宜的。

主持人：但 H100 的價格在上漲啊。

黃仁勛：那不是因為它的浮點運算能力，而是因為 H100 Hopper 架構的內存帶寬、它的整體架構設計，以及它所包含的一切綜合能力，而不僅僅是它的 flops。

主持人：所以我們不應該把算力看作是一種稀缺資源嗎？

黃仁勛：不，問題的關鍵不在這里。打個比方，以前我們不懂車的時候，總是問：“你這車有多少馬力？” 但現在，誰還會只看馬力買車呢？

主持人：那么你認為我們應該用什么正確的指標來衡量呢？性能嗎？當你告訴團隊：“伙計們，這就是我們明年必須達到的性能目標”時，你發現你越來越看重哪種評估標準（eval）？

黃仁勛：你必須制定一個真正嚴肅、切中要害的評估標準，否則大家只會去刷 flops 數據。如果你找了一個容易刷的指標，大家把那個數字刷得再高，也不會讓系統變得更聰明，也不會讓你取得真正的成功。擁有龐大的算力本身并沒有錯，但它是必要不充分條件。僅此而已。

主持人：從某種意義上說，你可以把輸出的 Token 視為智能的體現。所以，衡量標準是否應該類似于“每瓦特輸出的智能單位”？

黃仁勛：是的。請注意，“每瓦特輸出的 Token 數”遠比單純的 flops 要重要得多。事實上，我們現在非常清楚這一點，因為在解碼這些大語言模型時，決定“每瓦特 Token 數”的最關鍵因素，實際上是貫穿 NVLink72 架構的總帶寬。此時的 MFU 極其低下，因為預填充（prefill）的工作量并不大，主要是解碼（decode），但你可以將解碼和預填充解耦。它是分離的。所以你看，我在 MFU 極低的情況下，依然交付了極其驚人的“每瓦特 Token 數”。

主持人：但并非所有的 Token 都是生而平等的，對吧？我們該如何考量這一點？在設計未來的系統時，當沒有一個統一的智能衡量標準，而生成代碼的 Token 顯然比生成其他內容的 Token 更具“每瓦特價值”時，什么才是正確的衡量方式？這個問題說明白了嗎？

黃仁勛：完全明白。你總是需要回歸到本質：你不能僅僅為了“考試拿高分”（SAT scores）去優化系統，你是在為一個更宏大的目標進行優化。道理是一樣的。你必須明確什么是成功，你評估成功的方式，將極大程度地決定人們的努力方向。英偉達在內部做得極其出色的一點，就是我們建立了一套評估架構的系統，而僅僅看 flops 實在是太狹隘、太敷衍了。

主持人：你的工作極其艱巨，那就是試圖設計一個涵蓋不同智能類型的“指數”。因為當我們的團隊在使用英偉達的架構進行研究時，我們有一個實驗室在搞代碼生成，另一個實驗室在探索超導材料的邊界，等等。他們每個人都在追求完全不同的評估指標。但他們用的都是英偉達的芯片。當你的客戶各自擁有截然不同的評估標準時，你如何解決這個眾口難調的問題？

黃仁勛：這正是設計底層平臺架構之所以如此艱難的原因。它就是這么難。問題在于：如果你打造的東西過度擬合（overfit）某一個特定領域，你確實可以在那個領域所向披靡。你為了這個特定問題量身定制，表現極其驚艷，但問題是，那個市場、那個問題空間可能根本不夠大，不足以支撐起足夠龐大的研發資金。所以，你希望系統能勝任多重任務，具備跨領域的能力。但另一方面，如果你什么都能做，你可能什么都做不精。你就太平庸、太通用了。

所以，在這兩者之間把握平衡，是一門真正的藝術。這就是我賴以為生的手藝。我們不應該做什么？我們應該在哪些領域加倍投入？哪些領域值得我們傾注十倍的資源？這需要極具前瞻性的視野、戰略眼光，需要一定程度的試錯，甚至需要一些個人的直覺享受和娛樂精神，不斷迭代，所有這一切交織在一起。

主持人：我們可以聊聊 Feynman 架構的藍圖嗎？我對這款芯片非常期待，但目前很難獲取到相關信息。基于目前的藍圖，你覺得這件“藝術品”最終會呈現出怎樣的形態？

黃仁勛：我可以跟你們分享一下我們一路走來的心路歷程。看看 Hopper 架構，Hopper 是為一個當時還相當新的問題空間設計的，那個領域叫做“預訓練”（pre-training）。隨著預訓練的興起，我們得出了一個結論：盡管前一代架構已經相當強大，但我們應該建造更大、極其龐大的系統。比世界上任何最大的科學超級計算機還要大。

這可不是件小事。當時世界上最大的超級計算機造價大約是 3.5 億美元，而我們卻在想：“你知道嗎？預訓練將成為一個極其廣闊的領域和一個至關重要的問題。我們應該設計出造價高達數十億美元的系統。” 在當時提出這個想法，聽起來簡直像瘋了。你當時絕對一個客戶都找不到。原因很簡單，歷史上賣出過最貴的東西才 3.5 億美元，而你卻要造一個價值幾十億美元的龐然大物。這完全是在為一個規模為零的市場做開發。

但基于第一性原理的推導，我們還是義無反顧地去做了。于是，專為預訓練設計的 Hopper 誕生了，事實證明，這是一個極其偉大的決策。

我們做的第二件事是，我們意識到：“好吧，預訓練之后呢？我們當然會繼續提升訓練性能，但 AI 的最終目標不是訓練，而是推理（inference）。那么，推理真正需要什么樣的系統？”

于是，我們創造了NVLink72。原因在于，在處理神經網絡時，首先是預填充（涉及上下文處理和注意力機制），然后是解碼。生成海量的 Token 需要極高的內存帶寬。你所需的內存帶寬，遠遠超出了單塊芯片所能提供的極限。所以我們想：“為什么我們不把 72 塊芯片組合在一起呢？”

為此，我們不得不發明各種全新的交換和互連系統，創造了全新的 SerDes（串行器/解串器），本質上，我們打造了世界上第一臺機架級計算機。它就是Grace Blackwell NVLink72。與上一代相比，它的速度提升了 50 倍。僅僅兩年時間，我們將性能提升了50 倍。如果是摩爾定律，兩年只能提升 2 倍。所以，這項架構和洞察簡直堪稱完美，而解碼、推理、大語言模型和 Token 生成的爆發，恰好與 Grace Blackwell 的問世完美契合，一飛沖天。所以，Grace Blackwell 是又一個不可思議的劃時代產品。

現在問題來了，Vera Rubin 架構又是怎么回事？它背后的核心理念是什么？核心理念是，AI 的目標不僅僅是“思考”，更是“執行任務”。所以 Vera Rubin 是為智能體（Agents）量身定制的。

那么，智能體的計算模式和處理模式是怎樣的？顯然，智能體需要加載大量的內存。它有工作記憶（短期記憶），而長期記憶我們存放在存儲設備中。這個存儲設備必須能夠與 GPU 直接通信。你不能通過網絡把數據拷來拷去，你希望存儲設備直接接入處理器。所以我們設計了直接連接到架構總線上的存儲。同時，我們要使用大量的工具，所以CPU變得至關重要。

但是，當前這一代 CPU 主要是為云計算設計的，動輒擁有數百個核心，比如 200 個核。然而，在智能體的應用場景中，由于 AI 是一個價值數十億美元的龐大系統，當它發出指令去調用某個工具時，那個工具是在 CPU 上運行的。此時，這臺價值連城的 GPU 超級計算機，就得干等著這顆 CPU。因此，對于智能體來說，CPU 極其需要超低的延遲。所以我們設計了 Vera，對于當前單線程、多核單線程的代碼來說，它是目前性能最強悍的，我們專門為此打造了這款 CPU。

你會發現，用直覺解決這些問題的方法，就是去思考未來的計算模式究竟是怎樣的。它與過去有何不同？你必須在腦海中建立一個心智模型，然后設計出一個能夠完美運行這種模式的系統。現在，智能體時代已經到來。我們將讓它們在 Vera Rubin 上奔跑。

至于 Feynman 架構，當它問世時，我希望它能應對這樣的場景：就像所有的軟件一樣，今天我們稱之為智能體，過去可能叫模塊或子模塊。未來，你肯定會看到由智能體組成的龐大系統，智能體手下還有子智能體，子智能體下面還有更小的智能體。你會面對一個“智能體集群”（swarm of agents），那么這種形態會催生出什么樣的計算機呢？這很可能就是 Feynman 架構所要解決的命題。

主持人：關于這一點我還有一個追問。你一直以來非常擅長的一點，就是能提前一代預判瓶頸，并預先給出解決方案。比如一年前的供應鏈問題，光子學最終成了一個巨大的解法。當我們把目光投向能源瓶頸時——老實說，銅線本身就已經成了傳輸的瓶頸之一。在你看來，這個問題將如何解決？畢竟能源危機無處不在。

黃仁勛：首先，我們得做自己力所能及的事。就像生活中的一切一樣，無論面臨什么問題，無論外部環境有多少擔憂，你都應該優先解決那些在你掌控之中的事。而在我們掌控之中的，就是提升能源效率。如果你看“每瓦特 Token 數”，我們已經將其提升了 50 倍，接下來我們還得繼續以顯著的倍數提升它，這種提升是會產生復利效應的。這是我們能做的第一件事。我們可以通過協同設計、架構創新等手段來掌控這一點。

我們能做的第二件事，也是我們可以去啟發他人的事，就是通過大量的市場教育，激勵整個生態系統為此做好準備。在過去的五年里，我一直在努力幫助人們理解未來可能需要的算力規模。剛才我也向大家推演了我是如何評估未來能源需求的。未來計算所需的能源總量，很可能是我們現有總量的 1000 倍，這是一個極其龐大的數字。

然而，換個角度想：未來的計算機將具備兩個特征。第一，它是生成式的，因為它具備智能，能感知上下文環境；第二，它是持續運行的。這種“持續運行的生成式計算”，與過去那種“只有在被使用時才啟動的、基于檢索的預錄制計算”相比，所需的能源該如何估算？

所以，如果你說我們需要 1000 倍的能源，哪怕最后發現我們低估了幾個數量級，我也不會感到驚訝。我們需要海量的算力，我們需要海量的能源，所以你必須去向人們解釋這一切。你必須用一種符合常識、肉眼可見的方式去解釋。其實一路上有很多跡象表明，這一切正在發生。就像我剛才為你們拆解邏輯一樣，我是在進行推理，好讓你們覺得這順理成章。

所以，能源需求確實極高。最后是能源的來源問題。能源的來源多種多樣。不幸的是，由于過去人們對可持續能源成本的過度擔憂，導致我們在這一領域的投資嚴重不足。但現在，正是人類歷史上投資可持續能源的最佳時機。原因在于，市場驅動力已經變得空前強大。在過去，你需要政府補貼才能去建太陽能農場，需要政府補貼才能去建核電站。但現在，市場會心甘情愿地為你買單。當下的市場力量極其洶涌。這是我們升級陳舊電網、全面引入各類可持續能源的絕佳契機。

不要僅僅追求快樂，也要去主動擁抱痛苦和煎熬

主持人：在教育方面，這也是一個絕佳的時機。我了解到的一點是，我們最初是為斯坦福的學生設計這門課的，但結果發現，有大量其他人在觀看，尤其是許多投資者和資本方。所以，如果你有什么想對這個群體傳達的，請暢所欲言。畢竟，對著資本方把同樣的話說上無數遍，有時候確實挺乏味的。

黃仁勛：我倒不介意這個。

主持人：所以，如果你想傳達什么，請隨意。我們來看下一個問題是什么？這個問題是：在接下來的幾年里，大家應該如何最有效地分配自己的腦力？

黃仁勛：首先，我想回應一下關于“痛苦與煎熬”的那番話。有一種建議是，你應該選擇你熱愛的、讓你充滿激情的事物作為你的事業。我認為這聽起來很棒。如果你碰巧知道自己的激情所在，知道自己熱愛什么，那當然好。但我認為，有很多人其實并不知道自己的激情在哪里，也不知道自己熱愛什么。這很正常，因為沒人能全知全能。你怎么可能知道你尚未認知的事物呢？所以，從很多層面來說，那種認為“你只能選擇讓你充滿激情、讓你快樂的職業”的觀點，門檻實在太高了。

原因在于，無論你決定以什么為生，無論你是否找到了所謂的激情，這就是你的工作。就拿我來說，我以前的工作是洗廁所和清理餐桌。那就是我的工作，而在我的工作里，我會拼盡全力做到最好。無論你交給我什么任務，我都會傾盡所能。直到今天，我依然如此。

外界有一種誤解，認為當 CEO 的人一定熱愛自己的工作。有些 CEO 可能會說：“哦，我充滿激情，我熱愛我的工作。” 他們是在撒謊。沒有哪個 CEO 敢說，自己從早晨睜眼到晚上睡覺，每一分鐘都樂在其中。

事實是，我真正熱愛的工作內容只占 10%，剩下的 90% 都非常艱難，但我依然會拼盡全力去完成，甚至是“熬”過去的。我真的是在煎熬中度過的。我當然更愿意去做那 10% 讓我開心的事。但那 10% 的事情，總量就只有那么多。每家公司都面臨著堆積如山、各種各樣的難題。在人生的旅途中，你也會遇到無數不同類型的麻煩，你必須學會磨礪自己，無論多么艱難，都要渴望達到一個更好的狀態。為了變得更好，不懼艱難。你把這叫什么？這就叫煎熬。你雖然不喜歡，但你依然傾盡全力去面對。

我認為，當你經歷煎熬，當你從掙扎中獲益，并且你經受了無數次這樣的考驗后，它會賦予你韌性（resilience）。當那一刻到來，當世界、你的家人、你的公司或你的同事需要你變得堅強，需要你展現韌性，需要你咬緊牙關挺過去的時候，如果你沒有經歷過無數次的錘煉，你是不會具備這種品格和肌肉記憶的。所以我建議，不要僅僅去追求快樂，也要去主動擁抱一些痛苦和煎熬，因為總有一天你會需要這種力量。

把英偉達的 GPU 和原子彈相提并論，毫無邏輯可言

主持人：我們看下一個問題。這些都是最重要的問題。同意。是的，這個問題是關于你對其他競爭對手國家獲取英偉達芯片的看法。

黃仁勛：首先，你知道我們是靠什么謀生的嗎？我們制造 GPU。GPU 被用來玩電子游戲，被用來調度醬油配送，被用于醫療成像。如果你昨天剛做了 CT 掃描，放心，那背后就有英偉達的技術。世界上每一臺醫療成像系統里都有英偉達。所以問題是，你到底制造的是什么？

我從根本上反對、并且認為毫無邏輯可言的一點，就是在這個時代，把英偉達的 GPU 和原子彈相提并論。全球有十億人在使用英偉達的 GPU。我向你們所有人推薦英偉達 GPU，我向我的家人、孩子、我愛的人推薦英偉達 GPU。但我絕不會向任何人推銷原子彈。所以，這種類比極其愚蠢。如果你從這個荒謬的預設出發，你就無法理清后續的邏輯。

第二個我認為極其荒謬的觀點是：為什么美國公司要去其他國家競爭？“反正你遲早會輸掉那個市場，那為什么還要去？” 如果你們都信奉這種哲學，那你每天早上干嘛還要起床？我不信奉“反正遲早會輸”這一套。我絕不認同。如果你想讓我輸，你得在戰場上真刀真槍地打敗我。這些年來，我打過無數場硬仗，我活得挺好。

如你所知，競爭服務于市場，競爭能讓你的公司變得更強大。我一點也不害怕去市場上真刀真槍地競爭。但那種“反正會輸，索性不去競爭”的想法，對我來說毫無邏輯。

最后，那種認為我們應該剝奪某些國家使用通用計算能力的觀點，同樣站不住腳。我們現在都承認英偉達是一家通用計算公司，我剛才列舉了一大堆通用場景。為了讓一兩家公司受益，而去剝奪其他人使用通用計算的權利，這根本說不通。憑什么要讓整個行業做出犧牲，只為了讓那一兩家公司獲利？

美國科技產業是我們國家的瑰寶之一。你們未來都將成為其中的一員。如果我盡到了我的職責，當你們畢業時，你們將步入人類歷史上最強大、最鼎盛的計算機產業。但是，如果我們因為某些原因主動放棄，或者通過政策決定我們不能去銷售，從而將三分之二的市場拱手讓給其他公司，那么等你們畢業時，你們進入的將只是一個徒有其表的空殼產業。這種產業空心化的教訓我們已經見識過了。很久以前，同樣的論調扼殺了美國的電信產業。今天，美國已經沒有任何底層的電信技術了。它完全是被政策“趕出”我們國家的。

所以，必須有人站出來為此抗爭。有些邏輯體系聲稱 AI 將會降臨，將會迎來一個“奇點”時刻。當那個奇點降臨，它將成為世界上最強大的力量。它會像閃電一樣突然出現，我們不知道它會在周三還是周四的晚上 7 點到來，但只要它一出現，游戲就結束了。他們甚至說，這有一定概率會導致我們所知的社會徹底終結。拜托，我們都看過《沙丘》，沒必要在現實中重演一遍。

我認為，在公眾面前兜售他們的科幻幻想，當所有人都在關注并相信他們的話時，這是一種極不負責任的行為。這不是事實。所謂“我們完全不知道這些系統是如何運作的”，這不是事實。所謂“這項技術會在某一個納秒內突然變得無限強大并接管世界”，這也不是事實。所謂“我們毫無防御之力”，這同樣不是事實。這些全都是捏造出來的，而且不幸的是，這種捏造甚至傷害了在座的各位。你們是學計算機科學的，你們希望畢業時，人們依然看重計算機。我們希望創造一個對你們正在努力掌握的技術充滿樂觀的未來。我們希望創造那樣的未來。我們希望確保美國、確保所有人都能從 AI 中受益。所有人都應該擁有 AI。但沒有任何人應該擁有核彈。大家能同意這一點嗎？

所以，小伙子，謝謝你激起了我的表達欲。開個玩笑。我只是想把這些心里話說出來。

主持人：我的基調是理性樂觀派，堅信樂觀主義。不過，我要從另一個角度稍微反駁一下。我完全同意，用原子彈來做類比從第一性原理上就是錯的。但我們觀察到的現狀是，算力緊缺。我們美國的獨立團隊、初創公司、大學，他們根本拿不到算力。那么，從優先級的角度來看，在我們把這種稀缺資源運往海外之前，美國難道不應該享有優先獲取權嗎？

黃仁勛：絕對應該。但現實并非如此。絕對不是你說的這樣。

主持人：抓到把柄了吧。

黃仁勛：是啊。絕對應該，但也絕對不是你說的這樣。問題出在哪里？芯片多得是。伙計們，如果斯坦福的校長現在下訂單，我保證立刻發貨。我絕對說到做到。

主持人：大家聽到了吧。好吧，這可不是開玩笑的。我們在外面為了算力都快熬干了。不，不，這真不是開玩笑。這是一個非常嚴肅的問題。

黃仁勛：事實并非如此。所謂“人們給我下訂單，而我不給他們發貨”，這絕不是事實。前提是你得下單啊！事實是，根本問題完全出在另一個地方。

斯坦福需要算力，科學研究需要算力。但根本問題在于，現有的體制已經無法提供大規模的算力了。你想想看，斯坦福所有的研究部門，都分散在不同的院系里。你們各自去籌集資金，各自申請撥款。沒人愿意把自己的科研經費拿出來共享。但沒有任何一筆單獨的經費，足以支撐起一個龐大的計算集群——那種你平時可能只用一小部分時間，但一旦需要，就必須爆發出驚人算力的超級計算機。整個世界已經從那種集中式的計算環境，退化成了每個人都在用筆記本電腦單打獨斗的局面。這就是今天的計算環境。從根本上說，所有的大學，斯坦福也不例外，你們根本沒有幾十億美元的算力預算。這筆錢根本不存在。但這是誰的錯？是斯坦福自己的錯。

我之所以這么說，是因為我是在賦予你們解決問題的力量。當某件事是你的錯時，你就有能力去改變它。你同意嗎？如果我說：“哦，這不是你的錯，孩子。你是個失敗者，但這不怪你。” 或者我指著你說：“嘿，孩子，你是個白癡，但這不怪你。” 不，這絕對是你的錯。而當你承認這是你的錯時，你也就賦予了自己解決它的力量。不是嗎？你正在賦予自己解決問題的底氣。所以，你現在是在和一個堅信“我能掌控自己未來”的人對話。明白嗎？

如果我是斯坦福的決策者，你們必須找到一種方法，改變你們做預算的方式，改變你們對待計算資源的方式。你們必須想辦法把資源整合起來，為斯坦福建造一臺校園級的超級計算機，就像斯坦福過去建造直線加速器那樣，讓所有人都能共享。當然，你們也可以直接把這事外包給別人來做。這些都是可行的。但前提是，你必須拿得出 10 億美元。你需要有一筆合理的資金去建造這樣的基礎設施，因為這就是它的造價。這就是成事的代價。

主持人：我剛才查了一下，我們這里可是有 400 億美元的捐贈基金。如果是你接手，你會怎么使用這筆錢？

黃仁勛：我會立刻從中劃出 10 億美元，交給某個云服務商，讓這里的每一位學生和研究人員都能用上 AI 超級計算機。我會立刻這么做。當然，你得做好規劃。如果你想買 10 億美元的西紅柿，你不能跑到雜貨店，發現他們沒有 10 億美元的西紅柿，然后大喊：“啊哈！你故意不賣西紅柿給我！” 這太荒謬了。所以你必須提前規劃。你必須說：“明年我們需要價值 10 億美元的算力來支持斯坦福的科研，我們要把它建起來。”

技術固然重要，但戰略更是生死攸關

主持人：下一個問題：你工作中最棒和最糟糕的部分是什么？

黃仁勛：當你是一家公司的 CEO 時，你能享受到很多極其美妙的特權。比如，你真正成為了那個將愿景、戰略和執行力交匯融合的人。你需要生活在那個交匯點上。當你擁有一家實力雄厚的公司，并且我身邊圍繞著極其出色的計算機科學家——其中很多就來自斯坦福——當你身處這樣的團隊中時，你的愿景是非常容易落地的。正因為你身邊都是牛人，你的愿景也會變得更加宏大、更有野心。這就是最棒的部分。

這個最棒的部分，我幾乎每天都在享受。我一直在不斷更新對未來的認知和愿景，思考我們在其中的角色，以及我們應該如何重塑自我，以便為那個未來做出更多貢獻，或者干脆由我們去創造那個未來。作為 CEO，你有幸生活在這樣一個充滿想象力、極具戰略性、高度復雜且沒有標準答案的世界里。從很多方面來說，這是創造力的極致體現。

另一方面，伴隨這種權力而來的，是對那些與你同乘一艘飛船、同舟共濟的人的沉重責任。他們加入你的團隊，想要幫你實現這個愿景，他們是你團隊的一部分，你對他們的福祉負有深深的責任感。所以，當公司境況不佳時——比如在早年間，我們還在摸索前行的時候，公司可能經歷了四五次瀕臨破產的絕境。我是說真的，差點就灰飛煙滅了，我們只能靠著最后一口氣吊著，或者徹底被打趴下。在那些至暗時刻，你會感到尷尬、屈辱、艱難。你不知道出路在哪里。你常常身處黑暗之中，你感到恐懼。作為人類，我們所有的負面情緒，在那個位置上都會被放大一千倍、一百萬倍。

作為上市公司的 CEO，你始終暴露在聚光燈下。公司順風順水時，皆大歡喜；一旦遇到挫折，鋪天蓋地的指責就會接踵而至。所以，這是一份極度缺乏安全感、極度脆弱的職業。

主持人：下一個問題是，在英偉達的早期階段，你犯過的最大錯誤是什么？你從中學到了什么？

黃仁勛：讓我給你舉一個別人可能會認為是錯誤的例子，但我會告訴你那其實不是。任何了解我們歷史的人都知道，我們第一代產品的架構和所使用的技術，完全走錯了方向。不是錯了一點點，是錯得離譜。一群聰明的工程師和專業人士，拿著融來的錢，造出了一個東西，然后說：“來看看這個”，結果根本跑不起來。我們用曲面代替三角形，放棄了 Z-buffer（深度緩沖），用正向紋理映射取代了逆向紋理映射。我們把每一件事都做錯了。全錯了。里面連浮點運算都沒有。錯得徹頭徹尾。

所以，我們在技術上做出了大量極其糟糕的選擇。我承認那是純粹的技術失誤，但它卻逼出了極其天才的戰略舉措。你如何帶領一家名聲掃地、浪費了大量資金和兩年半時間走彎路、被競爭對手四面楚歌的公司，最終成為今天唯一的幸存者？

那次轉型教會了我很多。技術固然重要，但戰略更是生死攸關。你如何看待世界？如何應對競爭？如何切入市場？如何保存和調配資源？在 30 多歲時，正是通過那次慘痛的失敗，通過公司幾乎灰飛煙滅的絕境，我學到了極其深刻的戰略思維、競爭策略和輾轉騰挪的技巧，這些經驗讓我受用至今。

如果說我犯過什么真正意義上、純粹的戰略錯誤，那就是當 PC 或移動設備開始騰飛時，一些在移動領域舉足輕重的巨頭找到我們，希望我們在移動設備上合作。當時我做出的選擇……現在回想起來，當他們找上門時，我本該回答：“不了，沒興趣。” 但我們卻決定轉移大量資源去研發移動設備芯片。我以為我們能提供巨大的價值。但如果我當時能再往深處多想兩層，就會發現，就我們擅長的領域而言，我們在那個市場能提供的真正價值，充其量只是邊緣化的。

所以我調轉船頭，帶領公司殺入移動設備市場。我們把它做成了一項價值 10 億美元的業務，這給了我們一種正向反饋的錯覺。但緊接著，在 3G 向 4G 過渡的時期，我們被徹底封殺了。高通是 3G 到 4G 調制解調器（基帶芯片）的絕對霸主，而那才是手機中最核心的部件。不是 SoC（系統級芯片），不是計算機圖形處理，甚至不是應用處理器。調制解調器才是手機的命脈。所以在那次技術迭代中，他們輕而易舉地把我們踢出了局。我本該預見到這一點的。如果重來一次，我會說：“是的，這在頭幾年可能是一個非常誘人的機會，但之后我們就會被掃地出門，那還有什么意義？不如把資源留給其他領域。”

不過，我們還是挺過來了。被踢出局后，那個 10 億美元的業務瞬間歸零。但我的補救措施是，我把我們在移動端積累的所有技術——那些關于極低功耗和極致能效的專業知識——全部轉移到了一個當時還不存在的應用領域：機器人。剛才有人提到了 Thor 芯片。Thor 其實是我們當年在移動設備上使用的那款芯片的曾曾曾孫。那一整條技術血脈、所有的團隊，以及我們積累的專業知識，對我們走到今天起到了至關重要的作用。但這不是為錯誤開脫。最初進入那個市場本身就是浪費時間，所以我認為那是一個巨大的戰略失誤。

主持人：談到戰略，有時候戰略就是要有足夠精準的預判。從系統設計的角度來看，你認為你更新了哪些先驗認知？或者說，你建立了一套怎樣的預測機制，讓你能在這種充滿戰爭迷霧、未來走向并不完全清晰的情況下，依然保持自信，覺得“雖然看不清全貌，但大方向是沒錯的”？對于那些在未來形態還不明朗時，依然需要做系統設計的從業者，你有什么建議嗎？

黃仁勛：是的，其實你剛才已經用到了所有正確的詞匯。我做的第一件事就是問自己：我觀察到了什么？基于我觀察到的現象，讓我們將其拆解回第一性原理。把它徹底拆解，然后問自己：接下來會發生什么？首先要問，這是一件大事嗎？比如深度學習、計算機視覺、AlexNet，這是大事嗎？它之所以是大事，是因為老天啊，這里有兩個工程師（Alex 和 Ilya），當然還有 Hinton，他們搞出了一個神經網絡模型，然后“轟”的一聲，一舉粉碎了在此之前幾十年來所有計算機科學家在計算機視覺領域取得的成果。所以，這是一件大事嗎？這種質量和性能的躍升，絕對是件驚天動地的大事。

接下來的問題是：那么接下來會發生什么？你能把它推向多遠？如果能用這種方式解決視覺問題，那還能解決什么問題？如果它能解決這些極其驚艷的難題，這對計算機和計算本身意味著什么？你就是這樣不斷地問自己這些問題，一路推導回第一性原理。然后基于此，你在腦海中構建出一個關于計算未來的心智模型：它將走向何方？它能做什么？比如，自動駕駛汽車和機器人。模型會變得多大？如果模型變得極其龐大，計算機又該長什么樣？處理神經網絡與處理浮點數、整數以及基于第一性原理的數學運算有何不同？過去我們習慣用 FP64、FP32 來表達一切，但顯然，神經網絡根本不需要這樣做。

所以，你就像這樣一步步推導，構建出一個關于未來的心智模型，并明確你的公司、你自己在其中的位置，然后從那個未來倒推回來。當然，問題是你可能會錯。通常情況下，如果你能正確地進行邏輯推演，你不會錯得太離譜，但也不可能全對。所以我傾向于非常坦然地說：好吧，這些是極有可能發生的事，這些是絕對會發生的事，而這些是可能會發生的事。基于這些判斷，我認為我們必須朝著那個大方向前進。我們會在前行的過程中摸著石頭過河。

而在建立公司、并在這一過程中取得成功的核心技巧在于：你朝著這個方向前進，是需要消耗能量、時間與金錢的。而你消耗在上面的每一分時間、能量和金錢，都意味著你放棄了做其他事情的機會。所以，執行一項戰略的機會成本，才是真正高昂的代價。你必須問自己：你該如何變得足夠聰明，使得這種機會成本降到最低，同時讓你的可選項（optionality）最大化？你需要時刻思考所有這些問題。這沒有簡單的答案，但在很多方面，你其實是在努力讓這段旅程本身就能“自給自足”。

主持人：大家馬上就要沖上來找你要簽名了。我們的對話就到這里結束。謝謝。非常感謝。

加入 AMD AI 開發者計劃，免費領 50 小時云算力券

進入官方群月月抽顯卡、AIPC，好運不停！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.