網易首頁 > 網易號 > 正文申請入駐

“如果你不用更多Token，就永遠逃不出底層”：AI競賽開始變成資源戰爭

2026-05-01 10:18:20　來源: InfoQ

北京舉報

分享至

整理｜冬梅

如果把過去兩年的 AI 敘事拆開來看，一個趨勢已經越來越清晰：真正的瓶頸，正在從“模型能力”轉向“資源分配”。

一邊是推理成本持續下降、調用門檻幾乎被抹平，另一邊卻是算力、帶寬乃至組織內部認知結構的全面緊張——供給看似在爆炸，約束卻變得更加隱性而復雜。

也正是在這種“表面過剩、內里稀缺”的張力之下，越來越多一線從業者開始重新審視一個問題：AI 到底在重塑什么，又在抬高什么。

在這樣的背景中，一些來自實踐一線的信號，比任何宏觀判斷都更具解釋力。

在一檔播客欄目中，SemiAnalysis 創始人 Dylan Patel 與主持人展開了一場對話，共同探討 AI 革命中爆發式的供需動態。Dylan 分享了其公司的 Token 開銷如何飆升至每年 700 萬美元，這徹底改變了他們的生產力，并凸顯了一個新時代的到來：在這個時代，執行的成本很低，但高質量的想法卻價值連城。

他們深入探討了 Anthropic 尖端模型（如 Opus 4.7 和 “Mythos”）的影響、半導體供應鏈中隱藏的瓶頸（包括內存、臺積電和 CPU），以及“幻影 GDP”這一經濟現象。最后，Dylan 對 AI 快速擴張帶來的社會影響分享了大膽預測，包括為什么大規模的反 AI 抗議活動可能就在眼前。

以下為完整訪談內容，經由 InfoQ 翻譯 & 整理：

1 Token 成本瘋漲，即將超過員工薪資

主持人：過去很長一段時間里，真正稀缺的是執行力——執行非常非常困難，而想法卻很廉價。但現在情況完全反過來了：想法變得廉價而且泛濫，執行卻變得極其容易。所以，真正有價值的，只剩下那些能夠證明自己“值得投入”的好想法。

你之前跟我講過一個很驚人的故事，說你們團隊今年在 AI token 使用上的變化非常劇烈。能不能再講一遍？這件事讓你對整個世界發生的變化有什么新的理解？

Dylan Patel：去年我們還覺得自己已經算是 AI 的重度用戶了。大家都在用 ChatGPT、用各種云服務，公司也基本是“誰需要什么訂閱就給什么訂閱”，整體開銷也就是幾萬美元量級。

但今年完全不一樣了。真正的轉折點大概是從 12 月底開始，隨著 Anthropic 的 Opus 模型發布。我們公司總裁 Doug 帶頭推動了一件事——讓非技術人員也開始用 AI 寫代碼。

一開始是工程師在用，但到了 1 月份，使用量開始爆發式增長，一路飆升。后來我們直接和 Anthropic 簽了企業協議。到你上次跟我聊的時候，我們的 AI 開銷年化大概是 500 萬美元，但現在已經漲到 700 萬美元了——而且那是上周的數據。

很多開銷其實來自“使用本身”。比如一些從來沒寫過代碼的人，現在也在用 Claude 寫代碼，有的人一天就能花掉幾千美元的 token。整體算下來，我們現在一年大概花 700 萬美元在 AI 上，而公司的薪資成本大概是 2500 萬美元。

也就是說，我們在 AI 上的支出已經超過了薪資的 25%。如果這個趨勢繼續下去，到今年年底甚至可能超過 100%。這聽起來確實有點可怕。

不過幸運的是，我們公司在快速增長，所以還不用在“雇人還是用 AI”之間做取舍。更現實的情況是：我們可以少招很多人，同時把錢投入 AI，然后增長得更快。

但我覺得，很快其他公司就會面對一個現實：如果一個人借助 AI 能完成原本 5 到 15 個人的工作，那企業就會開始考慮裁員。

主持人：你能不能舉一些具體的例子？這些投入到底帶來了什么樣的變化？

Dylan Patel：有一個特別典型的例子。我們在俄勒岡州建了一個芯片逆向工程實驗室，已經投入了一年半。里面有各種高端設備，比如掃描電子顯微鏡。我們會拆解芯片，分析它的結構和材料，這些數據是我們賣給客戶的核心產品。

但這個分析過程本來是非常慢的。

現在，一個團隊成員用幾千美元的 token，做了一個 GPU 加速的應用，部署在 CoreWeave 的服務器上。現在只要上傳一張芯片圖片，這個系統就能自動識別出不同材料——比如哪里是銅、哪里是鉭、哪里是鍺、哪里是鈷——并完成整個結構的有限元分析，還帶可視化界面。

這個人之前在英特爾工作過，他說：這在以前是一個完整團隊的工作，而且還需要長期維護。但現在，一個人就做出來了。把這種效率放大到整個公司層面，影響是非常夸張的。

還有一個我特別喜歡的例子。我們有個同事 Malcolm，他之前是大型銀行的經濟學家。那種機構的經濟學團隊通常有一兩百人。

他一個人，用 AI 做了一件非常瘋狂的事：他把 FRED 數據、就業報告等各種經濟數據，通過 API 全部接入，然后開始跑回歸分析，研究不同經濟變量對通脹和通縮的影響。

更夸張的是，他還分析了美國勞工統計局（BLS）的 2000 項任務，判斷哪些可以被 AI 完成，哪些不行，并建立了一套評估體系。目前大概只有 3% 的任務是 AI 可以完成的。

基于這些，他提出了一個概念，叫“幻影 GDP”（Phantom GDP）：AI 會讓產出增加，但由于成本下降得更快，理論上 GDP 反而可能下降。

他還順手做了一整套語言模型評估體系，包含 2000 個評測任務。這些，全都是他一個人完成的。他自己也說，這在以前需要一個 200 人的團隊干一年。

主持人：那作為公司經營者，你怎么看這種支出從接近 0 一路漲到 25%，甚至可能更高？你有沒有想過什么時候該“踩剎車”？比如不用最頂級的模型，換便宜一點的？

Dylan Patel：從本質上講，我們是在做信息生意——賣分析、做咨詢、提供數據集。如果我不持續提升產品質量，這些東西很快就會被商品化（commoditized）。

比如我們最早做的數據產品，現在已經有很多人開始做類似的了。如果我們停在原地，很快就會失去競爭力。

AI 的確會讓很多東西變成“商品”，就像它對軟件行業做的那樣。但關鍵在于：誰能更快迭代、誰能持續提升服務質量、誰能掌握客戶，誰就能增長。

那些不行動的“既得利益者”，一定會輸。所以這其實是一個生存問題：如果我不用 AI，別人會用，然后打敗我。

再舉一個能源領域的例子。

我們之前有幾位分析師，花了一年時間想做一個能源模型，但一直沒做出來。能源數據服務市場大概有 9 億美元規模，是一個很大的機會。

后來，我們有個負責數據中心能源業務的同事 Jeremy，“AI 上頭”了。他連續幾周每天花大概 6000 美元的 token。

在短短 3 周內，他做了這些事：抓取了美國所有發電廠、所有高壓輸電線路的數據，構建了整個美國電網的映射，還整合了大量需求側數據。

最后做出了一個可視化系統，可以看到美國各個區域的電力供需情況。我們拿去給一些做能源交易的客戶看，他們的反應是：“這東西你們做了多久？太強了，比某某公司還好。”

而那家公司，有 100 人團隊，做了 10 年。當然，我們的系統還不夠完善，但在某些方面已經更強了。

主持人：聽起來，你描述的不只是效率提升，而是整個生產函數都被改寫了。

Dylan Patel：完全是這樣。現在的問題已經不是“能不能做”，而是“這個想法值不值得做”。因為執行成本已經低到幾乎可以忽略不計了。

從你的角度來看，本質上你是在“商品化”這些能源數據服務公司。如果你不加快速度，那誰會來商品化你？所以問題就變成：作為一個企業經營者，你確實在大筆花錢，但這些投入到底帶來了什么？是否真的帶來了更多收入？

Dylan Patel：是的，確實帶來了更多收入。

主持人：那你有沒有擔心過一個極限情況：那些掌握資本、負責投資的人——他們本來就是你的客戶——會不會有一天說，“我們自己也有很聰明的分析師，那我們干脆自己做，不再買你的服務了”？如果一切變得這么容易，最終會不會所有能力都內收進這些投資機構內部？

Dylan Patel：首先，任何信息服務業務都有一個基本邏輯：我從信息中創造的價值，永遠小于我的客戶從中獲得的價值。

舉個簡單的例子，如果我以 1 美元賣給你一條信息，你之所以愿意買，是因為這條信息能幫你賺超過 1 美元。所以，本質上你從我這里“套利”了，你賺得比我多。

像一些頂級投資機構，比如 Jane Street、Citadel，它們內部本來就有非常強的數據和研究能力。但即便如此，它們仍然會持續購買我們的數據，而且合作規模還在擴大。

原因很簡單：我們有某種“優勢因子”。我們更快、更靈活，是一個小團隊，專注在一個非常具體的方向——AI 基礎設施、token 經濟，以及這場技術革命的演進路徑。

我們對趨勢的判斷更前置，執行速度更快，產品迭代也更快。

當然，投資機構也會嘗試自己構建一部分能力，但更多時候，他們會發現：直接買我們的數據更便宜。因為他們可以在我們的數據之上再做自己的分析，而不是從零開始構建整套體系。

不過，確實會有一部分人嘗試自建，這是不可避免的。

2 Token 需求暴漲，但供給跟不上

主持人：我感覺每次跟你聊天，最后都會回到一個核心問題：token 的供需關系。這似乎是現在整個世界最關鍵的變量。從你親身經歷的這些變化來看，你對“需求側”的判斷有沒有發生變化？

Dylan Patel：變化非常大。

如果我們從宏觀角度看，比如 Anthropic，它的收入從大約 90 億美元增長到現在的 350 億到 400 億美元年化水平——等這期播客播出時，可能已經到 400 億到 450 億美元了。

但關鍵是：它的算力并沒有按同樣比例增長。

如果你做一個簡單的推算，并假設它沒有減少研發算力（而事實上它不可能減少，因為它還在發布像 “Mythos” 和 Opus 4.7 這樣的模型），那么可以得出一個結論：即使把所有新增算力都用于推理（inference），它的毛利率底線也在 72% 左右。

而現實情況是，一部分新增算力還投入到了研發中，所以真實毛利率可能更高。

要知道，在今年年初，有人泄露過他們融資文件中的數據，當時的毛利率只有 30% 多。這意味著什么？意味著 token 的需求增長速度，遠遠超過了供給增長。整個系統正在被需求側“拉爆”。

主持人：也就是說，你看到的是一個需求遠超預期、而供給跟不上的市場？

Dylan Patel：沒錯，而且這種失衡還在加劇。從我自己的公司就能感受到：一旦你真正把 AI 深度嵌入工作流，token 消耗會呈指數級增長。而且這種增長，不是“可選項”，而是“競爭所必需”。

這才是最關鍵的變化。

主持人：像這樣的公司，利潤率是怎么能做到這么高的？這聽起來幾乎不現實。

Dylan Patel：本質原因很簡單：需求太強了。

現在真正重要的，不是你用不用這些模型，而是你有沒有“訪問權”。比如，你有沒有 Anthropic 的客戶經理？有沒有企業級合同？能不能提高你的 rate limit（調用速率限制）？

因為 token 本身已經變成一種高度稀缺資源。誰能付得起錢，誰就能用到更多。

這其實不是問題，而是資本主義的自然結果。Anthropic 現在一年大概有 400 億美元的 token 收入，但關鍵是——這些 token 為客戶創造的價值，遠遠超過 400 億美元。

不同企業，每個 token 能創造的價值不同。但隨著模型越來越智能，真正重要的是：你是否能獲取這些“最聰明的 token”，以及你如何使用它們。

最終，決定勝負的不是模型本身，而是人——你能不能把這些 token 用在最有價值的地方。

因為會有很多人使用 token，但并不是所有人都在創造價值。比如一些做 SaaS 的初創公司，用 Claude 生成代碼，但如果他們的產品本身不創造足夠價值，那他們很快就會被“擠出”市場——因為他們用不起這些 token。

3 “Mythos 強大到讓 Anthropic 不敢公開”

主持人：我今天剛好有個親身體驗：在飛機上我用模型的時候，被 rate limit 限制了。當我看到 4.7 發布后，我立刻就想用 4.7，甚至已經不想再用 4.6 了——盡管過去幾周我一直用得很開心。你會不會覺得，大家對“最新、最貴模型”的執念，有點出乎意料？

Dylan Patel：完全不意外。我最近一個很好笑的經歷是：我和朋友 Leopold，曾經“跪著求”一位 Anthropic 的聯合創始人，讓他給我們 Mythos 的訪問權限——盡管他一直假裝這個模型不存在。

但這恰恰說明了問題：大家都知道，更強的模型意味著更大的價值。

從目前流出的 benchmark 來看，Mythos 可能是過去兩年里模型能力最大的一次躍遷。這一點非常關鍵。甚至可以說，它強到讓 Anthropic 不敢完全公開發布。雖然他們已經給部分客戶定了價格——大概是當前 token 成本的 5 到 10 倍——但他們仍然在猶豫，因為擔心它對世界的影響。

現在對外發布的 Opus 4.7，其實是一個“刻意削弱”的版本，尤其是在某些敏感能力上。所以我的建議很直接：如果你有足夠的資金，就應該盡早簽一個 Anthropic 的企業級合同，按 token 付費，而不是用普通訂閱。這樣你才能避免被 rate limit 卡住。

然后，你必須解決一個核心問題：如何把這些 token 用在“最值錢”的任務上，并且從中賺錢。

從某種意義上講，一兩年之后，很多公司的本質，可能就是在“做 token 套利”：token 本身很強大，但關鍵在于你把它“指向哪里”。

再往后走三到四年，甚至連這個問題都不需要人來決定——模型自己就會知道，應該把算力用在哪些地方，來創造最大價值。

主持人：聽起來像是一個完全不同的經濟體系。

Dylan Patel：其實我們已經能從歷史中看到這個趨勢。

隨便選一個能力基準來看：過去達到某個能力水平，可能需要非常高的成本；現在，成本可能已經降到原來的 1/100，甚至 1/1000。

比如一些新模型，在達到類似 GPT-4 能力時，成本已經下降了幾個數量級。但有趣的是——沒人真的在乎這些“舊一代能力”變便宜了。大家真正想要的，是最前沿的模型。因為只有前沿模型，才能創造真正有經濟價值的東西。

Dylan Patel：所以，驅動需求的，從來不是“成本下降”，而是“能力上限的提升”。

一年之后，今天的 Opus 4.6 或 4.7，可能成本只剩下現在的 1/100——比如我現在 700 萬美元的開銷，可能只需要 7 萬美元。

但這不重要。

因為到那時候，我用的會是更強大得多的模型，能做更多、更復雜、更有價值的事情。

主持人：雖然 Mythos 這個模型單個 token 更貴，但因為它完成任務所需的 token 數量更少，所以在很多任務上反而比 Opus 4.6 更便宜，對吧？

Dylan Patel：沒錯。本質上是“單位 token 更聰明”。雖然單價更高，但效率提升太明顯了，所以整體成本反而下降。

主持人：我記得上次見你的時候，Mythos 剛出來，你說這個模型好到讓你有點“害怕”。你當時是什么意思？

Dylan Patel：Anthropic 在 2024 到 2025 年的一個核心目標，是讓模型達到“L4 軟件工程師”的水平——也就是一個比較初級但已經能獨立工作的工程師。

基本上，他們用 Opus 4.6 做到了這一點。

但他們沒明說的是：如果你看 Mythos 的 benchmark，它更接近“L6 工程師”——也就是一個經驗相當豐富的高級工程師。更夸張的是，這個能力躍遷只用了兩個月時間。他們內部大概在 2 月就已經有這個模型了。

所以問題就來了：接下來會發生什么？模型進步不僅沒有放緩，反而在加速。無論是 Anthropic 還是 OpenAI，模型發布節奏都在明顯壓縮。

原因其實很清楚：要做出更強的模型，需要三樣東西——算力、研究人員、以及“實現能力”。

算力很貴，而且短期內基本是“鎖定”的；頂級研究人員也極其稀缺，薪酬動輒上千萬美元。但“實現能力”（implementation）這件事，過去一直是瓶頸，現在卻被 AI 極大地降低了門檻。

以前你有一個好想法，但實現它很難；現在你有想法，實現變得很容易——雖然仍然需要花錢，但技術門檻已經大幅下降。

主持人：這會帶來什么變化？

Dylan Patel：這會徹底改變“創新的節奏”。因為實現變容易了，你可以同時嘗試更多想法，然后快速迭代。無論是在做模型研發，還是在做應用——都一樣。

比如過去模型可能 6 個月發布一次，現在可能 2 個月就發布一次。再比如，你想建一個美國電網的供需模型——以前很難，現在也可以快速做出來。

問題變成了：你有那么多想法，但哪些想法值得投入 token 成本去實現？

這其實是一個核心轉變：過去，想法廉價，執行昂貴；現在，想法廉價且泛濫，執行變得便宜而容易。

所以，真正有價值的，只剩下“好想法”——那些能夠證明自己值得被執行的想法。

主持人：那你說的“害怕”，更多是技術不確定性，還是別的？

Dylan Patel：不確定性肯定存在，但確實也帶來了一種更深層的擔憂——社會層面的。

我們正在進入一個世界：“你能不能執行”不再重要，真正重要的是——你能不能選對要做的事情。你的價值，變成了三件事：

1）選擇正確的問題讓 AI 去解決

2）把 AI 的產出轉化為產品或價值

3）獲取資源（資本、算力、token）來放大這一切

這也解釋了為什么“最新模型的訪問權”變得如此關鍵。

誰能用到最先進的模型？不再是所有人。

Anthropic 已經在做選擇性開放，比如 Mythos 只提供給少數客戶（目前主要用于網絡安全場景）。未來這種趨勢只會加強——模型不會全面開放，而是越來越“定向分發”。原因很現實：AI 太貴了。誰來為萬億美元級別的基礎設施買單？一定是那些能用 AI 賺到錢的公司。同時，模型公司也不希望被“蒸餾”或復制，所以不會大規模開放最先進能力。

主持人：這聽起來像是資源會越來越集中。是這樣嗎？

Dylan Patel：是的，這正是我在思考的問題：隨著 token 的價值越來越高，這些資源和由此產生的收益，會不會集中在越來越少的公司手里？

比如我現在還拿不到 Mythos，但一些頂級銀行已經在用了（雖然目前主要用于網絡安全）。未來可能會出現這樣一種情況：因為我有企業級合同、關系不錯，我能稍微更早拿到新模型，或者獲得更高的調用額度。我希望是這樣——因為這本身就會成為新的競爭優勢。

主持人：如果你的競爭對手拿不到這些最先進模型的訪問權，而你能拿到，那基本上你就可以直接碾壓他們，對吧？

Dylan Patel：完全可能。你可以想象一個極端但現實的場景：像 Ken Griffin 這樣的人——既有錢又有關系——直接去跟模型公司談一個協議，比如和 OpenAI 或 Anthropic 簽約，說“我每年先買 100 億美元的 token，你們的新模型優先給我用，等我用完第一批，其他人才可以用”。

如果這種事情發生，會怎樣？

那他在市場上基本就是“降維打擊”。這種優勢可以體現在很多領域：可能是網絡安全（Anthropic 目前就對這類場景高度敏感），也可能是信息服務（像我這樣的業務），本質上都是一樣的——誰先用上最強的模型，誰就能碾壓別人。

更關鍵的是：我們其實并不知道這些模型真正的能力邊界在哪里。

Anthropic 不知道，OpenAI 不知道，任何人都不知道。

真正去探索這些能力的，是“使用者”。是他們在不斷嘗試：這些 token 能用來做什么？能構建什么？

這件事本身，對人類生產力是極大的提升。但同時，也帶來一個問題：資源和能力，會不會越來越集中到少數人手里？這些都需要時間來回答。

4 具身智能將成 AI 領域新的需求爆發點

主持人：那如果把視角拉遠一點，比如機器人領域？現在機器人幾乎不消耗 token，但未來會不會成為一個新的需求爆發點？

Dylan Patel：我認為會，而且非常快。現在有一個概念叫“軟件奇點”（software-only singularity）——也就是說，AI 的爆發主要發生在軟件世界。但現實是，絕大多數經濟活動發生在物理世界。

所以，軟件奇點只是一個階段，而不是終點。一旦軟件變得極其容易構建，下一步自然就是：把這些能力擴展到物理世界，也就是機器人。

現在機器人難在哪里？主要難在控制系統——比如微控制器、執行器、復雜的動作控制。

而當前主流的機器人模型（比如 vision-language-action 模型）在數據效率上其實很低，沒法像語言模型那樣規模化。

但未來一定會出現新的路徑：類似于“大規模預訓練”的機器人模型，就像人類一樣，通過大量經驗學習，同時具備“樣本高效性”（few-shot learning）。

主持人：你覺得這個突破大概什么時候會發生？

Dylan Patel：我認為在未來 6 到 18 個月內，會出現真正有意義的突破。

比如你買一個機器人，只需要給它幾個示例，它就能學會任務：讓它疊衣服、搬東西、保持平衡，它都能很快掌握。到那個時候，機器人會變得高度專業化：可能會有專門擦黑板的機器人、疊衣服的機器人，甚至是一種“軟件包”——你下載一個模型，它就讓通用機器人具備某種能力。

這會帶來兩個結果：一是物理世界的生產效率大幅提升；二是通縮效應（deflation）進一步加強。同時，這也會讓 token 的需求繼續爆炸式增長。

我個人不認為 token 需求會放緩。

主持人：那回到模型本身，比如 Mythos，它的出現有沒有讓你對“規模法則”（scaling laws）有新的看法？

Dylan Patel：反而更確認了一點：規模法則仍然有效。Mythos 本質上是一個更大的模型——規模顯著提升。這說明一件事：投入更多算力，模型就會變得更強。

當然，不只是“堆算力”。整個過程中，還有大量“效率提升”——也就是說，達到同樣能力的成本在持續下降。你可以這樣理解：一方面，如果你不斷擴大規模，會得到能力的巨大躍遷；另一方面，如果你維持同樣能力水平，成本卻在指數級下降。

5 Anthropic 已經領先了？

主持人：那從競爭格局來看，現在是不是 Anthropic 已經領先了？

Dylan Patel：表面上看是這樣。他們在 2 月就有 Mythos，但甚至沒有完全發布，因為需求已經爆滿；現在又發布了 Opus 4.7。

很多人會說，那 OpenAI 是不是已經落后了？但事情沒那么簡單。Anthropic 的問題在于：算力受限。他們增長得很快，但擴張能力有限。

而 OpenAI 的策略完全不同——他們在算力上是“極端激進”的，大規模采購資源，從 Microsoft、Oracle，到 SoftBank，再到 Amazon 的 Trainium 芯片，全都在押注。

簡單說：Anthropic 更克制，但現在也開始意識到算力不夠；OpenAI 則是一開始就瘋狂堆算力，現在反而有更大的擴展空間。

還有一個容易被忽視的點：技術的擴散是有“時間滯后”的。

你我可能第一時間用上新模型，但大多數企業需要時間去學習、適應、重構流程。

所以即使不考慮模型繼續進步，僅僅是“現有能力的擴散”，到今年年底，一個類似 Opus 4.6 水平的模型，可能就能支撐起整個經濟體數百億美元的支出規模。

現在是 400 億美元，這個數字繼續增長，并不夸張。

主持人：所以你的意思是，現在的增長更像是“線性外推”，而不是指數增長？真正的指數級爆發，需要更強的模型？

Dylan Patel：沒錯。現在只是線性增長——真正的指數增長，取決于下一代模型能力的躍遷。

問題在于，Anthropic 可能沒有足夠的算力去推動那個躍遷。接下來更有可能是 OpenAI 或 Google 先達到那個層級。

一旦有人先做到，就算他們的毛利率只有 50%，而不是 70%+，他們依然會吃掉幾乎所有新增需求——而且很可能他們自己也沒有足夠算力去滿足全部用戶。

你可以想象一個極端情況：如果算力完全充足，像 Mythos 這樣的模型，理論上可以支撐 5000 億美元級別的收入。

但現實是，算力嚴重受限。

我們已經看到，比如 NVIDIA H100 的價格在飆升，而且這些 GPU 的“使用壽命”也在被不斷拉長。

這意味著什么？意味著不僅一線實驗室（Anthropic、OpenAI）會“供不應求”，連二線、三線實驗室也一樣——大家都會把 token 賣光。

本質上，現在出現了一個越來越大的“剪刀差”：模型所能創造的經濟價值，在飛速增長；但我們能提供的算力供給，增長得沒那么快。這個差距會持續擴大。

而結果就是：模型公司的利潤率會不斷上升——直到硬件供應鏈開始“反向收割”，提高自己的利潤。

主持人：聽起來你對需求側的判斷是：幾乎爆炸式增長，而且這種增長還在加速。

Dylan Patel：是的，而且我覺得很多人還低估了這一點。我有一個比較極端的說法：如果你不使用更多 token，你會被困在一個“永久底層”（permanent underclass）。

主持人：這個說法挺激進的，展開講講。

Dylan Patel：這里其實有三個層次的問題：

第一，你要不要用更多 token；

第二，你能不能用這些 token 創造經濟價值；

第三，你能不能把這些價值“抓在自己手里”。

很多人現在只做了第一步，甚至是以一種“偷懶”的方式——比如用 AI 把 8 小時工作壓縮到 1 小時。但那只是最低級的用法。

更高級的方式是：你仍然工作 8 小時，但產出變成原來的 8 倍，收入可能變成 5 倍。

這在傳統“打工模式”下不一定成立，但對于創業者、自由職業者、多項目操盤的人來說，這是完全可能的。

關鍵是：現在還不是“標配階段”（table stakes）。你還有窗口期，可以利用 AI 提前放大自己的產出。但一旦所有人都這么做，這種優勢就會消失。如果你在這個階段沒有做到這三件事——

用 token、創造價值、捕獲價值——那隨著模型能力繼續提升、資源進一步集中，你很可能會被甩在后面。

主持人：那我們聊聊供給側。為了支撐這種需求爆發，整個技術棧在發生什么變化？

Dylan Patel：一句話總結：整個供應鏈都在“漲價 + 延長周期 + 預付款”。

首先是 GPU。像 NVIDIA 的產品，不僅價格在上漲，而且使用壽命也在延長。

過去很多人說 GPU 用 5 年就淘汰，現在看完全不成立——很多 3-4 年前的集群還在續約使用，甚至可能用到 7-8 年。這意味著云廠商的真實利潤率，其實比表面看起來更高。

再往下看整個供應鏈：

硬件層：像 NVIDIA，毛利率依然非常高
內存：利潤率已經大幅上升
光學、邏輯芯片：通過“預付款”提升資本回報率
光刻機：ASML 已經完全賣空，還依賴 Carl Zeiss 擴產

甚至更底層，比如 PCB 所需的銅箔，也開始供不應求，需要提前鎖定產能。

你會看到一個非常一致的模式：整個鏈條上的每一個環節，要么已經售罄、在提價，要么在收預付款、提高資本效率。換句話說：只要是“有實體、有產能”的環節，現在都在被搶。這就是供給側的現實。

主持人：從歷史來看，需求爆發之后，供給通常會很快跟上，甚至出現過剩。但現在看起來，供給幾乎不可能追上。你覺得當前最關鍵的瓶頸在哪里？

Dylan Patel：問題在于：這一次的供應鏈，比以往任何時候都更復雜。而且我們正在構建的系統，本身復雜度也極高，這直接拉長了交付周期（lead time）。

過去某些行業也有 18 個月的交付周期，但“擴產”本身不需要幾年時間；而現在，即使你決定擴產，真正的新增供給也要等很久才會出現。

一個典型例子是內存。內存產能每年大概只能增長 20% 到 30%，這是物理極限。即使 2025 年底需求信號已經非常明確，廠商也開始擴產，但這些新增產能，真正落地可能要到 2027 年末甚至 2028 年。

這意味著什么？

意味著價格會持續上漲，而且還沒結束。尤其是 DRAM，很可能還會再翻倍甚至翻三倍。很多人覺得“內存瓶頸已經被充分討論了”，但實際上完全沒有。真正的緊缺才剛開始。而在市場機制下，唯一的調節方式就是——漲價，通過“需求破壞”（demand destruction）來重新分配資源。

主持人：那除了內存，邏輯芯片這邊呢？

Dylan Patel：邏輯芯片同樣面臨嚴重瓶頸。臺積電（TSMC）一直在提高資本開支（capex），今年大概在 500 多億美元，而且還在上調。

但問題是：建晶圓廠是需要時間的。

他們已經在盡可能壓榨現有產能，但短期內不可能大幅提升供給。而且他們目前的漲價策略其實相對“溫和”，只是個位數漲幅——不像內存那樣激進。

這就帶來一個問題：臺積電當然是優質公司，但它未必能“吃掉”整個價值鏈的最大收益。

真正被低估的，是更上游的設備和材料供應鏈。比如：

ASML：已經完全賣空
Lam Research、Applied Materials：需求持續爆發
更下游的供應商，比如 MKSI 等：同樣受益于“訂單外溢”

還有很多更細分的環節：銅箔、玻纖（PCB 材料）、激光器……這些都是“小而關鍵”的供應鏈，但現在全部處于極度緊張狀態。

如果臺積電在 2028 年真的做到 1000 億美元資本開支（這不是幻想，而是現實可能），那整個供應鏈會被“鞭子效應”（bullwhip effect）不斷放大沖擊。

換句話說：越往上游，波動越劇烈，瓶頸越嚴重。

主持人：那除了 GPU，這一波 AI 還有哪些被忽視的瓶頸？

Dylan Patel：CPU 是一個被嚴重低估的瓶頸。現在大家都在討論 GPU，但實際上 CPU 也已經“賣斷貨”了。

原因有兩個：第一，強化學習（reinforcement learning）。模型訓練現在不只是“喂數據”，而是要在環境中反復試錯、評估結果。這些“環境”——無論是簡單的文本校驗，還是復雜的 CAD 仿真——都是運行在 CPU 上的。

第二，推理后的執行層。模型生成的代碼、內容，并不會直接變成最終結果，而是要在各種應用環境中運行——這些環境，大量依賴 CPU。

換句話說：

GPU / ASIC：負責“思考”（模型推理）
CPU：負責“執行”（環境運行、應用落地）

隨著 AI 生成的內容越來越多，CPU 需求也在同步爆發。

主持人：那從你的角度來看，最難判斷的變量是什么？

Dylan Patel：不是供給，也不是成本，而是——“token 的經濟學”。我們其實很清楚：

訓練成本是多少
推理成本是多少
模型公司大概賺多少錢

但最難的是：這些 token 被用來做什么？創造了多少真實價值？這些價值如何在經濟中擴散？

比如我用 AI 提升了信息分析能力，然后把這些信息賣給客戶，價格還比以前更便宜。這會帶來什么結果？

客戶做出更好的投資決策
企業做出更優的競爭策略
整個經濟效率提升

但這些價值，并不會完整體現在 GDP 統計里。這就是我說的“幻影 GDP”（Phantom GDP）問題：真實創造的價值，遠遠大于統計數據所反映的。但我們現在還沒有一個很好的方法去衡量它。

6 少談未來，多講當下

主持人：最后一個問題。如果我們三個月后再聊，你覺得會發生什么？

Dylan Patel：我認為，會出現大規模的反 AI 抗議。

主持人：這么快？

Dylan Patel：是的。現在很多人其實是“反 AI”的，而且這種情緒在上升。隨著 AI 收入快速增長、企業結構發生變化，人們會開始把各種問題歸因于 AI。

再加上一些政治人物或社交媒體的推動，這種情緒很容易被放大。甚至已經有一些極端案例，比如針對 Sam Altman 的攻擊事件，網上還有人表示支持。

這只是開始。

主持人：那 AI 行業應該怎么應對？

Dylan Patel：我覺得有三個關鍵點：第一，溝通方式需要徹底改變。像 Sam Altman 和 Dario Amodei 的對外表達，其實并沒有很好地建立公眾信任；第二，多展示“正面價值”，讓普通人看到 AI 如何改善生活，而不是只談“顛覆世界”；第三，少談未來，多講當下，如果一直強調“AI 將改變一切”，只會加劇恐懼感。

現在的問題是，大多數人既不了解這些公司，也不了解這些技術。他們看到的，是一個“神秘的小圈子”，在打造一個可能改變世界、甚至取代人類工作的系統。

如果這種認知不改變，反彈是必然的。

https://www.youtube.com/watch?app=desktop&v=LF3aUIM57uw

聲明：本文為 InfoQ 整理，不代表平臺觀點，未經許可禁止轉載。

會議推薦

世界模型的下一個突破在哪？Agent 從 Demo 到工程化還差什么？安全與可信這道坎怎么過？研發體系不重構，還能撐多久？

AICon 上海站 2026，4 大核心專題等你來：世界模型與多模態智能突破、Agent 架構與工程化實踐、Agent 安全與可信治理、企業級研發體系重構。14 個專題全面開放征稿。

誠摯邀請你登臺分享實戰經驗。AICon 2026，期待與你同行。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.