<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      “如果你不用更多Token,就永遠逃不出底層”:AI競賽開始變成資源戰爭

      0
      分享至


      整理|冬梅

      如果把過去兩年的 AI 敘事拆開來看,一個趨勢已經越來越清晰:真正的瓶頸,正在從“模型能力”轉向“資源分配”。

      一邊是推理成本持續下降、調用門檻幾乎被抹平,另一邊卻是算力、帶寬乃至組織內部認知結構的全面緊張——供給看似在爆炸,約束卻變得更加隱性而復雜。

      也正是在這種“表面過剩、內里稀缺”的張力之下,越來越多一線從業者開始重新審視一個問題:AI 到底在重塑什么,又在抬高什么。

      在這樣的背景中,一些來自實踐一線的信號,比任何宏觀判斷都更具解釋力。

      在一檔播客欄目中,SemiAnalysis 創始人 Dylan Patel 與主持人展開了一場對話,共同探討 AI 革命中爆發式的供需動態。Dylan 分享了其公司的 Token 開銷如何飆升至每年 700 萬美元,這徹底改變了他們的生產力,并凸顯了一個新時代的到來:在這個時代,執行的成本很低,但高質量的想法卻價值連城。

      他們深入探討了 Anthropic 尖端模型(如 Opus 4.7 和 “Mythos”)的影響、半導體供應鏈中隱藏的瓶頸(包括內存、臺積電和 CPU),以及“幻影 GDP”這一經濟現象。最后,Dylan 對 AI 快速擴張帶來的社會影響分享了大膽預測,包括為什么大規模的反 AI 抗議活動可能就在眼前。


      以下為完整訪談內容,經由 InfoQ 翻譯 & 整理:

      1 Token 成本瘋漲,即將超過員工薪資

      主持人:過去很長一段時間里,真正稀缺的是執行力——執行非常非常困難,而想法卻很廉價。但現在情況完全反過來了:想法變得廉價而且泛濫,執行卻變得極其容易。所以,真正有價值的,只剩下那些能夠證明自己“值得投入”的好想法。

      你之前跟我講過一個很驚人的故事,說你們團隊今年在 AI token 使用上的變化非常劇烈。能不能再講一遍?這件事讓你對整個世界發生的變化有什么新的理解?

      Dylan Patel:去年我們還覺得自己已經算是 AI 的重度用戶了。大家都在用 ChatGPT、用各種云服務,公司也基本是“誰需要什么訂閱就給什么訂閱”,整體開銷也就是幾萬美元量級。

      但今年完全不一樣了。真正的轉折點大概是從 12 月底開始,隨著 Anthropic 的 Opus 模型發布。我們公司總裁 Doug 帶頭推動了一件事——讓非技術人員也開始用 AI 寫代碼。

      一開始是工程師在用,但到了 1 月份,使用量開始爆發式增長,一路飆升。后來我們直接和 Anthropic 簽了企業協議。到你上次跟我聊的時候,我們的 AI 開銷年化大概是 500 萬美元,但現在已經漲到 700 萬美元了——而且那是上周的數據。

      很多開銷其實來自“使用本身”。比如一些從來沒寫過代碼的人,現在也在用 Claude 寫代碼,有的人一天就能花掉幾千美元的 token。整體算下來,我們現在一年大概花 700 萬美元在 AI 上,而公司的薪資成本大概是 2500 萬美元。

      也就是說,我們在 AI 上的支出已經超過了薪資的 25%。如果這個趨勢繼續下去,到今年年底甚至可能超過 100%。這聽起來確實有點可怕。

      不過幸運的是,我們公司在快速增長,所以還不用在“雇人還是用 AI”之間做取舍。更現實的情況是:我們可以少招很多人,同時把錢投入 AI,然后增長得更快。

      但我覺得,很快其他公司就會面對一個現實:如果一個人借助 AI 能完成原本 5 到 15 個人的工作,那企業就會開始考慮裁員。

      主持人:你能不能舉一些具體的例子?這些投入到底帶來了什么樣的變化?

      Dylan Patel:有一個特別典型的例子。我們在俄勒岡州建了一個芯片逆向工程實驗室,已經投入了一年半。里面有各種高端設備,比如掃描電子顯微鏡。我們會拆解芯片,分析它的結構和材料,這些數據是我們賣給客戶的核心產品。

      但這個分析過程本來是非常慢的。

      現在,一個團隊成員用幾千美元的 token,做了一個 GPU 加速的應用,部署在 CoreWeave 的服務器上。現在只要上傳一張芯片圖片,這個系統就能自動識別出不同材料——比如哪里是銅、哪里是鉭、哪里是鍺、哪里是鈷——并完成整個結構的有限元分析,還帶可視化界面。

      這個人之前在英特爾工作過,他說:這在以前是一個完整團隊的工作,而且還需要長期維護。但現在,一個人就做出來了。把這種效率放大到整個公司層面,影響是非常夸張的。

      還有一個我特別喜歡的例子。我們有個同事 Malcolm,他之前是大型銀行的經濟學家。那種機構的經濟學團隊通常有一兩百人。

      他一個人,用 AI 做了一件非常瘋狂的事:他把 FRED 數據、就業報告等各種經濟數據,通過 API 全部接入,然后開始跑回歸分析,研究不同經濟變量對通脹和通縮的影響。

      更夸張的是,他還分析了美國勞工統計局(BLS)的 2000 項任務,判斷哪些可以被 AI 完成,哪些不行,并建立了一套評估體系。目前大概只有 3% 的任務是 AI 可以完成的。

      基于這些,他提出了一個概念,叫“幻影 GDP”(Phantom GDP):AI 會讓產出增加,但由于成本下降得更快,理論上 GDP 反而可能下降。

      他還順手做了一整套語言模型評估體系,包含 2000 個評測任務。這些,全都是他一個人完成的。他自己也說,這在以前需要一個 200 人的團隊干一年。

      主持人:那作為公司經營者,你怎么看這種支出從接近 0 一路漲到 25%,甚至可能更高?你有沒有想過什么時候該“踩剎車”?比如不用最頂級的模型,換便宜一點的?

      Dylan Patel:從本質上講,我們是在做信息生意——賣分析、做咨詢、提供數據集。如果我不持續提升產品質量,這些東西很快就會被商品化(commoditized)。

      比如我們最早做的數據產品,現在已經有很多人開始做類似的了。如果我們停在原地,很快就會失去競爭力。

      AI 的確會讓很多東西變成“商品”,就像它對軟件行業做的那樣。但關鍵在于:誰能更快迭代、誰能持續提升服務質量、誰能掌握客戶,誰就能增長

      那些不行動的“既得利益者”,一定會輸。所以這其實是一個生存問題:如果我不用 AI,別人會用,然后打敗我。

      再舉一個能源領域的例子。

      我們之前有幾位分析師,花了一年時間想做一個能源模型,但一直沒做出來。能源數據服務市場大概有 9 億美元規模,是一個很大的機會。

      后來,我們有個負責數據中心能源業務的同事 Jeremy,“AI 上頭”了。他連續幾周每天花大概 6000 美元的 token。

      在短短 3 周內,他做了這些事:抓取了美國所有發電廠、所有高壓輸電線路的數據,構建了整個美國電網的映射,還整合了大量需求側數據。

      最后做出了一個可視化系統,可以看到美國各個區域的電力供需情況。我們拿去給一些做能源交易的客戶看,他們的反應是:“這東西你們做了多久?太強了,比某某公司還好。”

      而那家公司,有 100 人團隊,做了 10 年。當然,我們的系統還不夠完善,但在某些方面已經更強了。

      主持人:聽起來,你描述的不只是效率提升,而是整個生產函數都被改寫了。

      Dylan Patel:完全是這樣。現在的問題已經不是“能不能做”,而是“這個想法值不值得做”。因為執行成本已經低到幾乎可以忽略不計了。

      從你的角度來看,本質上你是在“商品化”這些能源數據服務公司。如果你不加快速度,那誰會來商品化你?所以問題就變成:作為一個企業經營者,你確實在大筆花錢,但這些投入到底帶來了什么?是否真的帶來了更多收入?

      Dylan Patel:是的,確實帶來了更多收入。

      主持人:那你有沒有擔心過一個極限情況:那些掌握資本、負責投資的人——他們本來就是你的客戶——會不會有一天說,“我們自己也有很聰明的分析師,那我們干脆自己做,不再買你的服務了”?如果一切變得這么容易,最終會不會所有能力都內收進這些投資機構內部?

      Dylan Patel:首先,任何信息服務業務都有一個基本邏輯:我從信息中創造的價值,永遠小于我的客戶從中獲得的價值。

      舉個簡單的例子,如果我以 1 美元賣給你一條信息,你之所以愿意買,是因為這條信息能幫你賺超過 1 美元。所以,本質上你從我這里“套利”了,你賺得比我多。

      像一些頂級投資機構,比如 Jane Street、Citadel,它們內部本來就有非常強的數據和研究能力。但即便如此,它們仍然會持續購買我們的數據,而且合作規模還在擴大。

      原因很簡單:我們有某種“優勢因子”。我們更快、更靈活,是一個小團隊,專注在一個非常具體的方向——AI 基礎設施、token 經濟,以及這場技術革命的演進路徑。

      我們對趨勢的判斷更前置,執行速度更快,產品迭代也更快。

      當然,投資機構也會嘗試自己構建一部分能力,但更多時候,他們會發現:直接買我們的數據更便宜。因為他們可以在我們的數據之上再做自己的分析,而不是從零開始構建整套體系。

      不過,確實會有一部分人嘗試自建,這是不可避免的。

      2 Token 需求暴漲,但供給跟不上

      主持人:我感覺每次跟你聊天,最后都會回到一個核心問題:token 的供需關系。這似乎是現在整個世界最關鍵的變量。從你親身經歷的這些變化來看,你對“需求側”的判斷有沒有發生變化?

      Dylan Patel:變化非常大。

      如果我們從宏觀角度看,比如 Anthropic,它的收入從大約 90 億美元增長到現在的 350 億到 400 億美元年化水平——等這期播客播出時,可能已經到 400 億到 450 億美元了。

      但關鍵是:它的算力并沒有按同樣比例增長。

      如果你做一個簡單的推算,并假設它沒有減少研發算力(而事實上它不可能減少,因為它還在發布像 “Mythos” 和 Opus 4.7 這樣的模型),那么可以得出一個結論:即使把所有新增算力都用于推理(inference),它的毛利率底線也在 72% 左右

      而現實情況是,一部分新增算力還投入到了研發中,所以真實毛利率可能更高

      要知道,在今年年初,有人泄露過他們融資文件中的數據,當時的毛利率只有 30% 多。這意味著什么?意味著 token 的需求增長速度,遠遠超過了供給增長。整個系統正在被需求側“拉爆”。

      主持人:也就是說,你看到的是一個需求遠超預期、而供給跟不上的市場?

      Dylan Patel:沒錯,而且這種失衡還在加劇。從我自己的公司就能感受到:一旦你真正把 AI 深度嵌入工作流,token 消耗會呈指數級增長。而且這種增長,不是“可選項”,而是“競爭所必需”

      這才是最關鍵的變化。

      主持人:像這樣的公司,利潤率是怎么能做到這么高的?這聽起來幾乎不現實。

      Dylan Patel:本質原因很簡單:需求太強了。

      現在真正重要的,不是你用不用這些模型,而是你有沒有“訪問權”。比如,你有沒有 Anthropic 的客戶經理?有沒有企業級合同?能不能提高你的 rate limit(調用速率限制)?

      因為 token 本身已經變成一種高度稀缺資源。誰能付得起錢,誰就能用到更多。

      這其實不是問題,而是資本主義的自然結果。Anthropic 現在一年大概有 400 億美元的 token 收入,但關鍵是——這些 token 為客戶創造的價值,遠遠超過 400 億美元

      不同企業,每個 token 能創造的價值不同。但隨著模型越來越智能,真正重要的是:你是否能獲取這些“最聰明的 token”,以及你如何使用它們。

      最終,決定勝負的不是模型本身,而是人——你能不能把這些 token 用在最有價值的地方。

      因為會有很多人使用 token,但并不是所有人都在創造價值。比如一些做 SaaS 的初創公司,用 Claude 生成代碼,但如果他們的產品本身不創造足夠價值,那他們很快就會被“擠出”市場——因為他們用不起這些 token

      3 “Mythos 強大到讓 Anthropic 不敢公開”

      主持人:我今天剛好有個親身體驗:在飛機上我用模型的時候,被 rate limit 限制了。當我看到 4.7 發布后,我立刻就想用 4.7,甚至已經不想再用 4.6 了——盡管過去幾周我一直用得很開心。你會不會覺得,大家對“最新、最貴模型”的執念,有點出乎意料?

      Dylan Patel:完全不意外。我最近一個很好笑的經歷是:我和朋友 Leopold,曾經“跪著求”一位 Anthropic 的聯合創始人,讓他給我們 Mythos 的訪問權限——盡管他一直假裝這個模型不存在。

      但這恰恰說明了問題:大家都知道,更強的模型意味著更大的價值。

      從目前流出的 benchmark 來看,Mythos 可能是過去兩年里模型能力最大的一次躍遷。這一點非常關鍵。甚至可以說,它強到讓 Anthropic 不敢完全公開發布。雖然他們已經給部分客戶定了價格——大概是當前 token 成本的 5 到 10 倍——但他們仍然在猶豫,因為擔心它對世界的影響。

      現在對外發布的 Opus 4.7,其實是一個“刻意削弱”的版本,尤其是在某些敏感能力上。所以我的建議很直接:如果你有足夠的資金,就應該盡早簽一個 Anthropic 的企業級合同,按 token 付費,而不是用普通訂閱。這樣你才能避免被 rate limit 卡住。

      然后,你必須解決一個核心問題:如何把這些 token 用在“最值錢”的任務上,并且從中賺錢。

      從某種意義上講,一兩年之后,很多公司的本質,可能就是在“做 token 套利”:token 本身很強大,但關鍵在于你把它“指向哪里”。

      再往后走三到四年,甚至連這個問題都不需要人來決定——模型自己就會知道,應該把算力用在哪些地方,來創造最大價值。

      主持人:聽起來像是一個完全不同的經濟體系。

      Dylan Patel:其實我們已經能從歷史中看到這個趨勢。

      隨便選一個能力基準來看:過去達到某個能力水平,可能需要非常高的成本;現在,成本可能已經降到原來的 1/100,甚至 1/1000。

      比如一些新模型,在達到類似 GPT-4 能力時,成本已經下降了幾個數量級。但有趣的是——沒人真的在乎這些“舊一代能力”變便宜了。大家真正想要的,是最前沿的模型。因為只有前沿模型,才能創造真正有經濟價值的東西

      Dylan Patel:所以,驅動需求的,從來不是“成本下降”,而是“能力上限的提升”。

      一年之后,今天的 Opus 4.6 或 4.7,可能成本只剩下現在的 1/100——比如我現在 700 萬美元的開銷,可能只需要 7 萬美元。

      但這不重要。

      因為到那時候,我用的會是更強大得多的模型,能做更多、更復雜、更有價值的事情。

      主持人:雖然 Mythos 這個模型單個 token 更貴,但因為它完成任務所需的 token 數量更少,所以在很多任務上反而比 Opus 4.6 更便宜,對吧?

      Dylan Patel:沒錯。本質上是“單位 token 更聰明”。雖然單價更高,但效率提升太明顯了,所以整體成本反而下降。

      主持人:我記得上次見你的時候,Mythos 剛出來,你說這個模型好到讓你有點“害怕”。你當時是什么意思?

      Dylan Patel:Anthropic 在 2024 到 2025 年的一個核心目標,是讓模型達到“L4 軟件工程師”的水平——也就是一個比較初級但已經能獨立工作的工程師。

      基本上,他們用 Opus 4.6 做到了這一點。

      但他們沒明說的是:如果你看 Mythos 的 benchmark,它更接近“L6 工程師”——也就是一個經驗相當豐富的高級工程師。更夸張的是,這個能力躍遷只用了兩個月時間。他們內部大概在 2 月就已經有這個模型了。

      所以問題就來了:接下來會發生什么?模型進步不僅沒有放緩,反而在加速。無論是 Anthropic 還是 OpenAI,模型發布節奏都在明顯壓縮

      原因其實很清楚:要做出更強的模型,需要三樣東西——算力、研究人員、以及“實現能力”。

      算力很貴,而且短期內基本是“鎖定”的;頂級研究人員也極其稀缺,薪酬動輒上千萬美元。但“實現能力”(implementation)這件事,過去一直是瓶頸,現在卻被 AI 極大地降低了門檻。

      以前你有一個好想法,但實現它很難;現在你有想法,實現變得很容易——雖然仍然需要花錢,但技術門檻已經大幅下降。

      主持人:這會帶來什么變化?

      Dylan Patel:這會徹底改變“創新的節奏”。因為實現變容易了,你可以同時嘗試更多想法,然后快速迭代。無論是在做模型研發,還是在做應用——都一樣。

      比如過去模型可能 6 個月發布一次,現在可能 2 個月就發布一次。再比如,你想建一個美國電網的供需模型——以前很難,現在也可以快速做出來。

      問題變成了:你有那么多想法,但哪些想法值得投入 token 成本去實現

      這其實是一個核心轉變:過去,想法廉價,執行昂貴;現在,想法廉價且泛濫,執行變得便宜而容易。

      所以,真正有價值的,只剩下“好想法”——那些能夠證明自己值得被執行的想法。

      主持人:那你說的“害怕”,更多是技術不確定性,還是別的?

      Dylan Patel:不確定性肯定存在,但確實也帶來了一種更深層的擔憂——社會層面的。

      我們正在進入一個世界:“你能不能執行”不再重要,真正重要的是——你能不能選對要做的事情。你的價值,變成了三件事:

      1)選擇正確的問題讓 AI 去解決

      2)把 AI 的產出轉化為產品或價值

      3)獲取資源(資本、算力、token)來放大這一切

      這也解釋了為什么“最新模型的訪問權”變得如此關鍵。

      誰能用到最先進的模型?不再是所有人。

      Anthropic 已經在做選擇性開放,比如 Mythos 只提供給少數客戶(目前主要用于網絡安全場景)。未來這種趨勢只會加強——模型不會全面開放,而是越來越“定向分發”。原因很現實:AI 太貴了。誰來為萬億美元級別的基礎設施買單?一定是那些能用 AI 賺到錢的公司。同時,模型公司也不希望被“蒸餾”或復制,所以不會大規模開放最先進能力。

      主持人:這聽起來像是資源會越來越集中。是這樣嗎?

      Dylan Patel:是的,這正是我在思考的問題:隨著 token 的價值越來越高,這些資源和由此產生的收益,會不會集中在越來越少的公司手里?

      比如我現在還拿不到 Mythos,但一些頂級銀行已經在用了(雖然目前主要用于網絡安全)。未來可能會出現這樣一種情況:因為我有企業級合同、關系不錯,我能稍微更早拿到新模型,或者獲得更高的調用額度。我希望是這樣——因為這本身就會成為新的競爭優勢。

      主持人:如果你的競爭對手拿不到這些最先進模型的訪問權,而你能拿到,那基本上你就可以直接碾壓他們,對吧?

      Dylan Patel:完全可能。你可以想象一個極端但現實的場景:像 Ken Griffin 這樣的人——既有錢又有關系——直接去跟模型公司談一個協議,比如和 OpenAI 或 Anthropic 簽約,說“我每年先買 100 億美元的 token,你們的新模型優先給我用,等我用完第一批,其他人才可以用”。

      如果這種事情發生,會怎樣?

      那他在市場上基本就是“降維打擊”。這種優勢可以體現在很多領域:可能是網絡安全(Anthropic 目前就對這類場景高度敏感),也可能是信息服務(像我這樣的業務),本質上都是一樣的——誰先用上最強的模型,誰就能碾壓別人。

      更關鍵的是:我們其實并不知道這些模型真正的能力邊界在哪里。

      Anthropic 不知道,OpenAI 不知道,任何人都不知道。

      真正去探索這些能力的,是“使用者”。是他們在不斷嘗試:這些 token 能用來做什么?能構建什么?

      這件事本身,對人類生產力是極大的提升。但同時,也帶來一個問題:資源和能力,會不會越來越集中到少數人手里?這些都需要時間來回答。

      4 具身智能將成 AI 領域新的需求爆發點

      主持人:那如果把視角拉遠一點,比如機器人領域?現在機器人幾乎不消耗 token,但未來會不會成為一個新的需求爆發點?

      Dylan Patel:我認為會,而且非常快。現在有一個概念叫“軟件奇點”(software-only singularity)——也就是說,AI 的爆發主要發生在軟件世界。但現實是,絕大多數經濟活動發生在物理世界。

      所以,軟件奇點只是一個階段,而不是終點。一旦軟件變得極其容易構建,下一步自然就是:把這些能力擴展到物理世界,也就是機器人。

      現在機器人難在哪里?主要難在控制系統——比如微控制器、執行器、復雜的動作控制

      而當前主流的機器人模型(比如 vision-language-action 模型)在數據效率上其實很低,沒法像語言模型那樣規模化。

      但未來一定會出現新的路徑:類似于“大規模預訓練”的機器人模型,就像人類一樣,通過大量經驗學習,同時具備“樣本高效性”(few-shot learning)

      主持人:你覺得這個突破大概什么時候會發生?

      Dylan Patel:我認為在未來 6 到 18 個月內,會出現真正有意義的突破。

      比如你買一個機器人,只需要給它幾個示例,它就能學會任務:讓它疊衣服、搬東西、保持平衡,它都能很快掌握。到那個時候,機器人會變得高度專業化:可能會有專門擦黑板的機器人、疊衣服的機器人,甚至是一種“軟件包”——你下載一個模型,它就讓通用機器人具備某種能力。

      這會帶來兩個結果:一是物理世界的生產效率大幅提升;二是通縮效應(deflation)進一步加強。同時,這也會讓 token 的需求繼續爆炸式增長。

      我個人不認為 token 需求會放緩。

      主持人:那回到模型本身,比如 Mythos,它的出現有沒有讓你對“規模法則”(scaling laws)有新的看法?

      Dylan Patel:反而更確認了一點:規模法則仍然有效。Mythos 本質上是一個更大的模型——規模顯著提升。這說明一件事:投入更多算力,模型就會變得更強

      當然,不只是“堆算力”。整個過程中,還有大量“效率提升”——也就是說,達到同樣能力的成本在持續下降。你可以這樣理解:一方面,如果你不斷擴大規模,會得到能力的巨大躍遷;另一方面,如果你維持同樣能力水平,成本卻在指數級下降。

      5 Anthropic 已經領先了?

      主持人:那從競爭格局來看,現在是不是 Anthropic 已經領先了?

      Dylan Patel:表面上看是這樣。他們在 2 月就有 Mythos,但甚至沒有完全發布,因為需求已經爆滿;現在又發布了 Opus 4.7。

      很多人會說,那 OpenAI 是不是已經落后了?但事情沒那么簡單。Anthropic 的問題在于:算力受限。他們增長得很快,但擴張能力有限。

      而 OpenAI 的策略完全不同——他們在算力上是“極端激進”的,大規模采購資源,從 Microsoft、Oracle,到 SoftBank,再到 Amazon 的 Trainium 芯片,全都在押注。

      簡單說:Anthropic 更克制,但現在也開始意識到算力不夠;OpenAI 則是一開始就瘋狂堆算力,現在反而有更大的擴展空間。

      還有一個容易被忽視的點:技術的擴散是有“時間滯后”的。

      你我可能第一時間用上新模型,但大多數企業需要時間去學習、適應、重構流程。

      所以即使不考慮模型繼續進步,僅僅是“現有能力的擴散”,到今年年底,一個類似 Opus 4.6 水平的模型,可能就能支撐起整個經濟體數百億美元的支出規模。

      現在是 400 億美元,這個數字繼續增長,并不夸張。

      主持人:所以你的意思是,現在的增長更像是“線性外推”,而不是指數增長?真正的指數級爆發,需要更強的模型?

      Dylan Patel:沒錯。現在只是線性增長——真正的指數增長,取決于下一代模型能力的躍遷。

      問題在于,Anthropic 可能沒有足夠的算力去推動那個躍遷。接下來更有可能是 OpenAI 或 Google 先達到那個層級

      一旦有人先做到,就算他們的毛利率只有 50%,而不是 70%+,他們依然會吃掉幾乎所有新增需求——而且很可能他們自己也沒有足夠算力去滿足全部用戶

      你可以想象一個極端情況:如果算力完全充足,像 Mythos 這樣的模型,理論上可以支撐 5000 億美元級別的收入。

      但現實是,算力嚴重受限。

      我們已經看到,比如 NVIDIA H100 的價格在飆升,而且這些 GPU 的“使用壽命”也在被不斷拉長。

      這意味著什么?意味著不僅一線實驗室(Anthropic、OpenAI)會“供不應求”,連二線、三線實驗室也一樣——大家都會把 token 賣光。

      本質上,現在出現了一個越來越大的“剪刀差”:模型所能創造的經濟價值,在飛速增長;但我們能提供的算力供給,增長得沒那么快。這個差距會持續擴大。

      而結果就是:模型公司的利潤率會不斷上升——直到硬件供應鏈開始“反向收割”,提高自己的利潤

      主持人:聽起來你對需求側的判斷是:幾乎爆炸式增長,而且這種增長還在加速。

      Dylan Patel:是的,而且我覺得很多人還低估了這一點。我有一個比較極端的說法:如果你不使用更多 token,你會被困在一個“永久底層”(permanent underclass)。

      主持人:這個說法挺激進的,展開講講。

      Dylan Patel:這里其實有三個層次的問題:

      第一,你要不要用更多 token;

      第二,你能不能用這些 token 創造經濟價值;

      第三,你能不能把這些價值“抓在自己手里”。

      很多人現在只做了第一步,甚至是以一種“偷懶”的方式——比如用 AI 把 8 小時工作壓縮到 1 小時。但那只是最低級的用法。

      更高級的方式是:你仍然工作 8 小時,但產出變成原來的 8 倍,收入可能變成 5 倍

      這在傳統“打工模式”下不一定成立,但對于創業者、自由職業者、多項目操盤的人來說,這是完全可能的。

      關鍵是:現在還不是“標配階段”(table stakes)。你還有窗口期,可以利用 AI 提前放大自己的產出。但一旦所有人都這么做,這種優勢就會消失。如果你在這個階段沒有做到這三件事——

      用 token、創造價值、捕獲價值——那隨著模型能力繼續提升、資源進一步集中,你很可能會被甩在后面。

      主持人:那我們聊聊供給側。為了支撐這種需求爆發,整個技術棧在發生什么變化?

      Dylan Patel:一句話總結:整個供應鏈都在“漲價 + 延長周期 + 預付款”。

      首先是 GPU。像 NVIDIA 的產品,不僅價格在上漲,而且使用壽命也在延長。

      過去很多人說 GPU 用 5 年就淘汰,現在看完全不成立——很多 3-4 年前的集群還在續約使用,甚至可能用到 7-8 年。這意味著云廠商的真實利潤率,其實比表面看起來更高。

      再往下看整個供應鏈:

      • 硬件層:像 NVIDIA,毛利率依然非常高

      • 內存:利潤率已經大幅上升

      • 光學、邏輯芯片:通過“預付款”提升資本回報率

      • 光刻機:ASML 已經完全賣空,還依賴 Carl Zeiss 擴產

      甚至更底層,比如 PCB 所需的銅箔,也開始供不應求,需要提前鎖定產能。

      你會看到一個非常一致的模式:整個鏈條上的每一個環節,要么已經售罄、在提價,要么在收預付款、提高資本效率。換句話說:只要是“有實體、有產能”的環節,現在都在被搶。這就是供給側的現實。

      主持人:從歷史來看,需求爆發之后,供給通常會很快跟上,甚至出現過剩。但現在看起來,供給幾乎不可能追上。你覺得當前最關鍵的瓶頸在哪里?

      Dylan Patel:問題在于:這一次的供應鏈,比以往任何時候都更復雜。而且我們正在構建的系統,本身復雜度也極高,這直接拉長了交付周期(lead time)。

      過去某些行業也有 18 個月的交付周期,但“擴產”本身不需要幾年時間;而現在,即使你決定擴產,真正的新增供給也要等很久才會出現。

      一個典型例子是內存。內存產能每年大概只能增長 20% 到 30%,這是物理極限。即使 2025 年底需求信號已經非常明確,廠商也開始擴產,但這些新增產能,真正落地可能要到 2027 年末甚至 2028 年。

      這意味著什么?

      意味著價格會持續上漲,而且還沒結束。尤其是 DRAM,很可能還會再翻倍甚至翻三倍。很多人覺得“內存瓶頸已經被充分討論了”,但實際上完全沒有。真正的緊缺才剛開始。而在市場機制下,唯一的調節方式就是——漲價,通過“需求破壞”(demand destruction)來重新分配資源。

      主持人:那除了內存,邏輯芯片這邊呢?

      Dylan Patel:邏輯芯片同樣面臨嚴重瓶頸。臺積電(TSMC)一直在提高資本開支(capex),今年大概在 500 多億美元,而且還在上調。

      但問題是:建晶圓廠是需要時間的。

      他們已經在盡可能壓榨現有產能,但短期內不可能大幅提升供給。而且他們目前的漲價策略其實相對“溫和”,只是個位數漲幅——不像內存那樣激進。

      這就帶來一個問題:臺積電當然是優質公司,但它未必能“吃掉”整個價值鏈的最大收益。

      真正被低估的,是更上游的設備和材料供應鏈。比如:

      • ASML:已經完全賣空

      • Lam Research、Applied Materials:需求持續爆發

      • 更下游的供應商,比如 MKSI 等:同樣受益于“訂單外溢”

      還有很多更細分的環節:銅箔、玻纖(PCB 材料)、激光器……這些都是“小而關鍵”的供應鏈,但現在全部處于極度緊張狀態。

      如果臺積電在 2028 年真的做到 1000 億美元資本開支(這不是幻想,而是現實可能),那整個供應鏈會被“鞭子效應”(bullwhip effect)不斷放大沖擊。

      換句話說:越往上游,波動越劇烈,瓶頸越嚴重。

      主持人:那除了 GPU,這一波 AI 還有哪些被忽視的瓶頸?

      Dylan Patel:CPU 是一個被嚴重低估的瓶頸。現在大家都在討論 GPU,但實際上 CPU 也已經“賣斷貨”了。

      原因有兩個:第一,強化學習(reinforcement learning)。模型訓練現在不只是“喂數據”,而是要在環境中反復試錯、評估結果。這些“環境”——無論是簡單的文本校驗,還是復雜的 CAD 仿真——都是運行在 CPU 上的。

      第二,推理后的執行層。模型生成的代碼、內容,并不會直接變成最終結果,而是要在各種應用環境中運行——這些環境,大量依賴 CPU。

      換句話說:

      • GPU / ASIC:負責“思考”(模型推理)

      • CPU:負責“執行”(環境運行、應用落地)

      隨著 AI 生成的內容越來越多,CPU 需求也在同步爆發。

      主持人:那從你的角度來看,最難判斷的變量是什么?

      Dylan Patel:不是供給,也不是成本,而是——“token 的經濟學”。我們其實很清楚:

      • 訓練成本是多少

      • 推理成本是多少

      • 模型公司大概賺多少錢

      但最難的是:這些 token 被用來做什么?創造了多少真實價值?這些價值如何在經濟中擴散?

      比如我用 AI 提升了信息分析能力,然后把這些信息賣給客戶,價格還比以前更便宜。這會帶來什么結果?

      • 客戶做出更好的投資決策

      • 企業做出更優的競爭策略

      • 整個經濟效率提升

      但這些價值,并不會完整體現在 GDP 統計里。這就是我說的“幻影 GDP”(Phantom GDP)問題:真實創造的價值,遠遠大于統計數據所反映的。但我們現在還沒有一個很好的方法去衡量它。

      6 少談未來,多講當下

      主持人:最后一個問題。如果我們三個月后再聊,你覺得會發生什么?

      Dylan Patel:我認為,會出現大規模的反 AI 抗議。

      主持人:這么快?

      Dylan Patel:是的。現在很多人其實是“反 AI”的,而且這種情緒在上升。隨著 AI 收入快速增長、企業結構發生變化,人們會開始把各種問題歸因于 AI。

      再加上一些政治人物或社交媒體的推動,這種情緒很容易被放大。甚至已經有一些極端案例,比如針對 Sam Altman 的攻擊事件,網上還有人表示支持。

      這只是開始。

      主持人:那 AI 行業應該怎么應對?

      Dylan Patel:我覺得有三個關鍵點:第一,溝通方式需要徹底改變。像 Sam Altman 和 Dario Amodei 的對外表達,其實并沒有很好地建立公眾信任;第二,多展示“正面價值”,讓普通人看到 AI 如何改善生活,而不是只談“顛覆世界”;第三,少談未來,多講當下,如果一直強調“AI 將改變一切”,只會加劇恐懼感。

      現在的問題是,大多數人既不了解這些公司,也不了解這些技術。他們看到的,是一個“神秘的小圈子”,在打造一個可能改變世界、甚至取代人類工作的系統。

      如果這種認知不改變,反彈是必然的。

      https://www.youtube.com/watch?app=desktop&v=LF3aUIM57uw

      聲明:本文為 InfoQ 整理,不代表平臺觀點,未經許可禁止轉載。

      會議推薦

      世界模型的下一個突破在哪?Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發體系不重構,還能撐多久?

      AICon 上海站 2026,4 大核心專題等你來:世界模型與多模態智能突破、Agent 架構與工程化實踐、Agent 安全與可信治理、企業級研發體系重構。14 個專題全面開放征稿。

      誠摯邀請你登臺分享實戰經驗。AICon 2026,期待與你同行。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      檢查一下,家里有“這5樣東西”趕緊扔掉!別害了家人

      檢查一下,家里有“這5樣東西”趕緊扔掉!別害了家人

      家居美少女
      2026-05-09 13:44:03
      深度長文:如果你不存在了,宇宙還會存在嗎?

      深度長文:如果你不存在了,宇宙還會存在嗎?

      宇宙時空
      2026-05-09 12:04:49
      【完整版】戈貝爾:文班亞馬命中了一些關鍵投籃 他非常高效

      【完整版】戈貝爾:文班亞馬命中了一些關鍵投籃 他非常高效

      硯底沉香
      2026-05-09 14:43:08
      威廉攜手凱特主持花園派對!穿晨禮服戴高頂帽很紳士,扎拉也來了

      威廉攜手凱特主持花園派對!穿晨禮服戴高頂帽很紳士,扎拉也來了

      八八尚語
      2026-05-09 09:33:39
      美媒終于承認:中國不期待特朗普訪華,是因為早就不把美當回事!

      美媒終于承認:中國不期待特朗普訪華,是因為早就不把美當回事!

      起喜電影
      2026-05-09 11:45:27
      剛剛,比亞迪官宣:新車15.08萬起!

      剛剛,比亞迪官宣:新車15.08萬起!

      手機評測室
      2026-05-09 11:50:48
      羅翔:如果一個人突然努力工作,業余時間開始學習,不再參加社交活動,那么,身邊的人可能不僅不會幫他,還會拉他下來,原因就一個!

      羅翔:如果一個人突然努力工作,業余時間開始學習,不再參加社交活動,那么,身邊的人可能不僅不會幫他,還會拉他下來,原因就一個!

      譚老師地理大課堂
      2026-04-22 00:03:57
      歷史上美國總統一共有過多少次訪華?

      歷史上美國總統一共有過多少次訪華?

      野望谷研究社
      2026-05-08 15:33:59
      特朗普訪華中國遲遲不官宣,美媒破防:原來中國早就看不上我們了

      特朗普訪華中國遲遲不官宣,美媒破防:原來中國早就看不上我們了

      壹知眠羊
      2026-05-09 10:41:55
      Netflix王牌美劇,太頂了

      Netflix王牌美劇,太頂了

      來看美劇
      2026-05-06 22:35:13
      生理旺盛的女性,大多有這3個特征,超準!

      生理旺盛的女性,大多有這3個特征,超準!

      皓皓情感說
      2026-04-25 19:09:10
      要打奉陪到底,中方當面插旗,沉默72小時后,日本在境外發射導彈

      要打奉陪到底,中方當面插旗,沉默72小時后,日本在境外發射導彈

      影孖看世界
      2026-05-07 15:58:50
      成都“編號醫院”最全攻略:市一至市七、華西系、省系列一篇看懂

      成都“編號醫院”最全攻略:市一至市七、華西系、省系列一篇看懂

      寶哥精彩賽事
      2026-05-09 11:28:48
      特朗普心腹來華,逼購波音,王毅攤牌:別繞圈子,先解決核心問題

      特朗普心腹來華,逼購波音,王毅攤牌:別繞圈子,先解決核心問題

      蘭妮搞笑分享
      2026-05-08 19:59:09
      她屬于胸大腰細的女演員,打敗少女感的,從來不是年輕

      她屬于胸大腰細的女演員,打敗少女感的,從來不是年輕

      南萬說娛26
      2026-05-09 14:31:34
      你發現沒有,凡是結婚時不主動提彩禮的,女方家庭通常就是以下兩種情況

      你發現沒有,凡是結婚時不主動提彩禮的,女方家庭通常就是以下兩種情況

      心理觀察局
      2026-05-08 09:32:04
      今夜!徹底漲瘋了

      今夜!徹底漲瘋了

      中國基金報
      2026-05-09 00:18:23
      山東女孩放學回家路上失蹤,連續5天給母親托夢:我就在鍋里

      山東女孩放學回家路上失蹤,連續5天給母親托夢:我就在鍋里

      紙鳶奇譚
      2025-01-26 17:18:28
      為什么睡過的人會忘不掉,氣味記得最久

      為什么睡過的人會忘不掉,氣味記得最久

      心事寄山海
      2026-05-08 00:32:28
      U17隊長李鈞鵬:心態調整到位,迎戰日本全力爭勝

      U17隊長李鈞鵬:心態調整到位,迎戰日本全力爭勝

      許礆很機智
      2026-05-09 15:12:39
      2026-05-09 16:00:49
      InfoQ incentive-icons
      InfoQ
      有內容的技術社區媒體
      12346文章數 51880關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協議

      頭條要聞

      香港富豪孫女被綁架 綁匪拿到2800萬后逃跑8人花11萬

      頭條要聞

      香港富豪孫女被綁架 綁匪拿到2800萬后逃跑8人花11萬

      體育要聞

      成立128年后,這支升班馬首奪頂級聯賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認不出!

      財經要聞

      Meta瘋狂擁抱人工智能:員工苦不堪言

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      本地
      健康
      手機
      公開課
      軍事航空

      本地新聞

      用蘇繡的方式,打開江西婺源

      干細胞能讓人“返老還童”嗎

      手機要聞

      4699元起!華為Pura 90標準版今日開售:搭載9010S 全新外觀獨一無二

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美伊突然再次交火 伊朗外長:戰爭準備程度是1000%

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 特级做a爰片毛片免费看108 | 国产主播精品福利午夜二区| 久久99精品国产麻豆婷婷| 91精品国产综合久久青草| 乱色精品无码一区二区国产盗| 少妇高潮喷水正在播放| 亚洲中文字幕日韩| 国产精品无码制服丝袜| 中文字幕亚洲精品码专区| 99福利一区二区视频| 免费高清a毛片| 男女后进式猛烈xx00动态图片| 国产AV国片精品有毛| 国内精品久久久久影院日本| 激情综合色五月丁香六月亚洲| 欧美日韩午夜群交多人轮换 | 制服丝袜在线云霸| 亚洲综合无码AV在线观看| 国产精品三上悠亚在线| 国产无遮挡又黄又爽免费网站| 久久亚洲精品中文字幕无| 亚洲精品乱码久久久久久蜜桃91| 人妻一本久道久久综合久久鬼色| 在线观看成人永久免费网站| 欧美激情一区二区三区久久| 99久久精品无码专区无| 国产明星精品无码AV换脸| 99精品视频在线观看免费播放 | 国产精品国产主播在线观看| 国产女主播高潮在线播放 | 亚洲黄色第一页在线观看| 亚洲无码流出| 一边添奶一边添p好爽视频| 久久e| 成人无码潮喷在线观看| 国产精品99久久国产小草| 欧美性色黄大片手机版| 黑人与亚洲av| 国产真实自在自线免费精品| 国产欧美视频一区二区三区| 欧美成a人片在线观看|