![]()
當詞元成為統一計量單位,誰能以更低成本生產更多詞元,誰就掌握新的定價權。
文|胡嘉琦
ID | BMR2004
在2026年的英偉達年度開發者大會(GTC)上,CEO黃仁勛拋出一個判斷:AI競爭的本質是詞元(Token)生產效率的競爭。在GTC大會上,英偉達將詞元定義為現代AI的基本單位,是支撐科學探索、虛擬世界以及物理世界機器運行的基石。
如今,這家靠GPU稱霸AI時代的芯片巨頭,正在將戰場從“訓練”轉向“推理”,從“堆算力”轉向“降成本”。
盡管GPU依然稀缺、依然重要,但“擁有算力”本身,正在讓位于“如何使用算力”。綜合科技媒體TechRadar發布的報告數據,當前部分企業場景算力利用率甚至不足10%,這意味著,AI產業的價值正在從“賣算力”向“用算力”轉移。AWS、Microsoft Azure等云廠商,已開始從調度和計費方式入手爭奪定價權。
這迫使英偉達調整戰略,黃仁勛公開表示,英偉達不再只是賣GPU,而是構建“AI工廠”。《商學院》記者從英偉達方面獲悉,英偉達正通過全棧架構,將數據中心重新定義為詞元生產系統,使詞元從技術單位逐漸變為產業計價單位。
01
詞元經濟時代來臨
行業開始用“每美元詞元產出”和“每瓦詞元產出”來衡量能力,詞元不再只是模型內部變量,更成為AI經濟中的基礎單位。
衡量AI公司的標尺正在發生根本變化:計算的基本單位開始從GPU轉向詞元。
英偉達加速計算產品總監Dave Salvator認為,系統效率則取決于詞元處理速度與單位成本。
《商學院》記者從英偉達方面獲悉,其加速計算團隊長期跟蹤超大規模計算與AI數據中心演進,并判斷AI正在進入以詞元為核心計量單位的新階段。在這一體系中,詞元不再只是模型內部的中間變量,正在成為AI經濟的基礎單位。
中國社會科學院研究生院特聘導師柏文喜認為,詞元經濟下,商業天花板在“量”上被放大,但在“利潤率”上開始承壓。詞元經濟將算力的計量方式,從“賣硬件”轉向“賣結果”,直接擴展了市場規模。當詞元消耗從萬億級走向百萬億級,需求呈指數級增長。
這對英偉達而言,是典型的雙刃劍:一方面,增量空間被顯著打開,推理算力的需求規模正在向訓練算力的百倍量級演進,疊加智能體帶來的毫秒級高并發與長鏈路任務,底層算力基礎設施必須重構,這為整個行業創造了新的增長曲線。
另一方面,利潤結構正在被壓縮。當前行業算力利用率普遍在30%—60%,大量GPU處于低效或閑置狀態。當客戶開始按詞元付費,本質上只為“有效產出”買單,利用率壓力將向上游傳導。對英偉達來說,這意味著商業邏輯必須轉變,不再是盡可能多地賣出GPU,而是讓每一張卡產生更多詞元。這也正是黃仁勛推動“AI工廠”的底層邏輯,把算力從靜態資產變成持續運轉的生產系統。
這一拐點的本質,是GPU廠商定價權的遷移,從過去依賴供給稀缺形成的“稀缺性溢價”,轉向由系統效率決定的“效率溢價”。當詞元成為統一計量單位,誰能以更低成本生產更多詞元,誰就掌握新的定價權。
如今,行業開始用“每美元詞元產出”和“每瓦詞元產出”來衡量能力,詞元不再只是模型內部變量,更成為AI經濟中的基礎單位。其直接結果是,競爭焦點從模型能力轉向詞元成本,在相同硬件條件下,不同系統的詞元效率差異,足以拉開數量級的商業回報差距,AI產業由此進入“詞元經濟”階段。
02
從賣算力到賣效率:英偉達的新命題
英偉達做的所有動作,本質上都是在嵌入生產過程本身,讓自己不只是賣GPU,而是參與定義詞元如何被生產出來。
英偉達并不直接賣詞元,但它通過控制生成路徑來參與定義詞元。在“AI工廠”框架下,英偉達正祭出一套“組合拳”:
Dynamo這類開源推理系統,解決“詞元怎么更高效地產生”。
很多能力也在被軟件化并開源,英偉達TensorRT-LLM接入各種框架,優化緩存和數據流動,本質都是在壓低單位詞元的浪費。
英偉達還在用一款面向“AI工廠”的邏輯仿真平臺DSX Air做仿真,在硬件進數據中心之前就先跑一遍系統,對計算、網絡、存儲、編排與安全進行全棧模擬與驗證,把可能的瓶頸提前暴露出來。這讓優化不再發生在上線之后,而是提前在設計階段完成。
由此,“AI工廠”的構建邏輯,從“上線后調優”,變為“建設前定型”。
據英偉達方面披露,這一機制帶來三項直接變化:部署周期從數月縮短至數天;首個詞元生成時間從數周壓縮至數天甚至數小時;系統集成與故障排查被前移至仿真階段完成。
匯生國際資本總裁黃立沖認為,如今,硬件已經從“賣卡”進入“被結果檢驗”的階段。英偉達、云廠商、模型公司、Agent OS、算力優化平臺都在同一條鏈上,但每一層利潤點不同。AI產業不是單中心替代,而是多層護城河重估。英偉達做的所有動作,不管是開源軟件還是系統化設計,本質上都是在嵌入生產過程本身,讓自己不只是賣GPU,而是參與定義詞元如何被生產出來。
英偉達2026財年第四季度收入達到681億美元,同比增長約73%;數據中心收入623億美元,同比增長約75%,仍然保持高速增長,需求主要來自Agentic AI和AI Factory(“AI工廠”)帶來的持續計算負載。
但長期來看,黃立沖認為,一旦客戶開始按詞元、按任務、按結果來衡量成本,GPU就不再是“越多越好”的線性擴張,而要進入單位經濟的比較框架。客戶會直接問三個問題:同樣100萬詞元,誰的成本更低;同樣一個客服或投研Agent,誰的延遲更低、成功率更高;以及整個系統的賬單是否足夠透明。競爭從“供給多少算力”,轉向“單位算力的經濟效率”。
黃立沖表示,第一,采購語言的變化。企業是否從“買多少卡”轉向“買多少詞元產能、多少任務吞吐”。一旦發生這種變化,說明算力已經被產品化為服務能力,而不是硬件規模。第二,計量體系的變化。收入與成本指標是否從FLOPS轉向cost per token、tokens per watt、tokens per dollar。第三,系統優化的外溢效應。包括軟件調度、緩存機制、路由策略、小模型分流以及專用芯片設計,是否持續把同樣任務的GPU消耗壓低。如果單位任務越來越“省卡”,說明價值正在從硬件規模轉向系統效率。
因此,黃立沖認為,英偉達的天花板并不是單向變化的,英偉達在AI總需求爆發階段被放大,但在詞元經濟成為主導之后,又被重新拉回到單位效率約束之中。如果它只是一個GPU廠商,天花板會被壓縮;但如果它把GPU、網絡、軟件、機柜與推理優化整合為“AI工廠”,那么它面對的就不再是芯片市場,而是整個AI生產系統的規模。
黃立沖說:“詞元經濟不是在削弱GPU,而是在淘汰低效GPU。最終決定定價權的,不是誰擁有更多算力,而是誰能讓詞元更便宜、更穩定、更可控。這個邏輯與AI經營系統是一致的:資本市場不會一直獎勵我有AI項目,而會獎勵可規模復制、可審計歸因、可治理回滾的經營系統能力。”
03
英偉達的護城河
“AI工廠”戰略本質上是將競爭維度從單一芯片性能上移至系統效率層面。
詞元經濟并沒有消解英偉達的護城河,但改變了其形態。過去,護城河建立在GPU性能與供給稀缺之上;而現在,則轉向系統整合能力與成本控制能力。
英偉達并不直接銷售詞元,也不參與API定價,但通過GPU架構、NVLink互聯、整機系統以及CUDA生態(英偉達的一套讓開發者高效調用硬件算力的通用語言與工具包),深度影響詞元的生成路徑與成本函數。
因此,CUDA不只是工具,而是貫穿訓練到推理的一整套體系,又通過GeForce連接開發者,再通過CUDA-X進入汽車、金融、醫療、工業等行業。英偉達做的事情其實很簡單:盡量讓不同產業運行在同一套計算框架里。黃仁勛在 GTC 2026 上提到一個例子:Fireworks AI 和 Lynn 兩家公司在沒有更換任何硬件的情況下,僅通過英偉達更新軟件棧和推理算法,就把詞元生成速度從每秒約 700 個提升到接近 5000 個。這說明,不增加硬件投入,僅靠調度和推理優化,也能把“產出效率”明顯抬上去。
這種提升并不只來自芯片本身,更依賴軟件體系的持續打磨。《商學院》記者從英偉達獲悉,CUDA 平臺目前已有約 600 萬開發者。人越多,生態越豐富;生態一旦形成,后來者切換的難度也就跟著上來了。
這種“難”,不只是換個工具那么簡單。主流框架對 CUDA 綁定很深,切換平臺往往要重寫代碼,同時,開發、調試、優化的一整套流程也要跟著重來。更重要的是,工程師多年積累的調優經驗,很難直接遷移。再加上圍繞CUDA沉淀下來的開源項目和社區支持,一旦離開,效率和資源會大量流失。
在GitHub 上,與CUDA相關的項目已達數萬,英偉達的工具鏈也逐漸成為AI研究中的通用選擇。相比硬件,這套由開發者、工具和項目構成與成本函數的體系更難被替代。時間積累下來的使用習慣和安裝基礎,才是CUDA真正的護城河。
奧優國際董事長張玥更關注詞元經濟帶來的商業變化。她提到一個很直接的轉折:客戶不再只是買GPU,而是開始直接買結果。算力從資產,變成服務,而且是持續消耗的那種。AI應用越多,這種消耗就越明顯。在這個過程中,英偉達一邊用CUDA穩住生態,一邊用DGX往上走,慢慢把“賣芯片”變成“交付整套能力”。
知名財經作家、眺遠影響力研究院院長高承遠認為:客戶一旦把算力、數據和開發環境都放進來,就很難再遷出去,收入形態也隨之改變,更接近持續收費而不是一次性交易。價格怎么定,也不再完全跟著硬件周期走,而是看資源和效率情況。
護城河的變化也在這里得以體現。CUDA、TensorRT這些軟件和GPU深度綁定,性能不再是單點突破,而是整套系統一起發揮作用,這讓替代變得更難。與此同時,另一層競爭開始出現,比如調度能力、異構算力利用率、Agent的組織方式。人工智能基礎設施及智算云提供商九章云極則選擇把GPU用得更“滿”,直接沖擊按卡計費的模式。不過短期看,這類變化更多還是影響云廠商和邊際需求,還沒有真正動到最底層。
柏文喜認為,英偉達正從“賣GPU”走向“賣系統”,這既是其既有優勢的延續,也是對產業競爭格局變化的主動重構。“AI工廠”戰略本質上是將競爭維度從單一芯片性能上移至系統效率層面,即把AI基礎設施從“存儲與處理數據”的數據中心,重塑為“生產智能”的工廠,其核心指標也由硬件性能轉向單位能耗對應的產出能力。
如今,行業開始出現分層。英偉達在高端訓練上的優勢仍然穩,但在推理和規模化應用這一側,云廠商的話語權在變強。價格也不再由單一一方決定,而是分散在不同環節。
在這樣的背景下,“AI工廠”成為黃仁勛重新定義數據中心的關鍵,它更像一個生產系統,而不是設備集合。DGX這類產品,本質上是把硬件、軟件和運行環境一起交付,客戶買到的,不再是一塊GPU,而是一種持續產出能力。走到這一步,英偉達的位置也發生了變化,更接近基礎設施本身,而不只是芯片供應商。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.