網易首頁 > 網易號 > 正文申請入駐

一天燒幾億 Token，然后呢？

2026-04-13 23:49:34　來源: 老馮云數

北京舉報

分享至

老馮的朋友蔣老板最近迷上了在群里炫耀自己一天燒了幾億 Token。經常截個圖往群里一甩，“完蛋了，我又有了一個新 Idea” 。做了什么呢？一會搞個本體論數據庫，一會整個 Bigsty 用 Go 復刻 Pigsty。那神情就跟在朋友圈曬跑步公里數一樣，讓老馮看著不禁莞爾。

硅谷新運動：Tokenmaxxing

上周，Meta 內部一個叫“Claudeonomics”的排行榜被曝光了。這名字本身就很搞笑，用競品 Anthropic 的 Claude 來命名自家排行榜，也算是一種行為藝術。

這個排行榜覆蓋了 Meta 的 8.5 萬名員工，30 天內總消耗超過 60 萬億 Token。排名第一的選手，一個人平均燒了 2810 億 Token。系統還設計了一套徽章體系：從青銅到翡翠，頭銜從“Cache Wizard”到“Session Immortal”，最高級的叫“Token Legend”。

多少有點傳奇。

怎么刷上去的呢？有員工讓 AI Agent 空轉好幾個小時跑“研究任務”來攢量。消息泄露兩天后，Meta 就把這個排行榜關了，留下一行通知：“本來是好玩的，但數據被外傳了，所以先關了哈。”

Meta 不是唯一一家。OpenAI 內部也有類似的排行榜，有人一周燒了 2100 億 Token。硅谷給這個現象起了個名字：Tokenmaxxing，“Token 最大化”。

各路大佬紛紛下場站臺。黃仁勛在 GTC 上說，未來每個工程師都應該有年度 Token 預算，大約是底薪的一半；如果一個年薪 50 萬美元的工程師一年連 25 萬美元的 Token 都沒燒掉，他會“深感不安”。Shopify 的 CEO 更直接：不用 AI 就別干了。有匿名員工爆料，他們公司每周有 AI 使用量門檻，達不到就走人。

一項新的辦公室政治運動，就這么轟轟烈烈地展開了。

古德哈特永不缺席

這種事在管理學上有個經典的名字，叫 古德哈特定律（Goodhart's Law）：

一個指標一旦成為考核目標，它就不再是一個好指標。

Token 消耗量，作為一個中間過程指標，被拿來當作衡量“AI 使用深度”和“生產力提升”的代理變量。這件事從提出到腐敗，大概用了不到一個季度。可能是管理學史上腐敗速度最快的 KPI 之一。

沃頓商學院教授 Ethan Mollick 在評論這件事時，引用了一篇更老的論文：Steven Kerr 1975 年的經典《論獎勵 A 行為卻期望 B 結果的愚蠢》。公司想要的是 生產力提升，獎勵的卻是 Token 消耗量。這兩者之間有因果關系嗎？沒有人驗證過。大家默認“用得多 = 用得好”，就開始搞排行榜了。

燒 Token 是一件非常容易的事。你讓 Agent 去干一件不可能完成的任務，“給我寫個操作系統，寫不出來不要停”，開幾個并行跑著，一天之內多少 Token 都能燒完。我敢說，如果比賽規則是“誰燒 Token 多誰贏”，一個實習生都能贏過 Linus Torvalds。

這跟用 代碼行數 衡量程序員水平有什么區別？老馮用 npm install 裝一個腳手架，幾百萬行代碼瞬間到項目里，提交到 GitHub 上，是不是看起來特別能干，吊打才 170 萬行代碼量的 PostgreSQL 項目？

體面一點的軟件公司都不會用代碼行數考核工程師。這種事讓內行看了笑掉大牙，但外行管理者偏偏就吃這套。如果非要打個比方，這就是 用油耗衡量司機水平。老司機開得省油還到得快，新手油門踩到底還走錯路。誰油耗高？

誰在鼓勵你多燒？

想清楚一個問題：Tokenmaxxing 對誰最有利？

對 AI 廠商和云廠商最有利。

Ramp 的數據顯示，企業 Token 支出自 2025 年 1 月以來增長了 13 倍。黃仁勛鼓吹 Token 預算，本質上是在說“多買我的 GPU”。Sam Altman 暢想“全民基本算力”（Universal Basic Compute），本質上也是在說“以后每個人都要給我交電費”。

這就是賣鏟子的人鼓勵大家拼命挖礦。每一個 Token 都對應著真實的 GPU 算力和電力消耗。空轉的 Agent 不生產任何價值，但電費是實實在在的。把 Token 燒在無意義的任務上，跟打開水龍頭看水流就覺得“我在用水”一樣荒謬。

當然，這種表演性消費確實在一定程度上放大了 AI 需求的泡沫信號。CNBC 專門討論過：如果硅谷公司的 AI 用量中有相當比例是刷排行榜刷出來的，那華爾街看到的需求增長數據有多少是真的？

不過老馮的判斷是：這仍然是一場實實在在的生產力革命，tokenmaxxing 雖然注了點水，但底層的價值創造是真實的。泡沫會擠掉，但趨勢不會逆轉。

Token 花在哪才值？

。我基本不會去看自己燒了多少 Token，燒完訂閱拉倒。之前倒是考慮要不要再去開倆訂閱，不過最近 Codex 有翻倍活動，差不多夠用了。

最近老馮用這些 Token 干了不少事兒。比如最近兩天，我收錄了 40 多個新的 PG 擴展，修復移植了一些老擴展，將 Pigsty 里的可用擴展數量擴充到了 503 個。

同時我還將，過千 Star，過萬下載，。，，，翻譯成英文。我覺得這些都是實打實的價值與產出。這個 Token 訂閱費花得太值了。

這里面有個共同點：每件事都有 明確的、可驗證的交付物。擴展收錄了多少個，數字擺在那里；文檔翻譯得好不好，讀者一眼就能看出來；代碼能不能跑，CI 說了算。影響力多大，可以看 Star、PV、UV。

老馮的文檔站月 PV 6000 萬了…（當然大部分是 Agent 請求）

反過來看那些 Tokenmaxxing 選手們在干什么呢？讓 Agent“寫個操作系統”，跑一晚上產出一堆垃圾代碼；或者讓它“做個深度研究”，空轉幾小時刷出一份沒人會看的報告。Token 計數器轉得飛快，rm -rf 也用得飛快。這不叫使用 AI，這叫浪費能源。

帶著目標在用工具，還是為了用工具而用工具？前者是生產力，后者是行為藝術。

個體 vs. 組織：一道結構性的鴻溝

道理誰都懂，但為什么 Tokenmaxxing 還是在大公司里蔚然成風？

因為 OPC 自己用 AI，是按產出驅動的。翻了幾篇文章、寫了多少可用代碼、解決了什么問題，心里清清楚楚。不需要任何代理指標，你騙不了自己。

而組織就不行了。平庸的管理者無法直接感知每個人的產出質量，必須依賴可量化的中間指標進行考核與激勵。而可量化的中間指標恰恰是最容易被操縱的，這是科層制的結構性缺陷。代碼行數、PR 數量、會議時長，現在輪到 Token 消耗量了，本質上都是同一出戲的不同演員。

公平地說，從 0 到 1 的階段，公司強推 AI 使用，初衷是可以理解的。很多人確實有惰性，不推一把不會動。但一旦變成排行榜和考核指標，就必然滑向荒誕。

最終，這種管理上的無能只是過渡階段。正如體面的軟件公司很快拋棄了代碼行數考核，未來衡量 AI 使用效果的方式也會回歸到產出本身：你用這些 Token 帶來了什么，交付了什么，節省了多少時間和成本。

至于到處曬 Token 消耗的朋友，老馮只想說一句：

別曬油耗了，不如曬曬你到哪了。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.