老馮的朋友蔣老板最近迷上了在群里炫耀自己一天燒了幾億 Token。經常截個圖往群里一甩,“完蛋了,我又有了一個新 Idea” 。做了什么呢?一會搞個本體論數據庫,一會整個 Bigsty 用 Go 復刻 Pigsty。那神情就跟在朋友圈曬跑步公里數一樣,讓老馮看著不禁莞爾。
硅谷新運動:Tokenmaxxing
上周,Meta 內部一個叫“Claudeonomics”的排行榜被曝光了。這名字本身就很搞笑,用競品 Anthropic 的 Claude 來命名自家排行榜,也算是一種行為藝術。
這個排行榜覆蓋了 Meta 的 8.5 萬名員工,30 天內總消耗超過 60 萬億 Token。排名第一的選手,一個人平均燒了 2810 億 Token。系統還設計了一套徽章體系:從青銅到翡翠,頭銜從“Cache Wizard”到“Session Immortal”,最高級的叫“Token Legend”。
![]()
多少有點傳奇。
怎么刷上去的呢?有員工讓 AI Agent 空轉好幾個小時跑“研究任務”來攢量。消息泄露兩天后,Meta 就把這個排行榜關了,留下一行通知:“本來是好玩的,但數據被外傳了,所以先關了哈。”
Meta 不是唯一一家。OpenAI 內部也有類似的排行榜,有人一周燒了 2100 億 Token。硅谷給這個現象起了個名字:Tokenmaxxing,“Token 最大化”。
各路大佬紛紛下場站臺。黃仁勛在 GTC 上說,未來每個工程師都應該有年度 Token 預算,大約是底薪的一半;如果一個年薪 50 萬美元的工程師一年連 25 萬美元的 Token 都沒燒掉,他會“深感不安”。Shopify 的 CEO 更直接:不用 AI 就別干了。有匿名員工爆料,他們公司每周有 AI 使用量門檻,達不到就走人。
一項新的辦公室政治運動,就這么轟轟烈烈地展開了。
古德哈特永不缺席
這種事在管理學上有個經典的名字,叫 古德哈特定律(Goodhart's Law):
一個指標一旦成為考核目標,它就不再是一個好指標。
Token 消耗量,作為一個中間過程指標,被拿來當作衡量“AI 使用深度”和“生產力提升”的代理變量。這件事從提出到腐敗,大概用了不到一個季度。可能是管理學史上腐敗速度最快的 KPI 之一。
沃頓商學院教授 Ethan Mollick 在評論這件事時,引用了一篇更老的論文:Steven Kerr 1975 年的經典《論獎勵 A 行為卻期望 B 結果的愚蠢》。公司想要的是 生產力提升,獎勵的卻是 Token 消耗量。這兩者之間有因果關系嗎?沒有人驗證過。大家默認“用得多 = 用得好”,就開始搞排行榜了。
燒 Token 是一件非常容易的事。你讓 Agent 去干一件不可能完成的任務,“給我寫個操作系統,寫不出來不要停”,開幾個并行跑著,一天之內多少 Token 都能燒完。我敢說,如果比賽規則是“誰燒 Token 多誰贏”,一個實習生都能贏過 Linus Torvalds。
這跟用 代碼行數 衡量程序員水平有什么區別?老馮用 npm install 裝一個腳手架,幾百萬行代碼瞬間到項目里, 提交到 GitHub 上,是不是看起來特別能干,吊打才 170 萬行代碼量的 PostgreSQL 項目?
體面一點的軟件公司都不會用代碼行數考核工程師。這種事讓內行看了笑掉大牙,但外行管理者偏偏就吃這套。如果非要打個比方,這就是 用油耗衡量司機水平。老司機開得省油還到得快,新手油門踩到底還走錯路。誰油耗高?
誰在鼓勵你多燒?
想清楚一個問題:Tokenmaxxing 對誰最有利?
對 AI 廠商和云廠商最有利。
Ramp 的數據顯示,企業 Token 支出自 2025 年 1 月以來增長了 13 倍。黃仁勛鼓吹 Token 預算,本質上是在說“多買我的 GPU”。Sam Altman 暢想“全民基本算力”(Universal Basic Compute),本質上也是在說“以后每個人都要給我交電費”。
這就是賣鏟子的人鼓勵大家拼命挖礦。每一個 Token 都對應著真實的 GPU 算力和電力消耗。空轉的 Agent 不生產任何價值,但電費是實實在在的。把 Token 燒在無意義的任務上,跟打開水龍頭看水流就覺得“我在用水”一樣荒謬。
當然,這種表演性消費確實在一定程度上放大了 AI 需求的泡沫信號。CNBC 專門討論過:如果硅谷公司的 AI 用量中有相當比例是刷排行榜刷出來的,那華爾街看到的需求增長數據有多少是真的?
不過老馮的判斷是:這仍然是一場實實在在的生產力革命,tokenmaxxing 雖然注了點水,但底層的價值創造是真實的。泡沫會擠掉,但趨勢不會逆轉。
Token 花在哪才值?
。我基本不會去看自己燒了多少 Token,燒完訂閱拉倒。之前倒是考慮要不要再去開倆訂閱,不過最近 Codex 有翻倍活動,差不多夠用了。
最近老馮用這些 Token 干了不少事兒。比如最近兩天,我收錄了 40 多個新的 PG 擴展,修復移植了一些老擴展,將 Pigsty 里的可用擴展數量擴充到了 503 個。
![]()
同時我還將,過千 Star,過萬下載,。,,,翻譯成英文。我覺得這些都是實打實的價值與產出。這個 Token 訂閱費花得太值了。
這里面有個共同點:每件事都有 明確的、可驗證的交付物。擴展收錄了多少個,數字擺在那里;文檔翻譯得好不好,讀者一眼就能看出來;代碼能不能跑,CI 說了算。影響力多大,可以看 Star、PV、UV。
![]()
老馮的文檔站月 PV 6000 萬了…(當然大部分是 Agent 請求)
反過來看那些 Tokenmaxxing 選手們在干什么呢?讓 Agent“寫個操作系統”,跑一晚上產出一堆垃圾代碼;或者讓它“做個深度研究”,空轉幾小時刷出一份沒人會看的報告。Token 計數器轉得飛快,rm -rf 也用得飛快。這不叫使用 AI,這叫浪費能源。
帶著目標在用工具,還是為了用工具而用工具?前者是生產力,后者是行為藝術。
個體 vs. 組織:一道結構性的鴻溝
道理誰都懂,但為什么 Tokenmaxxing 還是在大公司里蔚然成風?
因為 OPC 自己用 AI,是按 產出 驅動的。翻了幾篇文章、寫了多少可用代碼、解決了什么問題,心里清清楚楚。不需要任何代理指標,你騙不了自己。
而組織就不行了。平庸的管理者無法直接感知每個人的產出質量,必須依賴可量化的中間指標進行考核與激勵。 而可量化的中間指標恰恰是最容易被操縱的,這是科層制的結構性缺陷。 代碼行數、PR 數量、會議時長,現在輪到 Token 消耗量了,本質上都是同一出戲的不同演員。
公平地說,從 0 到 1 的階段,公司強推 AI 使用,初衷是可以理解的。很多人確實有惰性,不推一把不會動。但一旦變成排行榜和考核指標,就必然滑向荒誕。
最終,這種管理上的無能只是過渡階段。正如體面的軟件公司很快拋棄了代碼行數考核,未來衡量 AI 使用效果的方式也會回歸到產出本身: 你用這些 Token 帶來了什么,交付了什么,節省了多少時間和成本。
至于到處曬 Token 消耗的朋友,老馮只想說一句:
別曬油耗了,不如曬曬你到哪了。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.