Codex正經(jīng)歷GPT時(shí)刻？我們更關(guān)心的是它居然能自己賺錢 | AI實(shí)測

2026-05-12 19:27:54　來源: 頭號AI玩家

上海舉報(bào)

分享至

作者 | 博雯

編輯 | 張潔

最近Codex來了波大更新，直接接管了谷歌瀏覽器，整個AI圈又玩嗨了。

有人拿它做多人在線小游戲，有人拿它編學(xué)術(shù)PPT，甚至還有個叫Chris的開發(fā)者給Codex丟下一條“去掙5美元”的指令，結(jié)果22小時(shí)內(nèi)，Codex居然真自己找了個開源安全審計(jì)的賞金路徑，完成并提交了PR，16美元就這么成功到賬。

這一下可真在開發(fā)者圈子炸了鍋了，Chris這條帖子短短一天就超過了上百萬瀏覽量，奧特曼看到估計(jì)都要笑開花了。

畢竟在去年年初，奧特曼就預(yù)言說，2025年可能看到第一批AI智能體“加入勞動力大軍”，并實(shí)質(zhì)性改變公司產(chǎn)出。

現(xiàn)在看來，自家的Codex似乎成為了他最好的證據(jù)。

奧特曼顯然也對Codex十分滿意，就在今年五一假期前，他就發(fā)帖稱“Codex正在經(jīng)歷一個ChatGPT時(shí)刻”，一句話獲得97萬閱讀。

這句話發(fā)出一周后，Codex谷歌瀏覽器插件于5月8日正式推出，在AI圈掀起一陣熱潮。

事實(shí)上，從4月30日奧特曼這句話之后，Codex的下載量就開始暴漲。根據(jù)海外AI數(shù)據(jù)平臺TickerTrends，從4月30日到5月3日，Codex的npm下載量達(dá)到8610萬次，周環(huán)比暴漲1397%。而到了5月8日，這個數(shù)字進(jìn)一步攀升至單周9000萬。

相對應(yīng)的，老對頭Claude Code則跌至720萬次。

也難怪在X、抖音、小紅書等多個社區(qū)，Codex已經(jīng)成了不少開發(fā)者口中“腳踩Claude Code”“干翻所有AI瀏覽器”的存在了……

那么，Codex新功能真有那么厲害嗎？“AI新榜”也進(jìn)行了一波實(shí)測。

0代碼生成小游戲？

響應(yīng)速度較慢，仍面向?qū)I(yè)程序員

這次Codex最核心的更新，就是上線了谷歌瀏覽器插件——讓用戶在桌面，即可操控以前需要打開網(wǎng)頁才能使用的功能，比如測試Web應(yīng)用、看控制臺、調(diào)試、登錄各種內(nèi)部系統(tǒng)等等。

而且它可以打開多個標(biāo)簽并行處理，不會霸占瀏覽器，不影響人工同時(shí)操作電腦。

對于一天大部分工作時(shí)間都泡在瀏覽器上的現(xiàn)代人來說，這聽起來確實(shí)很讓人興奮。

官方演示里也給了一個挺有意思的案例，用Codex控制谷歌瀏覽器，同時(shí)派出4個AI子代理，用各自的瀏覽器標(biāo)簽頁一起玩一個多人畫圖游戲。

這就和以前見到的AI編程不一樣了，不僅是測試代碼成果，還能協(xié)調(diào)多個AI代理并行測試復(fù)雜的網(wǎng)頁交互場景，比如多人協(xié)作/多人在線應(yīng)用這種人工測試比較麻煩的流程。

于是我們模仿這個官方案例，做了一個“胡鬧廚房mini版”，同樣設(shè)置了四個玩家位，分別負(fù)責(zé)切菜、傳菜、滅火、收錢，由系統(tǒng)隨機(jī)生成客人需求，四個玩家共同配合出餐。

和官方演示稍有不同的是，它直接新增了一個多人測試臺，同時(shí)打開了四個真實(shí)的客戶端頁面，點(diǎn)擊“開始四人協(xié)作”之后就能看到四個頁面并排運(yùn)行：P1切菜、P2傳菜、P3滅火、P4收錢，各自做自己的事，每個操作都會實(shí)時(shí)同步到其他頁面。

雖然最后生成的結(jié)果是不錯的，但實(shí)際上在過程中，我們差點(diǎn)跟Codex吵起來。

一個是未經(jīng)優(yōu)化的Codex會隨著會話加長，性能慢慢下滑，因此在編寫代碼的過程中，平均響應(yīng)速度算不上快。

另一個，由于并非專業(yè)編程人士，哪怕整個過程中我們可以不寫一行代碼，但對于Codex不斷拋出的“重啟服務(wù)器窗口”“將命令行在終端執(zhí)行”之類的請求，我們只能不斷反問，這些對技術(shù)人員堪稱“常識”的話到底是什么意思。

重復(fù)太多次，不禁升起一種對自身智商的羞愧，差點(diǎn)氣急敗壞地對著Codex罵起來。

冷靜下來再思索，到底哪些場景非要頻繁地用Agent去操作瀏覽器，讀取本地文件呢？內(nèi)容創(chuàng)作者的實(shí)用場景可能不多，真正用得上的還是前端測試、調(diào)試驗(yàn)證、檢查日志、PR review等面向開發(fā)者的場景。

所以Codex的目標(biāo)受眾很明確——仍然是面向?qū)I(yè)的程序員，或至少有一定編程經(jīng)驗(yàn)的個人開發(fā)者。對于此前沒有任何經(jīng)驗(yàn)的普通人來說，還是很難達(dá)到“一句話出一個小游戲”那樣驚艷的效果，更不用說能大幅度地提高工作效率。

再看這次Codex發(fā)布后的技術(shù)社區(qū)，也出現(xiàn)不少論戰(zhàn)。最激烈的就是——Codex和Claude Code相比到底誰強(qiáng)？

畢竟此前奧特曼自己也暴言：如果世界將只剩下兩個AI編程智能體，那將是Claude Code和Codex——于是社區(qū)里的爭論，就更加甚囂塵上。

獵豹集團(tuán)CEO傅盛就發(fā)帖，表示自己還是覺得“Claude Code更強(qiáng)”，在評論區(qū)引發(fā)大范圍討論。

不少博主的觀點(diǎn)是：在一次性腳本、算法題，或者demo級web應(yīng)用上，確實(shí)是Codex的推理密度更高，但一旦進(jìn)入長期開發(fā)中，要維護(hù)三個月，要多輪修改，要保持對上下文和風(fēng)格的長期記憶時(shí)，Claude code的優(yōu)勢就出來了。

也有評論總結(jié)了兩個產(chǎn)品的不同：

實(shí)測選題、輿情分析、行文邏輯：

有驚喜，但也有平替

而在代碼能力之外，一個新出的AI工具最直接的影響，就是能否嵌入普通人的工作流，實(shí)打?qū)嵉靥嵘ぷ餍省?/p>

作為新媒體人，每天最重要的就是選題。

直接丟給它過往500多篇稿件和常年積累下來的一眾選題渠道，包括公眾號、自媒體（抖音/X）博主、國內(nèi)外的新聞網(wǎng)站、以及多個技術(shù)論壇。

最終得到了一份今日新聞的推送，一共8個選題。

說實(shí)話，還不錯，內(nèi)容都符合我們過往的選題范圍，分了“快選題”和“深度選題”兩個版塊，也標(biāo)注了各自的信源。

但實(shí)際上，受限于部分渠道本身反爬蟲、內(nèi)容折疊、風(fēng)控等限制，Codex推送的選題其實(shí)并不全面。同時(shí)，在對選題的取舍上，人常常會帶有一些微妙而模糊的判斷，有時(shí)候是對于選題重磅程度的判斷，有時(shí)候又是對于某種行業(yè)現(xiàn)象的更深層的思考。在這些較為模糊的地方，Codex還并無法將其很清晰地量化出來。

其次，對某個具體選題進(jìn)行分析。

比如，我們要做一個關(guān)于“追覓俞浩”的社交媒體輿情分析，寫篇文章。

Codex可以直接生成輿情分析，用圖表進(jìn)行表達(dá)。這個圖表雖然算不上非常有設(shè)計(jì)感，但也不用像過往那樣，還要再全網(wǎng)尋覓一個好用又免費(fèi)的在線圖表制作工具，而是直接在一個對話框里就全都能完成了。

最后在生成具體文字內(nèi)容上，我們直接讓Codex幫忙打包了電腦本地囤積的大量本地文檔稿件，并總結(jié)了過往的所有文檔資料，體量共超過200M。

最后讓它生成的帶有自我風(fēng)格的寫作skill，說實(shí)話還蠻驚喜的。

因?yàn)樗皇菣C(jī)械復(fù)制某篇文章，而是進(jìn)行全量語義分析。把所有歷史文檔的結(jié)構(gòu)、主題、關(guān)注的選題、開篇的寫法，乃至自媒體人常用的“反轉(zhuǎn)”等結(jié)構(gòu)，都進(jìn)行了精準(zhǔn)總結(jié)，它甚至敏銳地挖掘了測試文章結(jié)尾中，那些常用來調(diào)動情緒的“套路”。

當(dāng)然，文字內(nèi)容的生成效果需要長期實(shí)操選題才能有比較清晰的感受，每個人都有各自的主觀偏好。

但有亮點(diǎn)，不等于完全可以替代內(nèi)容創(chuàng)作者目前用的產(chǎn)品。

Codex的本地電腦操控、控制瀏覽器等功能，此前國內(nèi)云廠商集成的龍蝦，還有很多國內(nèi)外大廠推出的桌面版Agent，也都能實(shí)現(xiàn)。

而在涉及到專業(yè)內(nèi)容的生成，比如用內(nèi)置的remotion插件生成具有科技感的視頻片段，或者通過風(fēng)格化的寫作skill生成稿件，離媒體質(zhì)量要求還有距離，且仍需要專業(yè)人士全程監(jiān)控，沒法真的做到“撒手不管”。

更何況，不管是剪輯素材的搜尋，還是寫作選題的尋找，Codex都無法做到全覆蓋所有渠道，而這些前期的搜尋與準(zhǔn)備工作，恰恰是媒體人工作中最消耗時(shí)間的部分之一。

更重要的是，國內(nèi)跑Codex比較慢，而且非常耗Token。作為GPT初級會員，我們只是跑了上述關(guān)于俞浩的一條內(nèi)容，用量就已經(jīng)消耗了近2%。

總之，對內(nèi)容創(chuàng)作者而言，Codex有新意，可也有相對低成本的解決方案。

不僅有賣萌桌寵能做學(xué)術(shù)PTT，還能自己打工賺錢

而除了代碼與內(nèi)容能力之外，其他有趣的玩法也不少。

比如這次Codex就新上線了一個桌面寵物功能，通過左下角的設(shè)置-外觀-寵物，就可以喚起一個像素風(fēng)的桌面寵物，實(shí)時(shí)反應(yīng)Codex的回應(yīng)狀態(tài)。

而點(diǎn)擊寵物，可以快速打開Codex主界面；鼠標(biāo)放上去會有交互動畫；Codex在忙的時(shí)候，寵物可能會撓頭、展示忙碌動畫；在你輸入時(shí)，寵物會安靜待機(jī)；而當(dāng)Codex終于返回結(jié)果時(shí)，寵物就會揮手提醒你去審核。

除了內(nèi)置8個默認(rèn)寵物，你還可以登錄官方提供的社區(qū)寵物畫廊平臺Petdex，里面已開源了幾百款，包括某只死鳥（多鄰國）、禰豆子、菲比啾比，還有咕咕嘎嘎……

一個寵物通常搭載九種狀態(tài)，每種動畫狀態(tài)都做得很精致。

而廣大用戶們也不滿足于此，圍繞“電子寵物”開發(fā)出了更多玩法。

比如在小紅書，就興起了一股“用Codex將我家小貓住進(jìn)電腦”的熱潮，一眾用戶紛紛把自家小貓的照片直接丟給Codex，讓小貓的電子形象陪著自己上班。其中播放量最高的超過70萬閱讀，小紅書4.5萬點(diǎn)贊，抖音也有超過1萬贊。

在視頻演示中，電子小貓一般會在程序塢或者任務(wù)欄里住著，也可以直接將貓拖動到任務(wù)欄上，讓其在邊框來回走動，玩耍，伸懶腰。

此外，用Codex做學(xué)術(shù)PPT的玩法也火了起來，小紅書和抖音出現(xiàn)了多條萬贊視頻，基本上都是直接輸入學(xué)術(shù)內(nèi)容，Codex就能生成一整套PPT的outline，確認(rèn)無誤后再直接生成圖片。

生成的效果也是各種風(fēng)格都有，看起來相當(dāng)專業(yè)。

有博主提出，可以讓Codex再寫一個skill，將這些圖片再轉(zhuǎn)換為可編輯的VBA狀態(tài)。還有博主提出，可以使用Codex本體+內(nèi)置插件image2+內(nèi)置插件presentations，從項(xiàng)目經(jīng)理到視覺素材生產(chǎn)，再到PPT排版和導(dǎo)出，一條龍做好PPT。

最后再說說開頭提到的Codex“自主打工第一單”。

根據(jù)Chris在X發(fā)帖公布的流程，在收到“去GitHub上找活賺錢，目標(biāo)5美元”的指令后，Codex便定位到一個bounty（賞金）平臺，讀代碼、改代碼、提交拉取請求（PR）、和維護(hù)者來回回復(fù)評論，最終在PR合并和驗(yàn)證流程完成幾天后，Chris收到了16.88美元付款。

Chris說，這次總共跑了約10-15個安全審計(jì)項(xiàng)目，消耗了22M tokens。根據(jù)OpenAI API公開定價(jià)是輸出30美元/1M tokens，輸入是5美元/1M tokens。如果按照這個成本來算的話，這單生意看著似乎又沒那么劃算了。

不過Chris也在后續(xù)的跟帖中說，現(xiàn)在的重點(diǎn)根本不是能不能盈利，而是GPT-5.5未來的價(jià)格還會再降。等到未來模型成本越來越低，這條商業(yè)閉環(huán)，也就能越來越便宜地被跑通。

說白了，重要的不是一條現(xiàn)在就成熟的商業(yè)路徑，而是“有東西跑通了”的信號。

整體來看，Codex這次更新確實(shí)是一次AI編程工具突破能力邊界的新嘗試。

對程序員來說，它是一個值得嘗試的新玩具；對內(nèi)容創(chuàng)作者來說，它是一個有趣的補(bǔ)充，但也遠(yuǎn)沒有到"讓所有人扔掉手頭工具"的程度。

至于那個像素風(fēng)桌寵——好吧，這可能是我們整個測評過程中最不想關(guān)掉的功能了。

歡迎分享、點(diǎn)贊、推薦

一起研究AI

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.