![]()
作者 | 博雯
編輯 | 張潔
最近Codex來了波大更新,直接接管了谷歌瀏覽器,整個AI圈又玩嗨了。
有人拿它做多人在線小游戲,有人拿它編學(xué)術(shù)PPT,甚至還有個叫Chris的開發(fā)者給Codex丟下一條“去掙5美元”的指令,結(jié)果22小時(shí)內(nèi),Codex居然真自己找了個開源安全審計(jì)的賞金路徑,完成并提交了PR,16美元就這么成功到賬。
![]()
這一下可真在開發(fā)者圈子炸了鍋了,Chris這條帖子短短一天就超過了上百萬瀏覽量,奧特曼看到估計(jì)都要笑開花了。
畢竟在去年年初,奧特曼就預(yù)言說,2025年可能看到第一批AI智能體“加入勞動力大軍”,并實(shí)質(zhì)性改變公司產(chǎn)出。
現(xiàn)在看來,自家的Codex似乎成為了他最好的證據(jù)。
奧特曼顯然也對Codex十分滿意,就在今年五一假期前,他就發(fā)帖稱“Codex正在經(jīng)歷一個ChatGPT時(shí)刻”,一句話獲得97萬閱讀。
![]()
這句話發(fā)出一周后,Codex谷歌瀏覽器插件于5月8日正式推出,在AI圈掀起一陣熱潮。
事實(shí)上,從4月30日奧特曼這句話之后,Codex的下載量就開始暴漲。根據(jù)海外AI數(shù)據(jù)平臺TickerTrends,從4月30日到5月3日,Codex的npm下載量達(dá)到8610萬次,周環(huán)比暴漲1397%。而到了5月8日,這個數(shù)字進(jìn)一步攀升至單周9000萬。
相對應(yīng)的,老對頭Claude Code則跌至720萬次。
![]()
也難怪在X、抖音、小紅書等多個社區(qū),Codex已經(jīng)成了不少開發(fā)者口中“腳踩Claude Code”“干翻所有AI瀏覽器”的存在了……
那么,Codex新功能真有那么厲害嗎?“AI新榜”也進(jìn)行了一波實(shí)測。
![]()
0代碼生成小游戲?
響應(yīng)速度較慢,仍面向?qū)I(yè)程序員
這次Codex最核心的更新,就是上線了谷歌瀏覽器插件——讓用戶在桌面,即可操控以前需要打開網(wǎng)頁才能使用的功能,比如測試Web應(yīng)用、看控制臺、調(diào)試、登錄各種內(nèi)部系統(tǒng)等等。
而且它可以打開多個標(biāo)簽并行處理,不會霸占瀏覽器,不影響人工同時(shí)操作電腦。
對于一天大部分工作時(shí)間都泡在瀏覽器上的現(xiàn)代人來說,這聽起來確實(shí)很讓人興奮。
![]()
官方演示里也給了一個挺有意思的案例,用Codex控制谷歌瀏覽器,同時(shí)派出4個AI子代理,用各自的瀏覽器標(biāo)簽頁一起玩一個多人畫圖游戲。
這就和以前見到的AI編程不一樣了,不僅是測試代碼成果,還能協(xié)調(diào)多個AI代理并行測試復(fù)雜的網(wǎng)頁交互場景,比如多人協(xié)作/多人在線應(yīng)用這種人工測試比較麻煩的流程。
于是我們模仿這個官方案例,做了一個“胡鬧廚房mini版”,同樣設(shè)置了四個玩家位,分別負(fù)責(zé)切菜、傳菜、滅火、收錢,由系統(tǒng)隨機(jī)生成客人需求,四個玩家共同配合出餐。
和官方演示稍有不同的是,它直接新增了一個多人測試臺,同時(shí)打開了四個真實(shí)的客戶端頁面,點(diǎn)擊“開始四人協(xié)作”之后就能看到四個頁面并排運(yùn)行:P1切菜、P2傳菜、P3滅火、P4收錢,各自做自己的事,每個操作都會實(shí)時(shí)同步到其他頁面。
雖然最后生成的結(jié)果是不錯的,但實(shí)際上在過程中,我們差點(diǎn)跟Codex吵起來。
一個是未經(jīng)優(yōu)化的Codex會隨著會話加長,性能慢慢下滑,因此在編寫代碼的過程中,平均響應(yīng)速度算不上快。
另一個,由于并非專業(yè)編程人士,哪怕整個過程中我們可以不寫一行代碼,但對于Codex不斷拋出的“重啟服務(wù)器窗口”“將命令行在終端執(zhí)行”之類的請求,我們只能不斷反問,這些對技術(shù)人員堪稱“常識”的話到底是什么意思。
重復(fù)太多次,不禁升起一種對自身智商的羞愧,差點(diǎn)氣急敗壞地對著Codex罵起來。
冷靜下來再思索,到底哪些場景非要頻繁地用Agent去操作瀏覽器,讀取本地文件呢?內(nèi)容創(chuàng)作者的實(shí)用場景可能不多,真正用得上的還是前端測試、調(diào)試驗(yàn)證、檢查日志、PR review等面向開發(fā)者的場景。
所以Codex的目標(biāo)受眾很明確——仍然是面向?qū)I(yè)的程序員,或至少有一定編程經(jīng)驗(yàn)的個人開發(fā)者。對于此前沒有任何經(jīng)驗(yàn)的普通人來說,還是很難達(dá)到“一句話出一個小游戲”那樣驚艷的效果,更不用說能大幅度地提高工作效率。
再看這次Codex發(fā)布后的技術(shù)社區(qū),也出現(xiàn)不少論戰(zhàn)。最激烈的就是——Codex和Claude Code相比到底誰強(qiáng)?
畢竟此前奧特曼自己也暴言:如果世界將只剩下兩個AI編程智能體,那將是Claude Code和Codex——于是社區(qū)里的爭論,就更加甚囂塵上。
獵豹集團(tuán)CEO傅盛就發(fā)帖,表示自己還是覺得“Claude Code更強(qiáng)”,在評論區(qū)引發(fā)大范圍討論。
![]()
不少博主的觀點(diǎn)是:在一次性腳本、算法題,或者demo級web應(yīng)用上,確實(shí)是Codex的推理密度更高,但一旦進(jìn)入長期開發(fā)中,要維護(hù)三個月,要多輪修改,要保持對上下文和風(fēng)格的長期記憶時(shí),Claude code的優(yōu)勢就出來了。
也有評論總結(jié)了兩個產(chǎn)品的不同:
![]()
![]()
實(shí)測選題、輿情分析、行文邏輯:
有驚喜,但也有平替
而在代碼能力之外,一個新出的AI工具最直接的影響,就是能否嵌入普通人的工作流,實(shí)打?qū)嵉靥嵘ぷ餍省?/p>
作為新媒體人,每天最重要的就是選題。
直接丟給它過往500多篇稿件和常年積累下來的一眾選題渠道,包括公眾號、自媒體(抖音/X)博主、國內(nèi)外的新聞網(wǎng)站、以及多個技術(shù)論壇。
最終得到了一份今日新聞的推送,一共8個選題。
![]()
![]()
![]()
說實(shí)話,還不錯,內(nèi)容都符合我們過往的選題范圍,分了“快選題”和“深度選題”兩個版塊,也標(biāo)注了各自的信源。
但實(shí)際上,受限于部分渠道本身反爬蟲、內(nèi)容折疊、風(fēng)控等限制,Codex推送的選題其實(shí)并不全面。同時(shí),在對選題的取舍上,人常常會帶有一些微妙而模糊的判斷,有時(shí)候是對于選題重磅程度的判斷,有時(shí)候又是對于某種行業(yè)現(xiàn)象的更深層的思考。在這些較為模糊的地方,Codex還并無法將其很清晰地量化出來。
其次,對某個具體選題進(jìn)行分析。
比如,我們要做一個關(guān)于“追覓俞浩”的社交媒體輿情分析,寫篇文章。
![]()
Codex可以直接生成輿情分析,用圖表進(jìn)行表達(dá)。這個圖表雖然算不上非常有設(shè)計(jì)感,但也不用像過往那樣,還要再全網(wǎng)尋覓一個好用又免費(fèi)的在線圖表制作工具,而是直接在一個對話框里就全都能完成了。
![]()
最后在生成具體文字內(nèi)容上,我們直接讓Codex幫忙打包了電腦本地囤積的大量本地文檔稿件,并總結(jié)了過往的所有文檔資料,體量共超過200M。
![]()
最后讓它生成的帶有自我風(fēng)格的寫作skill,說實(shí)話還蠻驚喜的。
因?yàn)樗皇菣C(jī)械復(fù)制某篇文章,而是進(jìn)行全量語義分析。把所有歷史文檔的結(jié)構(gòu)、主題、關(guān)注的選題、開篇的寫法,乃至自媒體人常用的“反轉(zhuǎn)”等結(jié)構(gòu),都進(jìn)行了精準(zhǔn)總結(jié),它甚至敏銳地挖掘了測試文章結(jié)尾中,那些常用來調(diào)動情緒的“套路”。
當(dāng)然,文字內(nèi)容的生成效果需要長期實(shí)操選題才能有比較清晰的感受,每個人都有各自的主觀偏好。
![]()
但有亮點(diǎn),不等于完全可以替代內(nèi)容創(chuàng)作者目前用的產(chǎn)品。
Codex的本地電腦操控、控制瀏覽器等功能,此前國內(nèi)云廠商集成的龍蝦,還有很多國內(nèi)外大廠推出的桌面版Agent,也都能實(shí)現(xiàn)。
而在涉及到專業(yè)內(nèi)容的生成,比如用內(nèi)置的remotion插件生成具有科技感的視頻片段,或者通過風(fēng)格化的寫作skill生成稿件,離媒體質(zhì)量要求還有距離,且仍需要專業(yè)人士全程監(jiān)控,沒法真的做到“撒手不管”。
更何況,不管是剪輯素材的搜尋,還是寫作選題的尋找,Codex都無法做到全覆蓋所有渠道,而這些前期的搜尋與準(zhǔn)備工作,恰恰是媒體人工作中最消耗時(shí)間的部分之一。
更重要的是,國內(nèi)跑Codex比較慢,而且非常耗Token。作為GPT初級會員,我們只是跑了上述關(guān)于俞浩的一條內(nèi)容,用量就已經(jīng)消耗了近2%。
總之,對內(nèi)容創(chuàng)作者而言,Codex有新意,可也有相對低成本的解決方案。
![]()
不僅有賣萌桌寵能做學(xué)術(shù)PTT,還能自己打工賺錢
而除了代碼與內(nèi)容能力之外,其他有趣的玩法也不少。
比如這次Codex就新上線了一個桌面寵物功能,通過左下角的設(shè)置-外觀-寵物,就可以喚起一個像素風(fēng)的桌面寵物,實(shí)時(shí)反應(yīng)Codex的回應(yīng)狀態(tài)。
而點(diǎn)擊寵物,可以快速打開Codex主界面;鼠標(biāo)放上去會有交互動畫;Codex在忙的時(shí)候,寵物可能會撓頭、展示忙碌動畫;在你輸入時(shí),寵物會安靜待機(jī);而當(dāng)Codex終于返回結(jié)果時(shí),寵物就會揮手提醒你去審核。
![]()
除了內(nèi)置8個默認(rèn)寵物,你還可以登錄官方提供的社區(qū)寵物畫廊平臺Petdex,里面已開源了幾百款,包括某只死鳥(多鄰國)、禰豆子、菲比啾比,還有咕咕嘎嘎……
![]()
一個寵物通常搭載九種狀態(tài),每種動畫狀態(tài)都做得很精致。
![]()
而廣大用戶們也不滿足于此,圍繞“電子寵物”開發(fā)出了更多玩法。
比如在小紅書,就興起了一股“用Codex將我家小貓住進(jìn)電腦”的熱潮,一眾用戶紛紛把自家小貓的照片直接丟給Codex,讓小貓的電子形象陪著自己上班。其中播放量最高的超過70萬閱讀,小紅書4.5萬點(diǎn)贊,抖音也有超過1萬贊。
在視頻演示中,電子小貓一般會在程序塢或者任務(wù)欄里住著,也可以直接將貓拖動到任務(wù)欄上,讓其在邊框來回走動,玩耍,伸懶腰。
![]()
此外,用Codex做學(xué)術(shù)PPT的玩法也火了起來,小紅書和抖音出現(xiàn)了多條萬贊視頻,基本上都是直接輸入學(xué)術(shù)內(nèi)容,Codex就能生成一整套PPT的outline,確認(rèn)無誤后再直接生成圖片。
![]()
生成的效果也是各種風(fēng)格都有,看起來相當(dāng)專業(yè)。
有博主提出,可以讓Codex再寫一個skill,將這些圖片再轉(zhuǎn)換為可編輯的VBA狀態(tài)。還有博主提出,可以使用Codex本體+內(nèi)置插件image2+內(nèi)置插件presentations,從項(xiàng)目經(jīng)理到視覺素材生產(chǎn),再到PPT排版和導(dǎo)出,一條龍做好PPT。
![]()
最后再說說開頭提到的Codex“自主打工第一單”。
根據(jù)Chris在X發(fā)帖公布的流程,在收到“去GitHub上找活賺錢,目標(biāo)5美元”的指令后,Codex便定位到一個bounty(賞金)平臺,讀代碼、改代碼、提交拉取請求(PR)、和維護(hù)者來回回復(fù)評論,最終在PR合并和驗(yàn)證流程完成幾天后,Chris收到了16.88美元付款。
![]()
Chris說,這次總共跑了約10-15個安全審計(jì)項(xiàng)目,消耗了22M tokens。根據(jù)OpenAI API公開定價(jià)是輸出30美元/1M tokens,輸入是5美元/1M tokens。如果按照這個成本來算的話,這單生意看著似乎又沒那么劃算了。
不過Chris也在后續(xù)的跟帖中說,現(xiàn)在的重點(diǎn)根本不是能不能盈利,而是GPT-5.5未來的價(jià)格還會再降。等到未來模型成本越來越低,這條商業(yè)閉環(huán),也就能越來越便宜地被跑通。
說白了,重要的不是一條現(xiàn)在就成熟的商業(yè)路徑,而是“有東西跑通了”的信號。
![]()
整體來看,Codex這次更新確實(shí)是一次AI編程工具突破能力邊界的新嘗試。
對程序員來說,它是一個值得嘗試的新玩具;對內(nèi)容創(chuàng)作者來說,它是一個有趣的補(bǔ)充,但也遠(yuǎn)沒有到"讓所有人扔掉手頭工具"的程度。
至于那個像素風(fēng)桌寵——好吧,這可能是我們整個測評過程中最不想關(guān)掉的功能了。
歡迎分享、點(diǎn)贊、推薦
一起研究AI
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.