<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      GPT-5.4發布,最適合OpenClaw的天選模型登場了。

      0
      分享至

      深夜凌晨2點,我剛準備睡覺。

      然后,GPT-5.4,突然發布。


      一下子激動的睡不著了。

      真的,這真不是我天天咋咋呼呼啥的,我真的也很少會用激動的睡不著覺這種表述。

      這是因為,我一直在等正式版的GPT-5.3或者GPT-5.4,來作為我的OpenClaw的首選模型。

      理由特別簡單,因為現代世界三十年,本質上基層都是代碼,我們現在看到的關于計算機和互聯網的一切,幾乎都建立在代碼的基礎之上。

      所以你可以理解為,代碼能力,在很多時候,就代表著Agent能力的一根粗壯的腿。

      一個優秀的Agent基座模型,在我的理解里,一般來說,需要三種都很強:

      代碼能力、世界知識、多模態理解。

      當你這三個都能SOTA的時候,你幾乎必然就是最牛逼的Agent模型,當然,還有一個重要的因素,就是價格。

      在過去,Claude Opus 4.6,幾乎就是Agent模型的代名詞,因為代碼、世界知識都很強,多模態能力雖然比不過Seed 2.0和Gemini 3.1 Pro,但是在一些場景里面,也夠了,因為現在的Agent,跟現實物理交互還沒有那么多,那個已經是具身智能的范疇了。

      而我過去很喜歡的GPT-5.3-Codex,代碼能力確實強,在做任務執行的時候,那簡直就是指哪打哪。

      但是最大的問題,這玩意是一個編程特化模型啊,世界知識就是一坨屎,連GPT-5.2都不如,所以OpenAI當時也是沒辦法,為了跟Claude打一打,只能加個Codex的后綴給放出來了。

      所以你會發現,在規劃能力上,是完全比不過Claude Opus 4.6的,但是最大的問題,其實還是因為世界知識的問題,就導致這玩意。

      它說天書,講的那些話,真的,我不是程序員出身,我看那個話,看的就真的超級費勁。

      就比如說,我讓他之前對我的一個AI熱點網站的項目進行審查,主要就是review一下我的文檔規范和我整個代碼庫。

      然后,這哥們寫的文檔,我尼瑪。。。


      你再對比一下Claude Opus 4.6寫的。


      對比起來應該一目了然。。。

      就是因為這玩意不說人話,世界知識也不行,所以,只是在Codex里面用用還好,但是你要是把它接到你的OpenClaw里面,去當做默認模型,你就知道啥叫災難了,這哥們幾乎沒有人味,說起話來我想揍他。

      所以我當時試了一下,就直接棄了,還是在我的OpenClaw里面,用的Claude Opus 4.6和Sonnet 4.6,做了一下場景調用。

      那為啥說,我很期待GPT-5.4呢。

      因為,Claude哪都好,但是,它貴啊!!!

      它真的好貴啊!!!!!!

      而且因為Anthropic這個呆逼,它把OpenClaw給瘋了,所以我訂閱的Claude的Max Plan的額度,是完全不能給OpenClaw用的,只能在Claude Code用,你想在OpenClaw上用,只能硬接API Key用。

      但是大家都知道,Claude的API有多貴,那根本不是我們這種窮逼團隊能用的起的,小規模用用還好,大規模用那公司直接破產了。

      之前還有一條路是用反代,把Google家的Antigravity里面的Claude額度用插件代理出來,扔給OpenClaw用。


      但是后面Google開始大批量封號,導致也沒辦法用了。

      我過年的時候Google賬號還被封了,被迫用AI去給Google寫了一份聲淚俱下的郵件。


      我說我錯了,我再也不會了。

      后面Google才給我解封,但是反代肯定是用不了了。

      而OpenAI就不一樣了,最開始Claude瘋狂封OpenCode賬號的時候,OpenAI大手一揮,就站了出來,說我們不封,大家全力使用。


      這是御三家里,唯一一個這么支持態度的,可以用第三方的工具,調用Codex的額度的。

      那對OpenClaw自然也不例外了,也是幾個頂級模型里面,為數不多的,可以直接走登錄的,其他的都得用API。


      真的,OpenAI這會真的是大善人。

      還瘋狂的給Codex加額度。


      所以啊,Claude在OpenClaw里用,好是好,但是不能用訂閱額度,只能用API,貴的一筆。

      OpenAI的模型倒是可以用訂閱額度,但是GPT-5.2代碼又不行,GPT-5.3-codex又不說人話。

      你看,要多別扭有多別扭。

      而這一次,GPT-5.4來了!!!

      終于把這個短板給補上了!

      代碼能力跟GPT-5.3-Codex齊平,世界知識比GPT-5.2還要強,還能使用訂閱額度,20刀就可以用的超級爽。

      你就說,這不是最適合OpenClaw的天選模型,還有誰是?嗯?

      從今天開始,用OpenClaw的,都把默認模型切換到GPT-5.4去,真的,信我。

      回到GPT-5.4,老規矩,先看跑分。


      就很爽。

      先看最關鍵的幾個。

      GDPval:83.0%

      這個是測AI在真實工作任務中表現的,包括金融、法律等44種職業的知識工作。

      GPT-5.4 Thinking拿了83.0%,Claude Opus 4.6是78.0%,GPT-5.3 Codex是70.9%。

      在真實業務場景里,GPT-5.4不只是會寫代碼,它還能跟你聊業務、聊金融、聊法律、聊各種專業領域的東西。

      而且是用人話聊,不是用天書聊。

      SWE-Bench Pro:57.7%

      這個是測AI解決真實軟件工程問題的,不只是Python,而是測四種編程語言。

      GPT-5.4 Thinking拿了57.7%,GPT-5.3 Codex是56.8%。

      基本持平。

      這就是我最想看到的結果。

      代碼能力保住了GPT-5.3 Codex的水平,世界知識又補上來了。

      OSWorld-Verified也是,75.0%。這個是測AI操作電腦的能力的,就是讓AI像人一樣,用鼠標點擊、用鍵盤輸入、在不同應用之間切換,完成各種任務。

      GPT-5.4 Thinking拿了75.0%,超過了Claude Opus 4.6的72.7%,也保持了跟GPT-5.3-Codex的持平。

      而且,GPT-5.4操作電腦的速度,快的離譜。


      看下這個沒有加速過的視頻,會更直觀。

      ToolAthon:54.6%

      這個是測AI使用工具的能力的,也就是Agent能力的核心指標之一。

      GPT-5.4 Thinking拿了54.6%,Claude Opus 4.6是44.8%。

      差了將近10個點。

      至于學術知識之類的,跟GPT-5.3-codex就沒法比了,因為OpenAI自己也知道,所以,直接當時就沒跑。


      總之,翻譯成大白話就是。

      GPT-5.4 = GPT-5.3 Codex的代碼能力 + 比GPT-5.2還強的世界知識 + 更強的工具使用能力 + 超級便宜的codex額度。

      這四樣加在一起,就是一個完美的OpenClaw天選基座模型。

      然后還有幾個很棒的特性更新:

      1. 100萬token的上下文窗口。

      這是GPT-5.4的一個大升級。

      之前GPT-5.3的上下文窗口是40萬token,GPT-5.4直接翻了一倍多,到了100萬。

      這對Agent來說太重要了。

      因為Agent在執行任務的時候,需要保持對整個任務的上下文理解。如果上下文窗口不夠大,Agent干著干著就會忘事兒,前面說的東西后面就不記得了。

      100萬token,基本上足夠應對絕大部分的Agent任務了。

      當然,OpenAI也不傻,他們說,超過27萬token之后,你的額度就算兩倍了。


      不過因為Codex給的額度實在是太多太多了,所以即使是2倍,其實也還好。

      2. 原生計算機使用能力。

      這個是GPT-5.4的另一個大賣點。

      OpenAI說,GPT-5.4是他們第一個內置原生計算機使用能力的主線模型。

      它在編寫通過Playwright等庫操作計算機的代碼方面表現非常的出色,同時也能根據屏幕截圖發出鼠標和鍵盤命令。

      也就是代碼和視覺齊飛,我感覺,這個小龍蝦接入以后,就真的可以,直接用視覺,操控你電腦上絕大多數的軟件了,真的,原生操控,想想都激動。

      他們基于此,還發布了一個新的skills,叫playwright-interactive。

      允許Codex同時以代碼和視覺的兩種方式,調試Web和Electron應用。


      網址在此,大家可以自行安裝。

      https://github.com/openai/skills/tree/main/skills/.curated/playwright-interactive

      3. 支持了工具搜索。

      以前呢,當模型被賦予工具時,所有工具定義都會預先包含在提示中。

      對于擁有大量工具的系統,這可能會為每個請求增加數千甚至數萬個token,而且絕大多數的時候,都毫無意義,平白無故的導致成本上升、響應變慢,并在上下文中充斥模型可能永遠不會使用的信息。

      所以呢,這次他們也支持了工具搜索,就是GPT?5.4不再直接接收完整工具定義,而是接收一份可用工具的輕量列表以及工具搜索功能。

      當模型需要使用某個工具時,它可以查找該工具的定義并在當時將其追加到對話中。

      就非常像Skills漸進式呈現的方式,目的很簡單,還是優化上下文工程。

      OpenAI在自己測試完以后,發現工具搜索配置在保持相同準確率的同時將總體token使用量減少47%,這個就非常牛逼了。


      GPT-5.4 Thinking大概就是這樣。

      這次他們其實還發了個GPT-5.4 Pro,我就不細說了,反正就是一切都更牛逼了,但是對于大多數人來說,太貴了,也沒啥大用,必須得200刀的Pro會員才能用。

      API的整體價格還是得說一下,雖然大家大概率用的都會是訂閱的額度。


      相比于GPT-5.2,價格是漲了的,但是還是比Claude Opus 4.6,便宜不少,Claude Opus 4.6的價格是$5/$25每百萬token(輸入/輸出),GPT-5.4只有他們一半。

      目前ChatGPT已經上線了。


      Codex也已經支持了,我自己在Codex里面粗淺體驗了一下。


      首先撲面而來的,那自然是清新沁人的人話。。。

      比如我讓它去把OpenAI官網的視頻給扒拉下來,你看看這個發言:“這種活最煩”,“省的跟Cloudflare互相折壽”。。。


      還有這個。

      真的,Codex的輸出,我真的能看得懂了。。。


      做出來的東西,前端審美有了不錯的進步,但還是不如Opus 4.6和Gemini。


      寫作粗略測了一下,還是一股子莫名其妙的愛用排比句的詭異的味道。

      奇奇怪怪。

      然后有點可惜的就是,我等到了凌晨6點多,OpenClaw目前使用Codex登錄的方式,還是沒有支持GPT-5.4。


      這就導致,我還是沒有機會測GPT-5.4在小龍蝦上的效果。

      不過估計我一覺睡醒,估計小龍蝦就支持了。

      因為社區里已經看到很多用戶在催了,而且先行官們,都普遍反饋效果很好。

      坐等支持,我真的已經迫不及待了。

      又是開心的一晚。

      如果你也在用OpenClaw,那記得OpenClaw支持了以后,把默認模型切換到GPT-5.4。

      如果你還沒用過OpenClaw,那正好,現在是一個很好的開始時機。

      畢竟,有了GPT-5.4這個天選模型,體驗只會更好。

      2026年,真是瘋狂的一年啊。

      睡了。

      以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。

      >/ 作者:卡茲克

      >/ 投稿或爆料,請聯系郵箱:wzglyay@virxact.com

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中美會談已結束,特朗普專機已離京,黃仁勛說了一句不尋常的話

      中美會談已結束,特朗普專機已離京,黃仁勛說了一句不尋常的話

      麓谷隱士
      2026-05-15 10:16:15
      暴雨大暴雨!7-9級雷暴大風!來了!

      暴雨大暴雨!7-9級雷暴大風!來了!

      江蘇警方
      2026-05-15 19:28:27
      你見過這么白的美女嗎?我是第一次見過,太漂亮,簡直美的發光

      你見過這么白的美女嗎?我是第一次見過,太漂亮,簡直美的發光

      情感大頭說說
      2026-05-16 00:59:58
      血虧!大阪世博會190臺電動巴士全部報廢,巨虧67億日元

      血虧!大阪世博會190臺電動巴士全部報廢,巨虧67億日元

      顫抖的熊貓
      2026-05-15 10:41:43
      驚現夜市鬧劇!30歲高顏值少婦當眾脫內褲套男子嘴,丈夫全程目睹

      驚現夜市鬧劇!30歲高顏值少婦當眾脫內褲套男子嘴,丈夫全程目睹

      老貓觀點
      2026-05-15 07:34:04
      “日本這是在慫恿美國:別為稀土對華讓步”

      “日本這是在慫恿美國:別為稀土對華讓步”

      觀察者網
      2026-05-15 18:35:06
      馬斯克14個孩子,最小2歲,為啥偏愛6歲的X?還買了940元中式馬甲

      馬斯克14個孩子,最小2歲,為啥偏愛6歲的X?還買了940元中式馬甲

      小鋭有話說
      2026-05-15 16:51:38
      新婚15天就爆不倫!日諧星床戰照外泄 人妻私訊「穿最色內褲」求歡

      新婚15天就爆不倫!日諧星床戰照外泄 人妻私訊「穿最色內褲」求歡

      ETtoday星光云
      2026-05-14 15:58:05
      王毅向媒體介紹中美元首會晤情況和共識

      王毅向媒體介紹中美元首會晤情況和共識

      新京報
      2026-05-15 22:07:17
      100萬公里,成了汽車行業不敢提的詞?

      100萬公里,成了汽車行業不敢提的詞?

      虎嗅APP
      2026-05-14 18:07:07
      三年不報警不公開,支付寶究竟在害怕什么?

      三年不報警不公開,支付寶究竟在害怕什么?

      聽心堂
      2026-05-15 12:20:38
      馬斯克國宴偷吃事件有感

      馬斯克國宴偷吃事件有感

      關爾東
      2026-05-15 21:16:57
      馬斯克眼睛都直了!晚宴上這位紅衣小姐姐,一出場就火了

      馬斯克眼睛都直了!晚宴上這位紅衣小姐姐,一出場就火了

      煙潯渺渺
      2026-05-15 17:33:42
      其實他才是對華敵意最深的美國總統,差一點鎖死咱們的崛起之路

      其實他才是對華敵意最深的美國總統,差一點鎖死咱們的崛起之路

      開著車去流浪
      2026-05-15 15:28:45
      剛說要跟中國好好相處,轉頭就收3個噩耗,特朗普極速回國

      剛說要跟中國好好相處,轉頭就收3個噩耗,特朗普極速回國

      漫川舟船
      2026-05-15 18:02:48
      他是黃仁勛的哥哥,從小在美國打拼,兄弟五官相似,對弟弟評價高

      他是黃仁勛的哥哥,從小在美國打拼,兄弟五官相似,對弟弟評價高

      攬星河的筆記
      2026-05-15 23:49:40
      陪伴上海人18年,滬上知名百貨公告:6月底閉店!購物卡處理方案公布

      陪伴上海人18年,滬上知名百貨公告:6月底閉店!購物卡處理方案公布

      上觀新聞
      2026-05-15 21:28:06
      央視拿下2026年美加墨世界杯版權!知名主持韓喬生喊話“妥了”,中國球迷可在家看世界杯了

      央視拿下2026年美加墨世界杯版權!知名主持韓喬生喊話“妥了”,中國球迷可在家看世界杯了

      新民晚報
      2026-05-15 15:45:13
      返回美國途中,特朗普正式回應對臺軍售問題,非常不一般

      返回美國途中,特朗普正式回應對臺軍售問題,非常不一般

      kio魚
      2026-05-15 23:43:30
      中國氣象局升級重大氣象災害(暴雨、強對流)四級應急響應為三級

      中國氣象局升級重大氣象災害(暴雨、強對流)四級應急響應為三級

      新京報
      2026-05-15 18:53:21
      2026-05-16 06:36:49
      數字生命卡茲克 incentive-icons
      數字生命卡茲克
      反復橫跳于不同的AI領域,努力分享一些很酷的AI干貨
      517文章數 648關注度
      往期回顧 全部

      科技要聞

      直降千元起步!蘋果華為率先開啟618讓利

      頭條要聞

      黃仁勛在北京喝豆汁痛苦皺眉 問“這是什么東西”

      頭條要聞

      黃仁勛在北京喝豆汁痛苦皺眉 問“這是什么東西”

      體育要聞

      德約科維奇買的球隊,從第6級聯賽升入法甲

      娛樂要聞

      方媛為何要來《桃花塢6》沒苦硬吃?

      財經要聞

      騰訊掉隊,馬化騰戳破真相

      汽車要聞

      高爾夫GTI刷新紐北紀錄 ID. Polo GTI迎全球首秀

      態度原創

      游戲
      健康
      手機
      藝術
      親子

      《街霸6》春麗新品來了!招牌肉腿完美還原

      專家揭秘干細胞回輸的安全風險

      手機要聞

      iPhone 17系列全系跳水,最高立減2500!

      藝術要聞

      讓人拍案叫絕的圖片

      親子要聞

      孕婦補鈣怕刺激怎么選?液體鈣無添加配方實測,藍帽認證更靠譜

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日本亚洲国产| 亚洲中文在线一区二区| 女高中生强奷系列在线播放| 五月婷婷激情| 变态另类zozo特级| 中文字幕无码家庭乱欲| 日韩中文字幕视频| 色综合另类小说图片区| 亚洲精品97久久一| 一区二区三区免费福利| av无码国产在线观看岛国| 久久成人成狠狠爱综合网| 亚洲熟女精品| 熟妇网| …日韩人妻无码精品一专区| 国内外成人综合免费视频| 天堂无码| 亚洲日本乱码在线观看| 久久男人av资源站| 中文字幕av一区二区三区| 免费超爽大片黄| 无码精品人妻一区二区三区湄公河?2026-01-30?8465?1252 | 国产精品激情自拍系列| 国产成人免费a在线视频| 夜夜嗨av一区二区| 亚洲国产一区二区三区在线视频| 最新中文字幕AV无码专区不| 中文字幕无码无码专区| 99在线免费观看视频| 有码无码中文字幕国产精品| 无码一级视频在线| 亚洲免费观看| 蜜桃精品成人影片| 狠狠色噜噜狠狠狠狠av| 亚洲精品第五页| 激情五月婷婷| 无码内射中文字幕岛国片 | 国产精品A片| 亚洲欧美日韩中文v在线| 2021国产成人精品久久| 老少配老妇老熟女中文普通话|