<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      GPT-5.2深夜炸場,評測碾壓谷歌Gemini 3 Pro,真正的打工人利器

      0
      分享至

        作者|沐風

        來源|AI先鋒官

        上周,OpenAI CEO奧特曼剛宣布完公司進入“紅色警戒”(Code Red)狀態,要求團隊將工作重心轉移到提高ChatGPT的性能和用戶體驗上后。

        就在今天,OpenAI發布了最新的頂級模型 GPT-5.2系列。

        GPT-5.2 將向 ChatGPT 付費用戶開放,并通過 API 提供給開發者,一共分為三個系列:

        GPT?5.2 Instant(即時版)

        GPT?5.2 Thinking(思考版)

        GPT?5.2 Pro(專業版)

        在OpenAI官方公布的基準測試中,它幾乎對Gemini 3 Pro、Claude Opus 4.5實現了全方位碾壓。

        

        值得注意的是,GPT?5.2 Thinking在AIME 2025(數學)的分數達到了滿分,Gemini 3 Pro 的分數是 95%。

        OpenAI應用CEO Fidji Simo曾說過,GPT-5.2 的設計目標就是為人們創造更多經濟價值。

        那么如何創造呢?

        那就不得不提到GPT-5.2的拿手好戲:制作電子表格、構建演示文稿、編寫代碼、理解圖像、處理超長上下文、使用工具,以及執行復雜的多步驟項目等等。

        空口無憑,讓我們先來看看數據。

        在OpenAI新出的基準測試GDPval(覆蓋 44 個職業、針對明確知識工作任務的評估體系)中,GPT-5.2 Thinking 在70.9%的任務上勝過或打平行業專家,GPT-5.2 Pro更高,為74.1%。

        

        主要測試內容為制作演示文稿、電子表格以及其他專業產出物。

        官方還放出了對比圖,GPT-5.2 做的表格比GPT-5.1確實精細很多。

        

        一個評審員對此的評價是:“看起來像是一個有員工的專業公司做的,布局和建議都很專業,雖然還有一些小錯誤需要修正。”

        另外,GPT-5.2 Thinking生成輸出的速度也超過人類專家11 倍以上,成本不到人類專家的1%。

        OpenAI 聲稱這是AI模型首次達到了“人類專家水平”。

        在ARC-AGI放出的測試中,此前o3 (High) 在ARC-AGI-1測試得分為88%,平均每項任務成本為4500美元。

        而GPT-5.2 Pro (X-High) 最新SOTA得分為90.5%,是第一個突破90%的模型,它的平均任務成本僅為11.64美元,在一年內效率提高了約390倍。

        

        ARC-AGI-2(抽象推理)的分數是 52.9%,相較此前翻了三倍,對比Gemini 3 Pro是 31.1 %。

        

        GPT-5.2 Thinking的代碼能力也同樣刷新了紀錄:

        在SWE-bench Verified上,得分達到80%。

        在SWE-Bench Pro上,得分達到55.6%。

        

        SWE-Bench Pro是新的代碼基準測試,比SWE-bench Verified更難,涵蓋四種編程語言,不只是Python,更接近真實軟件工程。

        早期測試者特別提到,GPT-5.2在前端的能力也明顯提升了,尤其是3D和復雜UI。

        官方也放出了由單prompt生成的demo:

        

        同時,GPT-5.2 Thinking在長文檔處理方面的表現也很亮眼。

        在OpenAI自制的MRCRv2(長文檔中多個信息點的整合能力)評測中,GPT-5.2 Thinking成為首個在256k 上下文長的4-needle上達到接近100%準確率的模型。

        

        不過,更難的8 needle版還是有明顯下降。

        

        GPT-5.2 Thinking的視覺能力也明顯提升,錯誤率基本減半。

        在CharXiv Reasoning測試中,GPT-5.2 Thinking得分達到88.7%,GPT-5.1是80.3%。

        

        在ScreenSpot-Pro測試中,GPT-5.2 Thinking得分達到86.3%。GPT-5.1 是 64.2%。

        

        在官方放出的示例中,OpenAI 要求模型識別輸入圖像中的組件,并返回帶有大致邊界框的標簽。

        

        即使在低質量圖像上,GPT-5.2 也能識別出主要區域,并放置有時能與每個組件真實位置相匹配的框;而 GPT-5.1 僅標記了少數幾個部分,且對其空間排列的理解要弱得多。

        而且,GPT-5.2 Thinking 的幻覺比GPT-5.1 Thinking更少了。

        在一組去標識化的ChatGPT查詢中,前者包含錯誤的回答相對減少了30%

        

        最后,我們來聊聊價格,GPT-5.2的價格一如既往的貴到離譜。

        GPT-5.2的定價為1.75美元/百萬輸入Token,14美元/百萬輸出Token,緩存輸入有90%的折扣,比GPT-5.1貴40%。

        ChatGPT訂閱價格不變。

        

        但是!

        在多個智能體評估中,盡管GPT-5.2的每Token成本更高,但GPT-5.2由于更高的Token效率,性價比反而更高。

        ChatGPT 將于今日開始逐步推出 GPT-5.2(包括 Instant、Thinking 和 Pro 版本),首先面向付費用戶(Plus、Pro、Go、Business 和 Enterprise 版本)提供。

        為確保 ChatGPT 的流暢性和穩定性,GPT-5.2 將分階段部署,在 ChatGPT 中,付費用戶仍可在三個月內繼續使用 GPT-5.1(舊版模式),之后 GPT-5.1 將逐步下線。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      解放軍澎湖穿行 捍衛臺海主權底線

      解放軍澎湖穿行 捍衛臺海主權底線

      風鈴草語
      2026-05-12 06:20:34
      斯內德:穆帥是管理皇馬更衣室的完美人選;姆巴佩不該去度假

      斯內德:穆帥是管理皇馬更衣室的完美人選;姆巴佩不該去度假

      懂球帝
      2026-05-12 22:21:17
      WTA1000羅馬站:高芙2-1逆轉俄羅斯悍將,驚險晉級4強

      WTA1000羅馬站:高芙2-1逆轉俄羅斯悍將,驚險晉級4強

      俯身沖頂
      2026-05-13 03:27:36
      我媽罵了我爸30年,我爸退休后說了一句話,我媽瞬間懵了

      我媽罵了我爸30年,我爸退休后說了一句話,我媽瞬間懵了

      千秋文化
      2026-05-12 20:09:20
      今日最慘股,月內股價腰斬,現又連遭跌停,抄底資金全被套!

      今日最慘股,月內股價腰斬,現又連遭跌停,抄底資金全被套!

      丁丁鯉史紀
      2026-05-12 16:04:41
      擠走董卿、靠爹上位、央視“窮鬼”,龍洋的私生活謠言有多離譜?

      擠走董卿、靠爹上位、央視“窮鬼”,龍洋的私生活謠言有多離譜?

      豬小艷吖
      2026-05-12 03:50:15
      “夏補鉀,體不乏”,立夏后,多吃3種“高鉀菜”,精神飽滿過夏

      “夏補鉀,體不乏”,立夏后,多吃3種“高鉀菜”,精神飽滿過夏

      花小廚
      2026-05-11 16:42:26
      上港后悔嗎!當初沒全力挽留的指揮官,如今卻逆襲成中超德布勞內

      上港后悔嗎!當初沒全力挽留的指揮官,如今卻逆襲成中超德布勞內

      林子說事
      2026-05-12 18:24:33
      吃達格列凈,千萬注意這5點,很多人不當回事!

      吃達格列凈,千萬注意這5點,很多人不當回事!

      懷章說藥
      2026-05-11 13:27:19
      外媒:蒙牛等贊助世界杯的中國企業擔憂世界杯沒版權導致營銷損失

      外媒:蒙牛等贊助世界杯的中國企業擔憂世界杯沒版權導致營銷損失

      懂球帝
      2026-05-13 01:09:14
      特朗普應邀訪華3天,中方準備了高規格禮遇,他想邀中方回訪美國

      特朗普應邀訪華3天,中方準備了高規格禮遇,他想邀中方回訪美國

      別讓往昔的悲傷和對未來的恐懼
      2026-05-13 02:30:26
      出道橫掃大獎卻被公司冷藏4年,如今她以視后華麗回歸!

      出道橫掃大獎卻被公司冷藏4年,如今她以視后華麗回歸!

      ChicMyGeek
      2026-05-12 10:58:10
      央視拒付香港21億轉播費,李嘉誠意外躺槍引討論

      央視拒付香港21億轉播費,李嘉誠意外躺槍引討論

      不甜的李子
      2026-05-12 03:17:43
      人倫之亂,正在悄悄毀掉無數家庭!看完一身冷汗

      人倫之亂,正在悄悄毀掉無數家庭!看完一身冷汗

      三農老歷
      2026-05-08 19:20:12
      機構:有色金屬行業業績具備上行空間

      機構:有色金屬行業業績具備上行空間

      證券時報
      2026-05-12 09:32:03
      最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

      最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

      周軍律師聊案子
      2026-04-21 09:50:16
      色情片是怎樣傷害人體的?

      色情片是怎樣傷害人體的?

      醫脈圈
      2026-04-19 20:06:42
      歌唱家張也:為兩個媽媽盡孝,58歲不戀不婚,已為自己想好退路

      歌唱家張也:為兩個媽媽盡孝,58歲不戀不婚,已為自己想好退路

      阿廢冷眼觀察所
      2026-05-13 01:17:09
      黃子韜回應徐藝洋搖頭晃腦!直播模仿又損又護短

      黃子韜回應徐藝洋搖頭晃腦!直播模仿又損又護短

      科學發掘
      2026-05-12 19:30:54
      4月新勢力上險量揭穿誰在銷量造假

      4月新勢力上險量揭穿誰在銷量造假

      鐵流1988
      2026-05-12 06:19:37
      2026-05-13 04:59:00
      AI先鋒官 incentive-icons
      AI先鋒官
      AIGC大模型及應用精選與評測
      506文章數 74關注度
      往期回顧 全部

      科技要聞

      宇樹發布載人變形機甲,定價390萬元起

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

      體育要聞

      騎士終于玩明白了?

      娛樂要聞

      白鹿風波升級!掉粉20萬評論區淪陷

      財經要聞

      利潤再腰斬 京東干外賣后就沒過過好日子

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      家居
      時尚
      房產
      手機
      親子

      家居要聞

      極簡主義下的居住場域與空間

      普通人真該學學如何穿搭!多穿裙子比褲子更時髦,大方提氣質

      房產要聞

      穗八條引爆樓市!萬博寶藏紅盤,五一勁銷出圈

      手機要聞

      10年支持不變:谷歌力保現有Chromebook

      親子要聞

      夏天建議:把孩子的空調服換成它!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国内精品久久久人妻中文字幕 | 2020日韩无码| 亚洲天堂网在线观看| 成人无码A区在线观看视频| 影音先锋人妻av中文字幕久久 | 久久人妻视频免费观看| 久久精品国产只有精品66| 亚洲综合伊人久久大杳蕉| 熟女亚洲综合精品伊人久久| 免费黄色片成人国产精品| 亚洲国产精品特色大片观看完整版| 日韩中文字幕不卡网站| 欧美精品亚洲精品日韩已满十八| 精品国模| 日韩?无码?中文字幕?精品| 国产精品无码久久久久久久久久| 国产精品yjizz视频网一二区| 午夜不卡无码中文字幕影院| a在线观看视频在线播放| 亚洲男人第一av天堂| 中国少妇xxxx做受| 国产精品免费观看视频播放| 伊人久久大香线焦av色| 99人妻碰碰碰久久久久禁片| 久久综合九色综合久99| 国产色资源| 一个人看的www视频免费观看| 青草国产精品久久久久久久久| 日韩人妻系列在线视频| 亚洲日韩欧美国产另类综合| 欧美变态另类zozo| 黄av在线| 中文字幕在线亚洲| 丰满少妇a级黄片在线免费观看| 大帝AV在线一区二区三区| 国产婷婷色一区二区三区在线| 成人午夜看黄在线尤物成人| 国产呻吟av| jizz免费| 久久久久无码精品国产AV| 国产成人免费高清AⅤ|