<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      被罵降智 1 個月后,Anthropic 端出了 Opus 4.7

      0
      分享至


      Claude Opus 4.7 能不能堵住用戶的嘴?


      作者|樺林舞王

      編輯|靖宇

      一家 AI 公司,到底做什么會讓開發者氣到在 GitHub 上,公開聲討一個 AI 模型「退化到不能用」?

      過去幾周,Claude Opus 4.6「瘋狂降智」的討論充斥網絡。

      一位 AMD 的資深總監在 GitHub 上發了一篇廣泛流傳的帖子,直接寫道「Claude 已退化到無法信任執行復雜工程的地步」。這篇帖子在開發者社區炸開了鍋,無數人跑來補刀,說自己也有類似體驗。

      就在輿論發酵到最熱的時候,2026 年 4 月 16 日,Anthropic 悄然推出了 Claude Opus 4.7。

      時機,耐人尋味。

      01

      「退化」風波,

      Anthropic 欠開發者一個答案

      要理解 Opus 4.7 的意義,得先說清楚它出現之前發生了什么。

      Opus 4.6 上線后,最初口碑不錯。但隨著時間推移,開發者們開始陸續反映:這個模型在處理復雜工程任務時,變得越來越「保守」,越來越容易在多步驟任務中途放棄,甚至開始給出「看起來合理但其實是錯的」回答。

      這種「退化感」在 AI 產品里是最致命的信任危機。用戶可以接受模型能力一般,但無法接受一個用熟了的工具突然變得不可靠。

      從用數據角度看這件事,財報分析平臺 Hex 的評估說明了問題的本質。他們發現 Opus 4.6 在遇到數據矛盾時,會傾向于給出「看似合理的錯誤回退」,而不是老老實實承認「數據缺失,我沒法回答」。對一個要用來做數據分析的工具來說,這比「不會用」還危險。

      Anthropic 對這些反饋的回應方式是,直接上新版本。沒有公開的解釋,沒有「我們聽到了」的官方聲明,就是一個新模型上線了。

      對技術公司來說,這算是最直接的道歉方式

      02

      Opus 4.7 到底強在哪

      Anthropic 給 Opus 4.7 打的標簽是「軟件工程領域的顯著提升」,并引入了一個全新的 xhigh 努力等級。

      從具體數字來看,編碼基準提升了 13%,生產級任務的自主完成率提升了 3 倍,同時還帶來了高達 3.75 兆像素的高分辨率視覺支持和更新的分詞器。

      但這些官方數字對開發者來說太抽象。更有說服力的是來自 Cursor 團隊的反饋。Cursor 是目前最受開發者青睞的 AI 編程工具之一,他們用自己的內部基準 CursorBench 測試了 Opus 4.7,結果是自主編碼成功率從 Opus 4.6 的 58% 跳升到了 70%

      12 個百分點的差距,聽起來不大,但放在「自主完成復雜任務」這個維度上,意義完全不同。

      過去在 Opus 4.6 上需要兩到三次提示才能搞定的任務,在 4.7 上通常一次就能跑通。對真正在工作流里深度依賴 AI 的開發者來說,這直接等于減少了一半以上的來回調試成本

      Hex 對 Opus 4.7 的評價,則從另一個維度印證了這次升級的質量。他們直接說這是「評估過最強大的模型」,核心理由是它在面對數據矛盾時,不再試圖給出貌似合理的錯誤答案,而是選擇如實告知「數據缺失」。這聽起來像是一個很小的行為變化,但它指向的是模型「自知能力邊界」這個更深層的進步。

      價格沒有變化。輸入每百萬 token 5 美元,輸出每百萬 token 25 美元,和 Opus 4.6 完全一致。

      03

      兩周三更新,Anthropic 在打什么算盤

      如果只是看這一次發布,Opus 4.7 是一次扎實的迭代升級。但把時間線拉長到過去兩個月,這次更新的背后邏輯就更有意思了。

      2026 年 1 月以來,Anthropic 大約保持著每兩周一次重大更新的節奏。這個頻率,在 AI 軍備競賽最激烈的今天,本身就是一種戰略表態:

      我們在跑,我們不會停」。

      更值得關注的是與此同時發生的另一件事。

      就在 Opus 4.7 發布前幾周,Anthropic 向精選企業客戶悄悄開放了 Claude Mythos Preview,這是作為 Project Glasswing 網絡安全計劃的一部分。

      這個模型的能力之強讓人警惕,據報道它能夠滲透主要銀行系統,且具備同時攻擊多個目標的潛力。Anthropic 聯合創始人杰克·克拉克專門向特朗普政府做了匯報,財政部長斯科特·貝森特和美聯儲主席鮑威爾隨后也緊急召集了與銀行高管的會議。

      這意味著 Anthropic 現在同時在打兩場戰爭。一場是公開的、對著開發者和企業客戶的產品戰,Opus 4.7 是這場戰爭里的一顆棋子;另一場是關于 AI 能力邊界的政策博弈,Mythos 和 Project Glasswing 是這條線上更敏感的棋局。

      這兩件事放在一起看,你會發現 Anthropic 的產品哲學,正在發生微妙的轉變。他們越來越清楚,最強大的模型不能直接扔給所有人用,但也不能把「足夠強」的模型做差了

      Opus 4.7 扮演的,就是這個「足夠強但可控部署」的角色。

      04

      開發者生態的新格局

      Opus 4.7 的發布,對整個開發者工具生態的意味,不只是「Claude 又更新了」這么簡單。

      編程助手這個賽道,今天已經是一場關于「工作流深度綁定」的戰爭。Cursor 選擇把 Opus 4.7 作為核心模型接入,這背后是一個明確的判斷,在當前競爭格局里,Claude 系列對復雜軟件工程任務的理解深度,依然有明顯優勢。

      VentureBeat 的一個分析視角很有意思,他們認為Opus 4.7 代表的,是 AI 從「創意助手」向「可靠執行者」的角色遷移。這個說法其實道出了企業采購決策的核心邏輯,創意助手可以偶爾出錯,但執行者不行。

      不過,也有值得留意的隱患。新分詞器的引入意味著,同樣的輸入文本可能會消耗更多 token,雖然單價不變,但實際成本有可能悄悄上漲。這對高頻調用 API 的企業來說,是需要重新測算的變量。

      還有一個更根本的問題,正如 Decrypt 的評論所指出的,AI 行業至,今仍沒有一套大家都認可的能力評估標準。Anthropic 說編碼基準提升了 13%,但這個基準和真實開發場景之間的距離,每個人的感受都不一樣。Cursor 的 70% 成功率數據,比 Anthropic 自己發布的所有基準都更有說服力,正是因為它來自真實工作流里的實際驗證。

      幾周前,開發者在 GitHub 上公開抱怨 Opus 4.6「不能用了」。今天,Anthropic 用一個新版本回應了這份不滿,并且用實打實的性能數據贏回了 Cursor、Hex 這些頭部工具團隊的背書。

      但用戶的信任不是靠一次發布能徹底修復的。每兩周一次的迭代節奏,既是優勢,也是壓力,因為它意味著每次發布都必須真的好,否則下一輪「退化」的聲音會來得更快。

      對 Anthropic 來說,真正的考驗不是今天能不能發出一個更好的版本,而是能不能讓開發者相信,這個「更好」是持續的、可預期的

      這對任何 AI 公司來說,都是一個巨大的挑戰。

      *頭圖來源:LLM Stats

      本文為極客公園原創文章,轉載請聯系極客君微信 geekparkGO

      極客一問

      Opus4.7 的能力符合你的預期嗎?


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      詹皇定律?此前橫掃詹姆斯的球隊:馬刺、勇士、掘金都奪冠了

      詹皇定律?此前橫掃詹姆斯的球隊:馬刺、勇士、掘金都奪冠了

      懂球帝
      2026-05-11 15:30:07
      北京地鐵試點帶自行車,30元一次網友吵翻

      北京地鐵試點帶自行車,30元一次網友吵翻

      我不叫阿哏
      2026-05-11 14:47:43
      謝霆鋒張柏芝上船當P友!?

      謝霆鋒張柏芝上船當P友!?

      八卦瘋叔
      2026-05-11 10:00:14
      劉三姐“全裸演出”引爭議,張藝謀惹怒全網

      劉三姐“全裸演出”引爭議,張藝謀惹怒全網

      營銷頭版
      2026-05-10 20:09:26
      A股:尾盤加速上漲,釋放了兩個信號,明天,周二或要這樣走!

      A股:尾盤加速上漲,釋放了兩個信號,明天,周二或要這樣走!

      明心
      2026-05-11 16:14:43
      《主角》主角差評如潮,出場十幾秒,網友評價:雙眼無神像瞎子

      《主角》主角差評如潮,出場十幾秒,網友評價:雙眼無神像瞎子

      劇芒芒
      2026-05-11 12:21:15
      班主任的大實話:初中是孩子變壞最快的三年,務必抓好這7件事!

      班主任的大實話:初中是孩子變壞最快的三年,務必抓好這7件事!

      戶外阿毽
      2026-05-10 19:24:03
      火藥味!外國記者問王皓:樊振東還會回國家隊嗎?主持人立馬終止

      火藥味!外國記者問王皓:樊振東還會回國家隊嗎?主持人立馬終止

      十點街球體育
      2026-05-11 15:39:09
      74歲普京現身閱兵儀式,面容憔悴引發健康擔憂,俄烏沖突消耗身心

      74歲普京現身閱兵儀式,面容憔悴引發健康擔憂,俄烏沖突消耗身心

      譯言
      2026-05-11 07:33:16
      美國衛星:中國“羚羊礁”快變成西沙最大“填島”

      美國衛星:中國“羚羊礁”快變成西沙最大“填島”

      世家寶
      2026-05-11 10:25:10
      公安局交管大隊隊長被舉報在KTV違規飲酒與女性舉止親密?當事人:喝茶水,涉事女士突然過來,我下意識推開

      公安局交管大隊隊長被舉報在KTV違規飲酒與女性舉止親密?當事人:喝茶水,涉事女士突然過來,我下意識推開

      觀威海
      2026-05-11 09:30:04
      龍賽羅:姆巴佩的所作所為在拿皇馬開涮;皇馬得買七個人重建

      龍賽羅:姆巴佩的所作所為在拿皇馬開涮;皇馬得買七個人重建

      懂球帝
      2026-05-11 06:09:12
      黔江2死6傷車禍升級!女司機穿著高跟鞋及醫者身份流出,引發公憤

      黔江2死6傷車禍升級!女司機穿著高跟鞋及醫者身份流出,引發公憤

      火山詩話
      2026-05-11 13:28:21
      十年前,易建聯花1000萬在洛杉磯買下豪宅,如今出售市值多少?

      十年前,易建聯花1000萬在洛杉磯買下豪宅,如今出售市值多少?

      小蘭聊歷史
      2026-04-26 08:44:22
      “近一半的孩子不正常”,男老師吐槽鄉鎮學校現狀,令人脊背發涼

      “近一半的孩子不正常”,男老師吐槽鄉鎮學校現狀,令人脊背發涼

      妍妍教育日記
      2026-05-09 13:54:42
      人一旦有了體系,做什么都會成功

      人一旦有了體系,做什么都會成功

      細說職場
      2026-05-10 09:47:15
      張本智和父親:請中國人不要罵我兒子,他比你們99%的人都優秀!

      張本智和父親:請中國人不要罵我兒子,他比你們99%的人都優秀!

      拳擊時空
      2026-05-10 07:42:20
      出乎所有人預料,特朗普修改訪華計劃,中方官宣,他必須多來一天

      出乎所有人預料,特朗普修改訪華計劃,中方官宣,他必須多來一天

      牛鍋巴小釩
      2026-05-11 11:23:22
      戀愛腦下場是真慘!從春晚主持人到養不起孩子的婦女,她后悔嗎

      戀愛腦下場是真慘!從春晚主持人到養不起孩子的婦女,她后悔嗎

      冷紫葉
      2026-05-10 21:08:25
      中方備好國宴,搶在專機抵華前,特朗普做了新決定,普京怕啥來啥

      中方備好國宴,搶在專機抵華前,特朗普做了新決定,普京怕啥來啥

      探索新高度
      2026-05-11 16:02:06
      2026-05-11 17:55:00
      極客公園
      極客公園
      讓最棒的創新成為頭條
      12035文章數 78879關注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機會

      頭條要聞

      吳宜澤:能進攻時我從來不會防守 為此付出過很多代價

      頭條要聞

      吳宜澤:能進攻時我從來不會防守 為此付出過很多代價

      體育要聞

      梁靖崑:可能是最后一屆了,想讓大家記住這個我

      娛樂要聞

      “孕婦墜崖案”王暖暖稱被霸凌協商解約

      財經要聞

      "手搓汽車"曝光:偽造證件、電池以舊代新

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      手機
      教育
      親子
      旅游
      公開課

      手機要聞

      華為Mate 80 Pro Max風馳版推HarmonyOS 6.1.0.117 SP10升級

      教育要聞

      一招教你差倍問題的解法!

      親子要聞

      阿不力挖不力,這是誰的聲音?

      旅游要聞

      南京人的“莫奈花園”如期上線,燕雀湖睡蓮盛放美成童話

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲综合色区在线播放2019| 久久精品国产福利国产秒拍| 狠狠五月天中文字幕| 少妇搡bbbb搡bbb搡忠贞| 在线无码免费的毛片视频| 精品乱码一区内射人妻无码| 亚洲人成电影网站 久久影视| 久久无码人妻热线精品| 精品国产18禁久久久久久久| 久久国产劲爆∧v内射| 偷看农村女人做爰毛片色| 成熟老妇女视频| 国产精品高清视亚洲中文| 国产91久久久久久| 日本一区二区三区久久久| 日本熟妇浓毛hdsex| 亚洲欧洲中文日韩乱码av| 经典国产乱子伦精品视频| 国产成年无码v片在线| 国产精品免费无遮挡无码永久视频| 精品少妇爆乳无码aⅴ区| 国产精品毛片a∨一区二区三区| 中文字幕亚洲综合第一页| 亚洲av片在线免费观看| 国产成人在线无码免费视频| 国产性色播播毛片| 亚洲性久久久影院| 在线精品无码字幕无码av| 久久国产99精品精品| 国产精品自在线拍亚洲另类| av色蜜桃一区二区三区| 国产美女久久久亚洲综合| www.操.c| 精品亚洲韩国一区二区三区 | 亚洲午夜伦费影视在线观看| 精品久久久久久中文字幕202o| 亚洲熟女乱色一区二区三区 | 亚洲mv国产精品mv日本mv| 亚洲最大成人综合网| 天天爽爽夜夜爽| 承德县|