<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Claude Opus 4.7 來了,編程能力又炸了

      0
      分享至

      今天繼續(xù)聊 Claude —— Anthropic 剛剛正式發(fā)布了 Claude Opus 4.7,編程能力這次又是一次暴擊

      Benchmark 一覽

      下圖是 Anthropic 給出的跨領(lǐng)域 benchmark 對比,Opus 4.7 在大多數(shù)任務(wù)上超過了 Opus 4.6,以及 GPT-5.4 和 Gemini 3.1 Pro:


      Claude Opus 4.7 跨領(lǐng)域 Benchmark 對比 它比 Opus 4.6 強(qiáng)在哪?

      Anthropic 官方說,Opus 4.7 在高級軟件工程上是 Opus 4.6 的「顯著提升」,尤其是在那些最難的任務(wù)上

      這話我本來要打個折,但看了一圈測試用戶的反饋之后,我信了

      幾個讓我印象深刻的數(shù)據(jù):

      • Cursor :在 93 個編程任務(wù)的 benchmark 上,任務(wù)解決率比 Opus 4.6 **提升了 13%**,包括 4 個 Opus 4.6 和 Sonnet 4.6 都搞不定的任務(wù)

      • Rakuten :在 SWE-bench 上,Opus 4.7 解決的真實(shí)生產(chǎn) bug 是 Opus 4.6 的 3 倍

      • XBOW(自主滲透測試) :視覺準(zhǔn)確性從 Opus 4.6 的 54.5% 直接干到 **98.5%**,這簡直是量變引發(fā)質(zhì)變

      • Notion :工具調(diào)用準(zhǔn)確率和規(guī)劃能力提升超過 **10%**,更難得的是,它是第一個通過隱式需求測試(implicit-need tests)的模型

      視覺能力:分辨率翻了 3 倍多

      這次 Opus 4.7 的視覺升級幅度相當(dāng)大

      之前的 Claude 模型能接受的圖片分辨率,現(xiàn)在 Opus 4.7 可以接受最長邊 2,576 像素(約 3.75 百萬像素),是之前版本的 3 倍以上

      這意味著什么?

      • 讀密集截圖的 computer-use agent,再也不會因?yàn)槲淖痔】床磺宥鲥e

      • 從復(fù)雜圖表里提取數(shù)據(jù),精度大幅提升

      • 科學(xué)、法律文檔里那些需要像素級精準(zhǔn)的工作,終于能干了

      來自 Solve Intelligence(生命科學(xué)專利工作流)的反饋印證了這一點(diǎn):從化學(xué)結(jié)構(gòu)式到復(fù)雜技術(shù)圖紙,理解能力大幅躍升

      注意這是模型層面的變化,不是 API 參數(shù),圖片會自動以更高精度處理。但因?yàn)楦叻直媛蕡D片消耗 token 更多,如果你不需要那么高的精度,可以在發(fā)送前先降采樣

      指令遵循:這次是認(rèn)真的

      Opus 4.7 在指令遵循上大幅提升

      聽起來是好事,但 Anthropic 自己也提醒了:之前給舊模型寫的 prompt,有時候會跑出意外結(jié)果——因?yàn)榕f模型對指令是「松散理解」甚至跳過某些部分,現(xiàn)在 Opus 4.7 是字面意思照單全收

      所以如果你是 API 用戶,升級前最好重新審視一下你的 prompt,該精確的地方要精確,該刪掉的廢話要刪掉

      新功能:xhigh 努力等級

      Opus 4.7 引入了全新的 xhigh(extra high)努力等級,介于原來的 highmax 之間

      這給用戶提供了更細(xì)粒度的控制:在硬問題上,你可以選擇在「思考質(zhì)量」和「響應(yīng)延遲」之間找到更合適的平衡點(diǎn)

      在 Claude Code 里,現(xiàn)在默認(rèn)把所有計(jì)劃的努力等級提升到了 xhigh

      官方建議在編程和 Agent 場景下測試時,從 highxhigh 開始

      下圖是不同努力等級下,token 使用量和任務(wù)得分的關(guān)系:


      不同努力等級下的 token 使用量與任務(wù)得分對比 網(wǎng)絡(luò)安全:先邁一步,但很謹(jǐn)慎

      Anthropic 上周公布了 Project Glasswing,直面 AI 在網(wǎng)絡(luò)安全領(lǐng)域的兩面性——風(fēng)險與機(jī)遇。

      Opus 4.7 是 Glasswing 框架下第一個正式落地的模型,它的網(wǎng)絡(luò)安全能力不如 Claude Mythos Preview(目前最強(qiáng)的 Anthropic 模型),Anthropic 在訓(xùn)練階段專門做了差異化處理,有意限制了部分網(wǎng)絡(luò)安全能力

      同時,Opus 4.7 配備了自動檢測和攔截高危網(wǎng)絡(luò)安全請求的防護(hù)機(jī)制

      真正有合法需求的安全研究人員、滲透測試工程師,可以通過 Cyber Verification Program 加入白名單

      這條路子我覺得挺對的:先在能力較弱的模型上驗(yàn)證防護(hù)機(jī)制是否有效,積累經(jīng)驗(yàn)后,再逐步向更強(qiáng)的 Mythos 級別模型開放

      安全性測評
      Claude Opus 4.7 行為審計(jì)評分

      在安全對齊方面,Opus 4.7 和 Opus 4.6 整體差不多——欺騙行為、諂媚、濫用配合率都處于低水平

      部分維度(比如誠實(shí)性、對抗 prompt 注入攻擊)比 4.6 有改進(jìn),少數(shù)地方(比如有害物質(zhì)信息的過度詳細(xì)回復(fù))略微退步

      整體結(jié)論:「大體對齊、基本可信,但還沒達(dá)到理想狀態(tài)」

      Mythos Preview 依然是 Anthropic 目前對齊效果最好的模型

      價格 & 可用性

      好消息:價格不變,和 Opus 4.6 一樣:

      • 輸入:**$5 / 百萬 tokens**

      • 輸出:**$25 / 百萬 tokens**

      支持平臺:

      • Claude 全產(chǎn)品線

      • Claude API(模型 ID: claude-opus-4-7

      • Amazon Bedrock

      • Google Cloud Vertex AI

      • Microsoft Foundry

      還有這些新東西一起上

      隨 Opus 4.7 一起發(fā)布的還有幾個配套更新:

      1. /ultrareview 命令 (Claude Code):一鍵啟動深度代碼審查,像一個認(rèn)真的 reviewer 一樣幫你找 bug 和設(shè)計(jì)問題,Pro 和 Max 用戶各有 3 次免費(fèi)試用額度。

      2. Task Budgets(公測) (API):給開發(fā)者一個新機(jī)制,引導(dǎo) Claude 在長任務(wù)中合理分配 token 預(yù)算,避免前緊后松或前松后緊

      3. Auto Mode 擴(kuò)展 :Max 用戶現(xiàn)在也可以開啟 Auto Mode,讓 Claude 在長任務(wù)里自主決策權(quán)限請求,減少中斷

      升級注意事項(xiàng)

      如果你在生產(chǎn)上用 Opus 4.6,升級到 4.7 有兩個點(diǎn)要注意:

      1. 新 tokenizer :同樣的輸入,token 數(shù)大約會增加 1.0–1.35 倍 ,取決于內(nèi)容類型

      2. 更高努力等級下思考更多 :尤其是 Agent 場景的后續(xù)對話輪次,輸出 token 會增加

      Anthropic 提供了遷移指南,建議先在真實(shí)流量上測一下差異

      總結(jié)

      Opus 4.7 的核心關(guān)鍵詞:編程更強(qiáng)、視覺更清、指令更準(zhǔn)、安全更嚴(yán)

      如果你是:

      • Claude Code 用戶 :直接用,默認(rèn)已升級到 xhigh 努力等級,新的 /ultrareview 也很值得試

      • API 開發(fā)者 :記得重新調(diào) prompt,關(guān)注 token 用量變化,遷移指南先讀一遍

      • 網(wǎng)絡(luò)安全從業(yè)者 :有合法需求的走 Cyber Verification Program

      最讓我感興趣的其實(shí)是這個關(guān)于「更好同事」的描述——一個會在技術(shù)討論中反駁你、幫你做出更好決定的 AI

      這可能才是 AI 應(yīng)該有的樣子,不是附和你,是真的幫你。

      .7

      制作不易,如果這篇文章覺得對你有用,可否點(diǎn)個關(guān)注。給我個三連擊:點(diǎn)贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      4死1傷!遼寧遼陽發(fā)布一起較大交通事故調(diào)查報告:韓某某駕駛過程中吸食含有丙烷、正丁烷、異丁烷成分的氣體,與重型半掛牽引車相撞

      4死1傷!遼寧遼陽發(fā)布一起較大交通事故調(diào)查報告:韓某某駕駛過程中吸食含有丙烷、正丁烷、異丁烷成分的氣體,與重型半掛牽引車相撞

      揚(yáng)子晚報
      2026-05-12 20:57:58
      干了20年殯葬,我希望所有家屬拿到骨灰后,不要把親人塞進(jìn)后備箱

      干了20年殯葬,我希望所有家屬拿到骨灰后,不要把親人塞進(jìn)后備箱

      千秋文化
      2026-05-12 20:21:18
      張本智和回到日本 當(dāng)眾懺悔:本該贏下梁靖崑 心理和技術(shù)都有問題

      張本智和回到日本 當(dāng)眾懺悔:本該贏下梁靖崑 心理和技術(shù)都有問題

      風(fēng)過鄉(xiāng)
      2026-05-12 20:36:06
      穿禮服后退款后續(xù):女子身份曝光社死,工作遭牽連,商家準(zhǔn)備起訴

      穿禮服后退款后續(xù):女子身份曝光社死,工作遭牽連,商家準(zhǔn)備起訴

      八斗小先生
      2026-05-12 17:23:09
      女子跪求丈夫諒解后續(xù):妻子被捉奸兩次,望丈夫再原諒自己一次

      女子跪求丈夫諒解后續(xù):妻子被捉奸兩次,望丈夫再原諒自己一次

      漢史趣聞
      2026-05-12 15:53:02
      中方阻斷令收意外之喜,27國開始共振,美將面臨三重“地震”

      中方阻斷令收意外之喜,27國開始共振,美將面臨三重“地震”

      鳥兒太能吃
      2026-05-11 16:27:45
      英媒蓋棺定論:特朗普未登機(jī),美國債務(wù)爆雷,時代已然終結(jié)

      英媒蓋棺定論:特朗普未登機(jī),美國債務(wù)爆雷,時代已然終結(jié)

      古事尋蹤記
      2026-05-12 07:12:15
      劉嘉玲曬法國生活,梁朝偉在老婆鏡頭下?lián)祀u蛋,兩口子生活好愜意

      劉嘉玲曬法國生活,梁朝偉在老婆鏡頭下?lián)祀u蛋,兩口子生活好愜意

      喜歡歷史的阿繁
      2026-05-12 12:12:22
      雅迪愛瑪不香了?內(nèi)行人透露:最值得買的6個高性價比電動車品牌

      雅迪愛瑪不香了?內(nèi)行人透露:最值得買的6個高性價比電動車品牌

      老特有話說
      2026-05-12 15:40:47
      工作中刁難群眾、吃拿卡要!珠海香洲區(qū)住建系統(tǒng)3人被查

      工作中刁難群眾、吃拿卡要!珠海香洲區(qū)住建系統(tǒng)3人被查

      南方都市報
      2026-05-12 12:00:13
      不是盟友,勝似盟友!以色列“激光盾牌”馳援阿聯(lián)酋

      不是盟友,勝似盟友!以色列“激光盾牌”馳援阿聯(lián)酋

      上觀新聞
      2026-05-12 15:48:11
      1940年最完美的暗殺:“23名保鏢貼身保護(hù),但腦袋卻被人砍掉”

      1940年最完美的暗殺:“23名保鏢貼身保護(hù),但腦袋卻被人砍掉”

      紀(jì)實(shí)文錄
      2025-05-08 16:15:44
      國際足聯(lián)輸了,他輸給的不是電視轉(zhuǎn)播,他輸給了中國球迷!

      國際足聯(lián)輸了,他輸給的不是電視轉(zhuǎn)播,他輸給了中國球迷!

      故事終將光明磊落
      2026-05-12 14:04:16
      男團(tuán)、女團(tuán)奪冠僅1天,韓媒、日媒接連發(fā)聲銳評,態(tài)度出奇一致

      男團(tuán)、女團(tuán)奪冠僅1天,韓媒、日媒接連發(fā)聲銳評,態(tài)度出奇一致

      夢醉為紅顏一笑
      2026-05-12 11:54:46
      多名家長反映成都又一幼兒園將閉園 教育局回應(yīng)

      多名家長反映成都又一幼兒園將閉園 教育局回應(yīng)

      天府觀察
      2026-05-11 15:59:43
      疫情向十多國擴(kuò)散?美國放走漢坦病毒感染者,開始給全世界埋雷?

      疫情向十多國擴(kuò)散?美國放走漢坦病毒感染者,開始給全世界埋雷?

      明天見灌裝冰塊
      2026-05-12 21:10:57
      53歲古巨基首曬半歲次子,大眼仔呆萌可愛,表白57歲太太:相守30年,你最偉大

      53歲古巨基首曬半歲次子,大眼仔呆萌可愛,表白57歲太太:相守30年,你最偉大

      手工制作阿殲
      2026-05-12 15:36:56
      美國體操丑聞再爆發(fā)!教練暗藏?cái)z像頭,偷拍6至14歲少女換衣

      美國體操丑聞再爆發(fā)!教練暗藏?cái)z像頭,偷拍6至14歲少女換衣

      夜白侃球
      2026-05-12 10:32:21
      有100萬存款的家庭,日子過得咋樣?網(wǎng)友分享讓人大跌眼鏡!

      有100萬存款的家庭,日子過得咋樣?網(wǎng)友分享讓人大跌眼鏡!

      夜深愛雜談
      2026-03-02 22:37:17
      50歲才醒悟:飯局上,領(lǐng)導(dǎo)低聲對你說“去把賬結(jié)了”,千萬別說“好”,聰明人都這么辦

      50歲才醒悟:飯局上,領(lǐng)導(dǎo)低聲對你說“去把賬結(jié)了”,千萬別說“好”,聰明人都這么辦

      心理觀察局
      2026-05-12 09:39:11
      2026-05-13 00:47:00
      Ai學(xué)習(xí)的老章 incentive-icons
      Ai學(xué)習(xí)的老章
      Ai學(xué)習(xí)的老章
      3395文章數(shù) 11150關(guān)注度
      往期回顧 全部

      科技要聞

      宇樹發(fā)布載人變形機(jī)甲,定價390萬元起

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應(yīng)

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應(yīng)

      體育要聞

      騎士終于玩明白了?

      娛樂要聞

      白鹿風(fēng)波升級!掉粉20萬評論區(qū)淪陷

      財(cái)經(jīng)要聞

      利潤再腰斬 京東干外賣后就沒過過好日子

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達(dá)

      態(tài)度原創(chuàng)

      家居
      教育
      房產(chǎn)
      藝術(shù)
      親子

      家居要聞

      極簡主義下的居住場域與空間

      教育要聞

      求求你試試「5+1+1」學(xué)習(xí)法!!!

      房產(chǎn)要聞

      穗八條引爆樓市!萬博寶藏紅盤,五一勁銷出圈

      藝術(shù)要聞

      震驚!他竟用鏡頭看透了所有女人的秘密!

      親子要聞

      有點(diǎn)東西。周寧運(yùn)動空間

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 欧美性猛交xxxx免费看| 一本久久a久久免费精品不卡| 1000部啪啪未满十八勿入超污| 久久成人黄色| 国内精品视频区在线2021| 成人毛片网| 日本无翼乌邪恶大全彩h| 欧美日韩亚洲国产一区二区综合| 国产精品林美惠子在线播放| 老师黑色丝袜被躁翻了av| 国产亚洲精品久久久久久久软件 | 男男乱体育生yin高h肉汁视频 | 亚洲色欲在线播放一区| 久久久久夜夜夜综合国产| 国产成a人亚洲精品无码樱花| 亚洲中文无码AV永不收费| 大粗鳮巴久久久久久久久| 人妻少妇精品视频三区二区| 精品无码老熟妇magnet| 亚洲欧美日本全免费| 中国真实偷乱视频| 成人av午夜在线观看| www.印度av.com| 国产美女av一区二区三区| 国产免费午夜福利蜜芽无码| 99久久夜色精品国产亚洲| 国产乱淫a∨片| 国产1区2区3区在线| 真实国产乱子伦视频| 亚洲人成电影在线天堂色| jizz喷水| 亚洲综合第一色| 欧美激情乱伦| 午夜在线视频| 国产精品久久久久av| 亚洲AV日韩AV永久无码网站| 61无码| 午夜免费男女aaaa片| 国产精品国产三级国快看| 91在线小视频| 国产精品偷伦视频免费观看国产 |