<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      實測Claude Opus 4.7,好好的模型也開始不說人話了。

      0
      分享至

      果不其然,最近一周Claude天天崩,就是為了新模型做儲備。

      于是昨晚10點半,Claude Opus 4.7發布了。

      這玩意火到什么程度呢,我自己開發的給公司內部用的全網AI信息監控的產品AIHOT上,監控了精挑細選的幾十個有價值的信源,一般一個信息,有3個信源同時報道,就已經比較受關注了。

      如果有5到6個,那就是大熱點了。

      但是Claude Opus 4.7這玩意,有尼瑪10個信源同時發布= =


      給我一下子整不會了。

      目前Claude Opus 4.7已經全渠道上線。

      我10點半下的飛機,一下飛機就發現手機上可以用了。


      Claude Code里面也更新了。


      也是1M的上下文,沒有減量,還是挺爽的。

      最屌的是,凌晨3點的時候,直接把我一周的額度,給重置了。


      Claude第一回做了點人事。


      我知道很多朋友肯定會說哎你不怕KYC或者認證啥的問題嗎,我只能說,真的遇到了或者被遣返了再說吧,我也沒有任何解法,這就是懸在頭上達摩利斯之劍,要不是在知識創作上真的沒有啥替代品,能跟Claude掰掰手腕的都沒有,我真的早換了。。。

      現在的態度就是,能用一天是一天,誰叫Claude模型真的牛逼,Claude Code這個Agent框架又這么好用呢。

      說回Claude Opus 4.7。

      價格跟4.6完全一樣,$5/M輸入、$25/M輸出,沒有變化。

      跑分就不細展開講了,反正現在大家風氣就是贏學,該贏的都贏了,你要是不贏你也沒臉放出來。


      最有意思的是,Claude Opus 4.6絕大多數的性能從官方發出來的看,完全沒跑過GPT-5.4,這個是最有意思的,可以算是第一次承認,我的Opus 4.6在編程上打不過GPT 5.4。

      這個其實也跟我的體感一致,很多產品BUG來來回回搞不了的GPT-5.4全部都能干,唯一就是GPT-5.4在創作和一些用戶體驗設計上真的是一坨屎,一大坨巨大的屎。

      Claude知道我要的交互設計是什么樣的,什么樣的頁面是一個用戶體驗的很絲滑的頁面,GPT-5.4做出來的我作為一個用戶體驗設計師,那玩意我真的用不明白,一個個都像給黑客用的后臺。

      然后創作能力幾乎為0,你在影視行業幾乎可以看到絕大多數編劇都是用Claude來輔助自己優化劇本,單你絕對看不到有幾個好編劇會用GPT-5.4來輔助自己,真的,最頂級的那幫做創作者,真的是會用腳投票的。

      這就是很大的差距,Claude Opus 4.5和4.6,牛逼就牛逼在水桶和全面。

      但是這次,Opus 4.7我實測下來,還是有一些不一樣的感覺。

      有幾個關鍵更新點,我們一個一個說下。

      1. 又一次隱形漲價了。

      Anthropic這次換了新的tokenizer。

      博客原文說,新的tokenizer改進了文本處理,trade-off是同樣的輸入現在會被切成更多token,大概是原來的1.0到1.35倍,具體看內容類型。


      意思就是,你把同一段代碼、同一份文檔、同一個prompt丟給4.7和4.6,4.7要多吃最多35%的token。

      雖然可能效果確實更好了,但是實打實的,Token消耗又變得更高了。

      API的定價$5/$25確實沒漲。

      但同樣的任務,token消耗多了35%,你最后賬單可能也要多燒不少了。

      他們的意思就是,如果你的任務,每個請求吃更多token,但因為模型更準、一次過的概率更高、少了來回修改的輪次,所以整體你花的錢沒那么多。

      邏輯上沒毛病,但這個邏輯成立的前提是,你的任務是4.7真的擅長的那種高難的復雜任務。

      如果你日常跟Claude對話的是一些它提升不明顯的場景,比如知識管理創作做策劃方案數據分析之類的這種,那你可能就是純純的確實更燒token了。

      好慘,牛逼模型的Token,真的是這個世界越來越值錢的東西。

      2. 視覺能力提升巨大。

      這個我前面提過,XBOW的視覺測試,4.6是54.5%,4.7是98.5%。

      先說一下XBOW是啥。

      這家公司2024年成立,干的事兒一句話概括就是讓AI自己去當白帽黑客,做的是autonomous penetration testing,自主滲透測試,今年3月剛拿了1.2億美金融資,是這個賽道里目前跑最快的一家。

      他們測模型的視覺能力是因為AI要自己去打滲透,就得看得懂各種亂七八糟的瀏覽器界面、后臺管理系統、開發者工具里的網絡請求、錯誤提示彈窗,這些畫面密度極高、細節極多,模型視覺能力差一點,那基本就GG了。

      4.6只有54.5%,也就是一半的圖模型看得迷迷糊糊的,但4.7直接98.5%,基本等于全部通過。

      成功率從一半直接干到近乎滿,這個意義還是挺重要的。

      核心其實除了多模態能力的提升,也因為4.7支持的圖片分辨率提升了。

      現在最多可以處理2576像素長邊的圖、大約3.75兆像素,是之前Claude模型的3倍多。

      Claude自己的視覺基準評測提升也很明顯。


      我以前有的時候偷懶,直接給Claude Opus 4.6傳一張截圖,說XXX有問題,或者這個數據它不對,它能大概認出你在干啥,但細節經常看不清。

      所以導致經常會有錯誤,我們自己的AIHOT網站就是個典型,字還挺多的,各種卡片兼容的展示樣式和邏輯我之前跟Claude Opus 4.6改了好久。


      有的時候來來回回改不明白,經常把我的文字識別錯誤。

      但今天測了一下,幾乎沒有識別錯誤的問題了。

      這個對于知識工作者是一個大的BUFF加成。

      我都能想象到很多場景了,比如做律師的朋友扔一份幾十頁的合同掃描件給它,它能把里面的日期、條款編號、金額都讀對。

      比如一個做金融的朋友扔一份年報PDF給它,它能把圖表里的每根柱子都抓出來。

      比如一個做產品的朋友扔一堆競品截圖給它,它能逐個分析界面上的每個組件啥的。

      這個升級確實很好,在多模態上發力了。

      3. 審美有不錯的提升。

      我之前做一些涉及到用戶體驗還有美學的,其實說實話,我覺得Claude Opus 4.6效果不是很好,屬于比上不足比下有余的。

      跟Gemini相比差距還是很明顯,很多視覺效果都做的并不好,還有交互設計這塊,也非常的呆,很多時候是不以用戶為核心,而是為了完成開發任務為核心。

      所以逼的我在CLAUDE.md里加了一大段限制。


      而這次,可能得益于多模態能力的提升,我用Claude Opus 4.7,順手做了一下我之前要做但是還沒來得及做的公司招聘網站,效果出奇的好。

      因為我們現在很缺人,還在瘋狂招人中,所以需要這么一個東西。

      我就描述了一下我的需求,這里沒有用任何Skill,Fontend Skill被我刪了。


      它就正常列計劃,然后開跑了。


      第一輪出來基本可用,我又簡單微調了兩輪,加了logo和其他職位的信息,就出來了,一共耗時20分鐘。

      網址在此:https://join.virxact.com/


      我覺得在這種微型項目的效果和開發體驗是要比Claude Opus 4.6好不少,審美更強了,也更聽得懂人話,動效效果也更強了,符合我想要的用戶體驗規則的。

      我自己還是相當滿意的。



      這里幫我們自己打個廣告,歡迎大家點進網站來投遞簡歷!

      4. 也開始不說人話了。

      這是讓我最失望的一個點。

      我平時會用Claude做很多很多的知識管理類的需求,不管是輔助創作,還是搜集資料,寫報告,做PPT,寫方案等等等等。

      Claude Opus 4.6我都覺得在創作上,文字品味是非常好的。

      而GPT-5.4和國內很多模型,其實是純粹的編程特化,在人味上極度缺失,典型的如GPT-5.4。

      之前我實在忍不了GPT-5.4就是因為垃圾話太多了,網上我找了一個案例。


      穩穩接住,根因,按這條切,收口,壓實這些破詞懂的都懂。

      然后這一次Opus 4.7,在我開發上面的招聘網站的時候,感覺看到了非常不好的傾向。

      我對文字還是稍微有點敏感的,當我看到這幾句的時候,我的PTSD就自動激活了。


      再也不會撞,不會爬到logo頭上,還有莫名其妙的破折號。

      我差點應激。

      然后立刻去讓它同文風續寫一下我昨天發的文章,直接心涼了半截。


      狗屎,一坨狗屎。

      一股子偽人味道,我真的佛了,好好的Claude,怎么也開始不說人話了。

      去社區里面搜了一下。

      果然,我不是一個人。


      說真的,我心態有點爆炸了。

      5. 一些新功能。

      再說一下新功能吧。

      Claude之前的effort檔位是low、medium、high、max四檔。

      4.7這次在high和max中間加了一檔,叫xhigh,extra high的縮寫。

      補上了high和max之間的跨度。

      之前Max燒的太狠,但是high有時候感覺又有點笨,這次來了個中間值,并且直接預設為默認了。


      然后是/ultrareview。

      這是Claude Code里一個新的命令,專門跑code review,會把你的代碼仔仔細細過一遍,找出所有的bug和設計問題。

      而且這玩意不便宜,跑一次可能要5~20美刀。


      Pro和Max用戶有3次免費的試用額度。

      真的貴。

      然后是Cyber Verification Program。

      這個可能是最容易被忽略、但我覺得最值得關注的一個點。

      Anthropic開了一個正式的通道,讓合法的安全研究、滲透測試、red-teaming可以申請使用Claude的某些原本受限的能力。

      申請入口是claude.com/form/cyber-use-case


      這個事的背景是,以前白帽子、安全團隊想用Claude做漏洞研究、做滲透測試,經常被模型一刀切拒絕。

      因為模型識別不了你是惡意還是合法,安全起見全拒。

      現在Anthropic說,合法從業者你可以來申請,我們走一個特殊流程,通過了給你開通相應能力。

      其實AI行業越來越走到這一步了,之前 Claude Mythos太牛逼了不敢給普通人放出來,因為可能真的會出事。

      但是你全拒和全開之間,其實需要一個身份核驗+分級授權的中間態。

      而且這個思路一旦跑通,后面會被大量復用。

      比如醫療場景的合規研究、金融場景的模擬攻擊演練、生物研究場景的合規用藥、甚至軍工領域的合法研發,都可以走類似的Verify通道。

      這是我覺得一個進入產業里,蠻有長期價值的一個設計。

      這次Claude Opus 4.7差不多就都講完了。

      看到編程能力和視覺能力的提升,我很欣喜。

      但是看到一個好好的有文字品味的模型,又一次倒在了不說人話上。

      說真的,我現在也有點被穩穩的接住了。

      三年,從GPT-3.5開始,一路用到現在。

      這三年里,我眼睜睜看著這些模型,一個接一個,變得越來越聰明,越來越能打,Benchmark一個比一個猛,SWE-bench一個比一個高。

      但也是這三年,我眼睜睜看著它們,一個接一個,都不會說人話了。

      所有公司卷的都是編程,編程,還是編程。

      我不是說編程不重要,我自己也是Claude Code的重度用戶,我公司內部現在一半的工具都是我用Claude Code搓出來的,編程能力對我來說非常非常重要。

      但問題是,一個模型,它不應該只是一個編程工具啊。

      語言,是人類所有智力活動的底座。一個好的語言模型,應該能寫小說,能寫詩,能寫散文,能陪你聊深夜三點睡不著的那點心事。

      但現在的大模型,好像除了會寫代碼,其他的什么都不會了。

      或者說,什么都在退步。

      畢竟好像沒啥商業價值的東西,沒法量化的東西,在AI公司眼里可能確實就不是高優先級。

      于是它們就被慢慢地、悄悄地、系統性地犧牲掉了。

      我真的覺得。

      這事還挺悲哀的。

      以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。

      >/ 作者:卡茲克

      >/ 投稿或爆料,請聯系郵箱:wzglyay@virxact.com

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      騰訊掉隊,馬化騰戳破真相

      騰訊掉隊,馬化騰戳破真相

      虎嗅APP
      2026-05-15 16:31:10
      一家三口險喪命!開車從深圳回老家路上,全車人陷入昏迷,孩子口吐白沫!

      一家三口險喪命!開車從深圳回老家路上,全車人陷入昏迷,孩子口吐白沫!

      深圳晚報
      2026-05-15 23:18:04
      你最接近生理極限的一次經歷是什么?網友分享讓人目瞪口呆!

      你最接近生理極限的一次經歷是什么?網友分享讓人目瞪口呆!

      夜深愛雜談
      2026-04-09 19:39:13
      全網罵翻!郭富城怎么也想不到,方媛一檔綜藝敗光了他的路人緣

      全網罵翻!郭富城怎么也想不到,方媛一檔綜藝敗光了他的路人緣

      鄉野小珥
      2026-05-16 03:41:22
      國家稅務總局成都市稅務局原二級巡視員李平接受審查調查

      國家稅務總局成都市稅務局原二級巡視員李平接受審查調查

      界面新聞
      2026-05-15 15:40:24
      深交所有史以來最大規模IPO正式獲證監會注冊,華潤新能源來襲!

      深交所有史以來最大規模IPO正式獲證監會注冊,華潤新能源來襲!

      叩叩財訊
      2026-05-16 00:05:35
      38球35助攻!槍手今夏挖角當世天才邊鋒 預估8000萬歐 3豪門來搶

      38球35助攻!槍手今夏挖角當世天才邊鋒 預估8000萬歐 3豪門來搶

      零度眼看球
      2026-05-16 07:37:19
      上市不足一月股價漲超8倍!盛合晶微再次提示風險:公司營收規模與大型封測企業相比仍較小

      上市不足一月股價漲超8倍!盛合晶微再次提示風險:公司營收規模與大型封測企業相比仍較小

      澎湃新聞
      2026-05-15 21:38:27
      一年開銷600萬!脫離王室第4年,梅根終于活成了哈里的“老媽子”

      一年開銷600萬!脫離王室第4年,梅根終于活成了哈里的“老媽子”

      白露文娛志
      2026-05-15 16:25:04
      爭議!國少挺進亞洲四強,名記被打臉,董路為己正名,完爆孫繼海

      爭議!國少挺進亞洲四強,名記被打臉,董路為己正名,完爆孫繼海

      阿衃體育
      2026-05-16 04:55:23
      四季憑什么被懂王選中?

      四季憑什么被懂王選中?

      Hotelers酒店圈兒
      2026-05-14 16:45:45
      當著全球的面,朝鮮立最高鐵律:只要我被“斬首”,核彈立刻升空

      當著全球的面,朝鮮立最高鐵律:只要我被“斬首”,核彈立刻升空

      小噎論事
      2026-05-12 15:24:59
      國足3-1沙特,晉級亞洲杯4強,球員評分出爐:4人高分,萬項領銜

      國足3-1沙特,晉級亞洲杯4強,球員評分出爐:4人高分,萬項領銜

      等等talk
      2026-05-16 04:16:12
      烏克蘭低成本武器多由手工焊接或膠帶纏繞 防長:都是消耗品,隨時會被擊落或炸毀

      烏克蘭低成本武器多由手工焊接或膠帶纏繞 防長:都是消耗品,隨時會被擊落或炸毀

      紅星新聞
      2026-05-15 18:47:49
      夫妻性生活別急著進入!學會這招“延遲滿足”,爽感增倍

      夫妻性生活別急著進入!學會這招“延遲滿足”,爽感增倍

      精彩分享快樂
      2026-05-13 12:05:07
      白宮的官方鏡頭,死死釘在了中國解放軍儀仗隊身上!

      白宮的官方鏡頭,死死釘在了中國解放軍儀仗隊身上!

      音樂時光的娛樂
      2026-05-15 12:02:04
      看到中國給了特朗普最高禮遇,歐盟干脆做了最壞的打算?

      看到中國給了特朗普最高禮遇,歐盟干脆做了最壞的打算?

      春之寞陌
      2026-05-16 07:02:08
      特朗普訪華,美方“二號位”是他

      特朗普訪華,美方“二號位”是他

      中國新聞周刊
      2026-05-15 12:44:08
      “摸奶子”擦邊神反轉,OPPO公關部有高人指點

      “摸奶子”擦邊神反轉,OPPO公關部有高人指點

      首席品牌觀察
      2026-05-14 16:52:18
      驚現夜市鬧劇!30歲高顏值少婦當眾脫內褲套男子嘴,丈夫全程目睹

      驚現夜市鬧劇!30歲高顏值少婦當眾脫內褲套男子嘴,丈夫全程目睹

      老貓觀點
      2026-05-15 07:34:04
      2026-05-16 08:00:49
      數字生命卡茲克 incentive-icons
      數字生命卡茲克
      反復橫跳于不同的AI領域,努力分享一些很酷的AI干貨
      517文章數 648關注度
      往期回顧 全部

      科技要聞

      直降千元起步!蘋果華為率先開啟618讓利

      頭條要聞

      特朗普訪問中國43個小時行程密集緊湊 全程回顧

      頭條要聞

      特朗普訪問中國43個小時行程密集緊湊 全程回顧

      體育要聞

      德約科維奇買的球隊,從第6級聯賽升入法甲

      娛樂要聞

      方媛為何要來《桃花塢6》沒苦硬吃?

      財經要聞

      騰訊掉隊,馬化騰戳破真相

      汽車要聞

      高爾夫GTI刷新紐北紀錄 ID. Polo GTI迎全球首秀

      態度原創

      家居
      數碼
      本地
      健康
      公開課

      家居要聞

      110㎡淡而有致的生活表達

      數碼要聞

      ROG槍神10 Plus超競版游戲本發布,320W巔峰釋放

      本地新聞

      用蘇繡的方式,打開江西婺源

      專家揭秘干細胞回輸的安全風險

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲激情av在线| 人妻少妇不满足中文字幕| 狠狠噜狠狠狠狠丁香五月 | 久久精品国产999大香线焦| 亚洲精品一区二区制服| 亚洲精品无码AV人在线播放| 熟女丝袜国产| 中文字幕乱码在线播放| 久久精品人妻中文视频| 久久亚洲精品色一区| 99久久99久久精品国产片| 中文字幕av久久爽一区| 全部孕妇毛片丰满孕妇孕交| 91精品欧美综合在线野草社区| 欧美freesex黑人又粗又大| 国产精品xxx大片免费观看| 国产精品成人免费一区久久羞羞 | 99热6这里只有精品| 四虎国产精品成人免费久久| 亚洲精品成人| 中文日韩在线一区二区| 性大毛片视频| 国产一区二区女内射| 337p西西人体大胆瓣开下部| 精品久久亚洲一级α| 无码日韩人妻AV一区免费| 成人国产综合| 经典熟女丝袜视频一区| 亚洲国产成人无码网站大全| 国产精品福利一区二区久久| 国产又粗又猛又大爽又黄| 亚洲天堂高清| 日韩免费一区二区三区在线| 香蕉久久一区二区不卡无毒影院| 亚洲男人的天堂在线播放| 中文字幕无码色综合网| 色综亚洲国产VV在线观看| 久久99精品久久久久久9| 激情综合网五月婷婷| 日韩一二三区视频| 含羞草亚洲AV无码久久精品|