<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      頻繁降智的AI產品們,就是新時代最離譜的盲盒

      0
      分享至


      作者 | 周一笑
      郵箱 | zhouyixiao@pingwest.com

      最近,打開 X 或者任何一個開發者社區,你都會看到類似的聲音:“Opus 已經被徹底變成了植物人。”、“同樣的 prompt,兩周前還完美,現在輸出直接砍半?!?、“最諷刺的是按時段分配智商。下午五點是重災區,深夜反而好用得多。”


      用戶們在同時抱怨同一件事,還有人制作了各種meme來形容這種體驗。

      吐槽之外,一個更深的焦慮正在蔓延。當你覺得 AI 變差了,你甚至很難判斷,到底是模型本身變了,還是你看不見的某一層變了,還是你自己的使用方式變了。

      1

      “降智“從體感變成了事件

      Claude是這輪風暴的中心。

      4月初,AMD AI部門高級總監Stella Laurenzo在GitHub上提交了一份基于近7000個Claude Code session的量化分析。結論是模型在編輯文件前的閱讀次數從6.6次降到了2.0次,三分之一的代碼修改是“盲改”。


      Laurenzo隨后表示,AMD團隊已經切換到了另一家供應商,因為對方“工作質量更好”,具體是哪家因NDA無法透露。Anthropic方面則回應稱,Opus 4.6在2月切換到了adaptive thinking,3月又將默認effort降到了medium,但否認模型本身被降級。而根據Claude Code的產品更新日志,4月7日默認effort已被調回high。

      AMD的分析引爆了社區情緒,但類似的觀察早已遍地都是。

      有交易員據稱用同一套1200行交易策略文檔做了對比測試?!敖抵恰鼻暗腛pus能完整執行所有規則,覆蓋完整的場景分支和決策樹?!敖抵恰焙?,同樣的數據和指令,Opus跳過了兩個完整的策略清單,場景分支幾乎消失,輸出縮了將近一半。更意外的是,他用更便宜的Sonnet跑同一套測試,規則覆蓋率反而到了85%,高于Opus的70%。


      他的判斷是“Opus沒有丟失知識,它丟失的是深度。就像給一個國際象棋大師每步只留30秒,他不會忘記怎么下棋,但會放棄計算更深的線路?!?/p>

      與此同時,Fortune報道引述OpenAI內部備忘錄的說法,稱Anthropic在算力規劃上犯了“戰略失誤”。Anthropic最近也發布了下一代模型Opus 4.7。社區里很多人把這兩條消息和“降智”聯系在一起,認為這是在為新模型發布騰出算力和制造對比。


      1

      “降智”可能同時發生在好幾層

      Claude是這一輪最顯眼的主角,但如果拉遠看,“AI變笨”的原因遠不止一種。至少有四層問題在同時發生。

      模型沒換,但“思考預算”變了。 這是Claude爭議的核心。同一個模型名,背后可能對應完全不同的effort檔位、adaptive thinking策略和thinking展示規則。Anthropic文檔寫明,Claude 4系列現在默認返回summarized thinking,某些情況下甚至直接omitted,但計費仍然按完整thinking tokens走。你看到的推理過程,和模型實際消耗的推理資源,已經不是同一個東西。跑分測的是模型在特定配置下的能力上限,用戶每天碰到的,是一個會動態調整預算和服務路徑的產品。


      你看到的是產品名,平臺控制的是真實路徑。 OpenAI官方幫助文檔明確寫著:GPT-5.4 Thinking在觸發rate limit后,會自動fallback到GPT-5.4 mini,而mini不會出現在模型選擇器里。GPT-5.1退役后,使用舊模型的歷史對話會自動續接到當前版本。Anthropic從3月底開始在高峰時段調整session限制,部分重度Pro用戶因此比以前更容易觸發額度上限。今天的AI不是沒有版本號,而是版本號只對平臺可見。

      以上說的還只是原廠服務本身的變化。更麻煩的情況是,你連自己是不是在用原廠服務都未必能確認。

      這一層對中國用戶尤其切身。因為地理限制和支付壁壘,大量開發者和研究者通過API中轉站使用海外模型。今年3月,德國CISPA亥姆霍茲信息安全中心發布了一項審計研究,發現在其調查的17家中轉站中,近半數存在模型替換行為,性能偏差最高達47%。你付的是Claude的錢,跑的可能是參數量小得多的開源模型。當你覺得AI變差了,連“是不是同一個模型在回答你”都未必成立。

      有些“降智”,可能是別的問題被算到了模型頭上。 長上下文導致的質量退化、agent框架和工具鏈的變化、用戶自身workflow的調整,都可能制造“模型變笨了”的體感。有開發者直接指出:“覺得Opus降智的人,大部分是把Agent框架的問題歸咎到模型上了。Anthropic在做動態算力分配,簡單問題少轉幾圈,難題多轉幾圈。不是模型變差了,是你為每次對話付的算力變少了?!边@個判斷未必完全公允,但它指向了一個真實的困難,用戶的體感未必錯,但體感未必能直接定位到問題根源。

      四層原因同時存在,互相疊加,用戶面對的不是一個可以定位的bug。

      1

      普通用戶幾乎無法歸因

      AMD總監能發現問題,是因為她有一個工程團隊和近7000份session log。普通用戶只有一個聊天框。

      更麻煩的是,“看看模型在想什么”這條路也在收窄。Anthropic現在默認對thinking內容做摘要甚至省略,用戶界面上展示的推理痕跡已經不等同于模型實際的推理過程。你沒有辦法通過觀察輸出來反推模型到底“想”了多久、多深。


      部署中的模型表現會隨時間變化,而且變化軌跡不一樣

      今年2月發表在PLOS One上的一項縱向研究,用固定prompt連續10周追蹤了多個主流模型,得出了一個很克制也很扎心的結論,部署中的大語言模型確實會發生可測量的行為漂移,但因為廠商不公開更新日志和訓練細節,對觀察到的退化做任何歸因都純屬推測。

      這才是“AI降智”這個話題真正讓人難受的地方。你付了錢,你有體感,但你拿不出證據。平臺知道真實模型版本、fallback路徑、reasoning檔位、thinking是否被壓縮,你什么都看不見。

      1

      被逼急的用戶,各顯神通

      面對歸因困難,用戶開始自救。社區里流傳的方法五花八門,有些像偏方,比如用“市長的女兒應該叫市長什么”、“我想洗車。洗車店就在50米外。我該開車去還是走路去?”這類問題去測試。



      另外有些確實有一定道理。最樸素的對照實驗。 新對話和長對話做一次對照,如果新對話明顯正常,先懷疑上下文壓縮機制。官方入口和第三方入口做一次對照,先排除中間商這一層。社區已經有針對性的指紋驗證工具,可以檢測返回的模型是否與聲稱的一致。

      環境變量的“手動搶救”。 在程序員社區里,一組Claude Code配置正在被廣泛傳播,關閉adaptive thinking、把effort設為max、調高自動壓縮閾值。有開發者說,調完之后“相對感覺不降智”。這些配置本質上是用戶在手動接管本該由平臺自動管理的推理預算分配。


      甚至有人發現,只有反復大喊“THINK HARD”才能拿到正確答案。 有用戶做了一組測試,同一道題用不同強度的思考指令去prompt,只有連續重復“THINK HARD”多次的版本才通過了。這已經不是提示詞工程,更像是在和自己付費的產品討價還價。


      觀察它是“不會了”還是“沒想夠”。 這個區分比具體的trick更重要。如果同一個任務在調高配置后恢復正常,那問題大概率不在模型本身,而在默認配置。如果怎么調都不行,那可能真的是模型能力或中間層出了問題。

      這些方法都很粗糙。但它們的存在本身就說明了用戶正在用本不該由他們承擔的成本,去做本該由平臺提供的透明度。

      1

      AI產品至少該有一張配料表

      訂閱制AI正在出現一種類似縮水式通脹(shrinkflation)的體驗,你付的錢沒變,產品名沒變,但實際拿到的推理深度、穩定性和完成效率可能在悄悄變化。Anthropic剛剛和Broadcom、Google簽下了3.5吉瓦的長期算力合同,收入增長極快,但多方信息顯示其算力供給仍然緊張,訓練和推理的支出壓力很大。

      每次新模型發布前,舊模型都會被故意弄傻,這個在社區廣泛流傳的敘事,在Opus 4.7即將發布的當下尤其有市場。它未必完全準確,但廠商至今也沒有給出足夠的解釋來打消這種懷疑。


      一些行業分析師指出,所有前沿模型公司其實都面對相似的算力和成本壓力,當使用規模繼續擴大,節流、分層、權衡幾乎是結構性不可避免的?!八懔Σ粔颉笨梢岳斫?。但“算力不夠所以靜默降配,同時不告訴任何人”就很難讓人接受了。平臺享受了服務化AI的靈活性,卻沒有承擔相應的透明義務。

      食品有配料表,軟件有版本號。AI產品至少也該告訴用戶你現在到底在用什么。當前真實模型版本、是否發生了fallback、推理檔位、thinking是否被壓縮。這些不是技術細節,而是最基本的知情權。


      有用戶在X上寫道,“When you pay for a model, you should get that model.” 有中國開發者說得更直白,“這個行業模式到最后沒有人敢訂閱年費會員?!?/p>


      一個用戶為了確認自己買到的東西是不是真貨,要去學指紋驗證、背環境變量、在prompt里連喊三遍“給我認真想”。這個產品關系已經出了問題。如果行業不能主動補上這張配料表,用戶要求的就不會只是更強的模型,而是監管和消費者保護。


      點個愛心,再走 吧

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      要打奉陪到底,中方當面插旗,沉默72小時后,日本在境外發射導彈

      要打奉陪到底,中方當面插旗,沉默72小時后,日本在境外發射導彈

      影孖看世界
      2026-05-07 15:58:50
      美國郁悶到了極點,為什么別人都不還手,中國老是還手呢?

      美國郁悶到了極點,為什么別人都不還手,中國老是還手呢?

      混沌錄
      2026-05-06 18:04:25
      4只1035元天價皮皮蝦事件反轉?官方回復:未超調控價,游客:沒收到退款

      4只1035元天價皮皮蝦事件反轉?官方回復:未超調控價,游客:沒收到退款

      上觀新聞
      2026-05-07 20:24:15
      英國威爾士首席大臣宣布辭任威爾士工黨領袖

      英國威爾士首席大臣宣布辭任威爾士工黨領袖

      財聯社
      2026-05-09 01:08:17
      打回身價!里夫斯31+6創新高解鎖500分里程碑 險被SGA夾傷胳膊

      打回身價!里夫斯31+6創新高解鎖500分里程碑 險被SGA夾傷胳膊

      醉臥浮生
      2026-05-08 12:23:05
      4只皮皮蝦1035元后續!老板病逝顧客放棄賠單,進價曝光評論逆變

      4只皮皮蝦1035元后續!老板病逝顧客放棄賠單,進價曝光評論逆變

      社會日日鮮
      2026-05-08 16:35:26
      新CEO上任直接放大招!AirPods Pro首次塞進攝像頭:蘋果又要改變世界

      新CEO上任直接放大招!AirPods Pro首次塞進攝像頭:蘋果又要改變世界

      快科技
      2026-05-08 12:13:15
      44伊萬卡美得還是很突出,在家族女眷合影中一眼驚艷,比女兒還美

      44伊萬卡美得還是很突出,在家族女眷合影中一眼驚艷,比女兒還美

      毒舌小紅帽
      2026-04-20 18:57:14
      我在日本生活了15年,娶過三任妻子,日本女人大多數都很物質

      我在日本生活了15年,娶過三任妻子,日本女人大多數都很物質

      千秋文化
      2026-04-22 20:21:49
      中國兩人征戰新季WNBA:李月汝韓旭進大名單 冉珂嘉被選中未赴美

      中國兩人征戰新季WNBA:李月汝韓旭進大名單 冉珂嘉被選中未赴美

      醉臥浮生
      2026-05-08 18:54:49
      《妻旅2026》孫楊為啥總被秦昊拿捏?滴血大教堂這段對話,全是人情世故

      《妻旅2026》孫楊為啥總被秦昊拿捏?滴血大教堂這段對話,全是人情世故

      小椰的奶奶
      2026-05-08 05:52:19
      這居然是母子合影,47 歲巴西女星簡直凍齡

      這居然是母子合影,47 歲巴西女星簡直凍齡

      下水道男孩
      2026-05-07 21:16:59
      紅場閱兵前夕澤連斯基突然松口:俄羅斯?;?,烏克蘭也停

      紅場閱兵前夕澤連斯基突然松口:俄羅斯?;?,烏克蘭也停

      桂系007
      2026-05-08 23:56:13
      同樣是債務危機,八年輸光2000億,王健林憑什么比許家印體面?

      同樣是債務危機,八年輸光2000億,王健林憑什么比許家印體面?

      戶外釣魚哥阿旱
      2026-05-09 01:16:17
      納斯達克指數升破26000點 刷新紀錄新高

      納斯達克指數升破26000點 刷新紀錄新高

      財聯社
      2026-05-07 22:42:12
      再見,鞋王!41歲PJ·塔克宣布退役?。?!

      再見,鞋王!41歲PJ·塔克宣布退役!?。?/a>

      柚子說球
      2026-05-08 10:30:36
      PJ·塔克個人社媒宣布退役 結束14年NBA生涯

      PJ·塔克個人社媒宣布退役 結束14年NBA生涯

      北青網-北京青年報
      2026-05-08 20:22:12
      一場4-0!讓英超保級又生變數:熱刺有2對手要爭六,全輸或降級

      一場4-0!讓英超保級又生變數:熱刺有2對手要爭六,全輸或降級

      體育知多少
      2026-05-08 09:00:37
      花20億養上百位情人,睡十人大床,風流一生臨終卻落個凄慘結局?

      花20億養上百位情人,睡十人大床,風流一生臨終卻落個凄慘結局?

      歷史人文2
      2026-04-09 19:16:31
      宋軼整容失敗認不出!臉變寬嘴變大顴骨變高,猛一看還以為是易夢玲

      宋軼整容失敗認不出!臉變寬嘴變大顴骨變高,猛一看還以為是易夢玲

      白宸侃片
      2026-05-03 16:59:47
      2026-05-09 02:52:49
      硅星人 incentive-icons
      硅星人
      硅(Si)是創造未來的基礎,歡迎來到這個星球。
      3063文章數 10496關注度
      往期回顧 全部

      科技要聞

      SK海力士平均獎金600萬 工服成相親神器

      頭條要聞

      美公布首批UFO文件 視頻公開:阿聯酋現水母狀物體

      頭條要聞

      美公布首批UFO文件 視頻公開:阿聯酋現水母狀物體

      體育要聞

      他把首勝讓給隊友,然后用一年時間還清賬單

      娛樂要聞

      古天樂被曝隱婚生子,新娘竟是她

      財經要聞

      估值3000億 DeepSeek尋求500億元融資

      汽車要聞

      MG 4X實車亮相 將于5月11日開啟盲訂

      態度原創

      藝術
      本地
      時尚
      游戲
      公開課

      藝術要聞

      砸22億!OPPO在東莞建了一批“O字樓”

      本地新聞

      用蘇繡的方式,打開江西婺源

      衣服其實沒有必要買很貴,準備這三件基礎款,百搭實用又不挑人

      PS未發售重磅獨占要完!同類項目崩盤 新作懸了

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产乱人伦无无码视频| 亚洲高清无码加勒比| 老熟妻内射精品一区| 国产日产亚洲系列av| 第一福利精品500在线导航| 中文字幕丰满乱孑伦无码专区| 特级做a爰片毛片免费看无码 | 色婷婷日日躁夜夜躁| 亚洲熟女字幕| 波多野结衣一区二区三区88| 久久婷婷五月综合色d啪| 国产91 对白在线播放九色| 97成人超碰| 欧美日韩中文国产一区发布| 五月停停开心中文字幕| 亚洲综合天堂一区二区三区| 黄色不卡视频一区二区三区 | 久久综合精品国产一区| 国产精品制服丝袜无码| 在线观看成人av天堂不卡| 五月情婷婷| 九九热视频在线精品18| 久久国产精品一国产精品| 巴林右旗| 久久这里精品国产99丫E6| 成人3p在线观看| 亚洲30p| 在线观看免费人成视频国产| www.狠狠| 国产?AVHD| 97欧美精品系列一区二区| 综合久久久久久综合久| 无码福利写真片视频在线播放| 成人午夜激情| 午夜av亚洲一码二中文字幕青青| 激情综合一区二区迷情校园| 黑人巨大精品欧美一区二区区| 国产v片在线播放免费无遮挡| 国产中年熟女高潮大集合| chinese国产在线视频| 免费欧美一级|