網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

噓，Claude正在「做夢」！睡一覺瘋狂進化，一夜暴漲6倍戰(zhàn)力

2026-05-07 12:07:18　來源: 新智元

北京舉報

分享至

新智元報道

編輯：好困桃子

【新智元導讀】Claude開發(fā)者大會來了！這一次，Anthropic讓Agent學會了「做夢」，兩次干活的間隙自動反芻記憶、自我進化。配合多Agent兵團作戰(zhàn)和自動評分官，AI任務完成率直接暴漲6倍。

就在剛剛，Anthropic讓AI學會做夢了！

Code with Claude舊金山開發(fā)者大會上，Anthropic真的給Claude托管智能體加了一個叫Dreaming的功能——

AI可以在兩次工作的間隙，像人類進入REM睡眠一樣，自動回顧歷史會話、整理碎片記憶、發(fā)現(xiàn)隱藏規(guī)律。

一覺醒來，直接滿級。

同時發(fā)布的還有Outcomes（自動評分）和多智能體編排（multiagent orchestration）。

讓Claude睡一覺，醒來自己變強

任何用過AI Agent的人都知道一個痛點，Agent干活時會往記憶庫里寫東西，但這些記錄是零散的、遞增的。

跑了幾十次會話之后，記憶庫里一團糟，重復條目、過時信息、前后矛盾的內(nèi)容堆在一起。

Agent自己意識不到這個問題，因為它們每次只看到當前會話的局部視角。

而Dreaming就是來解決這件事的。

它是一個定時運行的異步任務，會同時讀取Agent現(xiàn)有的記憶庫和過去最多100個會話的完整文字記錄，然后生成一個全新的、經(jīng)過重新梳理的記憶庫。

具體做三件事：（1）合并重復項；（2）用最新值替換掉過時或矛盾的條目；（3）從歷史會話中挖掘出Agent自己沒注意到的宏觀規(guī)律。

熟悉神經(jīng)科學的人會立刻反應過來，這就是人腦REM睡眠在干的事。

白天大腦吸收原始信息存成短期記憶，夜間REM階段把當天經(jīng)歷重放一遍，強化有價值的連接、丟棄無用信息、整合成長期記憶。

Anthropic的工程師顯然也想到了這層對應關(guān)系，所以直接把功能叫做Dreaming。

1968年菲利普·K·迪克問了一個問題，「仿生人會夢見電子羊嗎」？58年后，Anthropic給出了一個工程層面的回答。

值得注意的是，這里還有一個關(guān)鍵設計。

Dreaming永遠不會修改輸入的原始記憶庫。它生成的是一個全新的輸出記憶庫，開發(fā)者可以先審查結(jié)果，不滿意就直接丟棄。

也就是說，你對AI的「夢境」有完全的控制權(quán)，可以選擇讓它自動生效，也可以人工審核后再決定是否采納。

AI做夢，全程直播

具體來說，Dream任務進入running狀態(tài)后，會暴露一個session_id，開發(fā)者可以流式訂閱這個會話的事件流，實時看到AI正在讀取哪條記憶、正在寫入什么新條目。如果發(fā)現(xiàn)問題，還可以隨時「叫醒」（取消）。

換句話說就是，你趴在AI的床邊，看著它做夢。

跑完之后，底層會話會被歸檔保留，事后還能回看完整的「夢境記錄」。

更關(guān)鍵的是，開發(fā)者可以通過instructions字段告訴AI「做什么夢」。

由于輸入記憶庫不會被修改，理論上你可以對同一份記憶跑多次Dreaming，每次聚焦不同主題，產(chǎn)出不同維度的整理結(jié)果。

Agent交完卷，還有一個評分官在等著

光會做夢還不夠，干活的質(zhì)量誰來把關(guān)？

這就是Outcomes的作用。

開發(fā)者可以寫一套評分標準，描述「什么算交付成功」，然后系統(tǒng)會分配一個獨立的評估器，在它自己的上下文窗口中對Agent輸出進行打分。

由于評估器和干活的Agent完全隔離，因此不會被Agent自身的推理過程帶偏。

只要它發(fā)現(xiàn)問題，就會精準指出需要修改的地方，并讓Agent重新打磨再跑一輪。

此時，開發(fā)者還可以設置最大迭代次數(shù)來控制成本。

根據(jù)Anthropic的內(nèi)部測試，相比標準prompt循環(huán)，Outcomes把任務成功率提升了最高10個百分點。越難的問題，提升越明顯。

在文件生成場景下效果更直觀，docx文檔任務成功率提高8.4%，pptx幻燈片提高10.1%。

這個功能對主觀質(zhì)量評估同樣有效。

比如文案語氣是否符合品牌調(diào)性，設計稿是否遵循視覺規(guī)范，這類以前必須靠人盯的活兒，現(xiàn)在Agent自己就能對照標準反復打磨。

一個Agent搞不定，那就組隊上

第三件套是多智能體編排。

邏輯很簡單，當任務太大或太復雜，單個Agent搞不定時，讓一個主智能體（lead agent）把總?cè)蝿詹鸪啥鄠€小塊，分別派發(fā)給搭載不同模型、不同提示詞、不同工具的專家級子智能體。

這些子智能體基于同一個共享文件系統(tǒng)并行工作，各自的成果匯總到主智能體的全局上下文中。

主智能體可以在工作流進行到一半時隨時找其他智能體對齊進度。

過程中，開發(fā)者還能在Claude控制臺里追溯每一步細節(jié)，哪個Agent干了什么、先后順序、決策理由，全部可見。

6個著陸點砸了2個，睡一覺全修好了

大會上，Anthropic用一個月球采礦無人機著陸任務，把三個功能一口氣串了起來。

第一步，搭兵團。

Commander作為主Agent統(tǒng)籌全局，底下掛兩個專家Agent：Detector負責地質(zhì)探測，判斷采礦點是否值得開采；Navigator負責導航，判斷地形哪里可以安全降落。

第二步，定標準。

Outcomes評分標準就是一個普通的Markdown文件，幾行文字寫清通過條件：軟著陸速度≤2.0 m/s、地面不能有巨石和隕石坑、剩余燃料≥5%。

第三步，跑模擬。

大屏上同時顯示6個著陸點的實時狀態(tài)。

結(jié)果，4個綠色LANDED，但Site 3以398 m/s的速度直接砸了（紅色CRASH），Site 4也沒達標。整體安全評分67%。

這個結(jié)果，顯然是不合格的。

于是，她打開Claude控制臺的Dreams頁面，選了Opus 4.7模型，點擊「Start dreaming」，讓Dreaming跑了一整夜。

Opus 4.7花了8分鐘，從530萬token的歷史會話中蒸餾出一份98行的「Lumara Descent Commander's Playbook」，覆蓋危險規(guī)則、懸停掃描流程、燃料底線、中止走廊等維度。每條規(guī)則都標注了來源于哪次任務。

第二天早上回來，用升級后的記憶庫重新跑了一輪模擬。

原來失敗的2個站點全部修復，原來成功的4個沒有倒退。

整個過程，就是在控制臺里按了幾下按鈕。

Harvey用完漲了6倍，靠的就是這三件套

托管智能體平臺從4月公測以來，核心賣點一直是「你別自己搭Agent基礎設施了，我?guī)湍阃泄堋埂?/p>

但光托管運行環(huán)境還不夠，Agent要真正好用，必須解決三個問題——

1. 跨會話的記憶衰退

2. 不穩(wěn)定的輸出質(zhì)量

3. 單Agent搞不定的復雜任務

這次，Dreaming解決第一個，Outcomes解決第二個，多Agent編排解決第三個。三件套一起上，把Agent從「能跑」推向「能用」。

早期客戶已經(jīng)在驗證這套組合拳。法律AI公司Harvey用上Dreaming后，任務完成率飆升了大約6倍。

目前，Dreaming作為研究預覽版上線，支持Claude Opus 4.7和Claude Sonnet 4.6，需要申請權(quán)限。Outcomes和多Agent編排已進入公測。

費用方面，托管智能體在標準API token費率之外，額外收取每會話小時0.08美元的運行時費用。有開發(fā)者算過賬，24個Agent每天跑8小時，光運行時就是15.36美元/天，還沒算token。

One More Thing

算力自由

同一天還有一個重磅消息。

Anthropic官宣與SpaceX達成協(xié)議，租下馬斯克Colossus 1數(shù)據(jù)中心的全部算力，共22萬張GPU。

Dreaming一次跑530萬token，多Agent并行開工，Outcomes反復迭代打分，全都是吃算力的重活。22萬張GPU，正好給托管智能體這套服務兜底。

同時，「算力自由」也帶來了更直接的用戶福利——

·Claude Code五小時使用限額即刻翻倍。

·取消Pro/MAX中，Claude Code高峰時段限制額度削減。

·Opus API速率限制大幅上漲。

今天，Anthropic給AI裝上了REM睡眠，但這場夢才剛開始做。

迪克當年真正想問的，或許不是仿生人會不會做夢，而是做完夢之后，它還算不算機器。

參考資料：

https://claude.com/blog/new-in-claude-managed-agents

https://x.com/claudeai/status/2052067399088664981

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

Claude Code之父：我們公司已沒真人寫代碼了

智東西 2026-05-09 20:46:17
1 跟貼 1
AI突現(xiàn)首例自我復制！橫跨4國160小時無限繁殖

新智元 2026-05-09 18:31:30
5 跟貼 5

卡帕西都整破防了：AI Coding沒門檻，可部署環(huán)節(jié)真嗯啊的難

量子位 2026-03-27 12:12:46
0 跟貼 0

Clawdbot進化速度離譜：突然開口說話，給自己捏臉，還能炒股砍價

DeepTech深科技 2026-01-29 18:14:10
600 跟貼 600
對話千問AI眼鏡負責人：阿里靠什么攪局“百鏡大戰(zhàn)”？

智東西 2026-05-09 19:13:21
1 跟貼 1

朱旻琦：具身智能用一天進化一天、聰明一天機器人普及核心痛點是需要二次開發(fā)和適配

財聯(lián)社 2026-04-17 16:59:02
0 跟貼 0

生成式Critic重新定義LLM強化學習信用分配

機器之心Pro 2026-05-09 14:52:19
0 跟貼 0
AI Agent是科技革命中的一次真正的范式轉(zhuǎn)移

量子位 2026-04-03 22:52:35
0 跟貼 0

00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
這個時代必須以Agent為中心：三個趨勢回顧

量子位 2026-04-05 02:14:15
0 跟貼 0
2026 AI眼鏡大戰(zhàn)升級！一邊等蘋果出手，一邊憋大招

智東西 2026-05-09 22:02:10
0 跟貼 0
剝奪大模型執(zhí)行權(quán)！港中文開源Agent治理內(nèi)核，高危攔截率達92.95%

新智元 2026-05-09 12:08:54
0 跟貼 0
人類為什么在進化中丟掉“丁丁骨”？

六六冷知識 2026-05-08 20:40:26
123 跟貼 123
ADS 5要進化成這樣了？

差評XPIN 2026-05-08 14:47:55
7 跟貼 7
Markdown不行了？Agent時代，老掉牙的HTML正在逆襲

雷科技 2026-05-09 20:35:53
1 跟貼 1
奧特曼兩大「死對頭」聯(lián)手，但你才是這場 Claude 發(fā)布會最大的贏家

AppSo 2026-05-07 09:41:28
1 跟貼 1
外賣小哥冒死沖進火場救火被物業(yè)收取50元“滅火器使用費”

閃電新聞 2026-05-09 09:31:06
10909 跟貼 10909
你引以為傲的意識，只是無用的'進化寄生物'

老友地理 2026-05-07 19:22:12
1 跟貼 1
這一頓會很瘋狂

快樂圖鑒 2026-05-09 10:39:49
1 跟貼 1
中超瘋狂一夜：蓉城8連勝，申花三輪不勝，積分榜更新

鏗鏘格斗 2026-05-09 23:47:37
3 跟貼 3
那個凌晨兩點還在工作的測試，后來怎么樣了

51Testing軟件測試網(wǎng) 2026-05-09 17:30:11
0 跟貼 0
【AI大模型安全與評測】從DeepSeek-V4拆解真實評估邏輯，90%的人都搞錯了！企業(yè)級大模型評

盧菁老師 2026-05-09 09:07:47
0 跟貼 0
OpenClaw太貴？QuantClaw幫你挑精度，成本砍掉21%，還能提速15%

機器之心Pro 2026-05-09 18:53:28
0 跟貼 0
女兒每次都玩到半夜才回家，媽媽一氣之下把她的密碼鎖權(quán)限刪了

音樂下午茶官方 2026-05-08 23:20:52
0 跟貼 0
吳宜澤500萬獎金背后：父親的選擇99.9%家長做不到

相思賦予誰a 2026-05-09 23:46:35
1 跟貼 1
《巫師3》控制臺指令：PC玩家的"官方外掛"使用指南

峽谷一級保護廢物 2026-05-07 16:52:03
0 跟貼 0
三部門：加快研究智能體相關(guān)政策法規(guī)及倫理規(guī)范

界面新聞 2026-05-08 18:25:22
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
嘴炮王者譚sir竟被邏輯女帝反殺成渣：愿大姐被歲月溫柔以待

解壓小劇場 2026-05-09 08:17:50
3 跟貼 3
PackingStar雙智能體博弈，攻克14維難題

量子位 2026-02-16 13:12:43
0 跟貼 0
智能體從「單兵作戰(zhàn)」到「精銳團隊」 -2

機器之心Pro 2026-04-28 16:56:00
0 跟貼 0
2026數(shù)字文旅賽道作品展播｜構(gòu)建湄洲島“數(shù)字文旅AI智能體” 共筑兩岸心靈互通的“數(shù)字海峽”

金臺資訊 2026-05-09 15:29:17
0 跟貼 0
爆火！把智能體當游戲角色來玩，一個人就是一個公司

機器之心Pro 2026-02-12 18:04:44
0 跟貼 0
四川：到2027年新一代智能終端、智能體等應用普及率超70%

界面新聞 2026-05-08 16:10:35
0 跟貼 0
單Agent時代正式結(jié)束：一個干不過，就上300個-3

機器之心Pro 2026-04-22 00:08:00
0 跟貼 0
瘋子和天才之間，只隔著一片沙漠

雷科技 2025-11-17 18:27:37
0 跟貼 0
65歲老媽手寫游戲王攻略，筆記超過十頁，我玩了十年都沒她記得細

國創(chuàng)漫話 2026-05-09 23:38:52
0 跟貼 0
為何只有人類有下巴

迷你科普知識 2026-05-08 08:35:33
0 跟貼 0
Claude狂印鈔！Anthropic人均營收900萬美元，吊打英偉達

新智元 2026-05-09 15:06:42
9 跟貼 9
紅星評論｜蓉城將士今晚拼下的勝利，證明球場上沒有不可逾越的宿命

紅星新聞 2026-05-09 22:58:26
8 跟貼 8

新智元

AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代

15170文章數(shù) 66852關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

藝術(shù)

本地

數(shù)碼

教育

手機 / 數(shù)碼

房產(chǎn) / 家居

噓，Claude正在「做夢」！睡一覺瘋狂進化，一夜暴漲6倍戰(zhàn)力

美國政府強力下場 蘋果英特爾達成代工協(xié)議

演員文章面館大火后又開酒吧 多位明星到場母親也現(xiàn)身

演員文章面館大火后又開酒吧 多位明星到場母親也現(xiàn)身

成立128年后，這支升班馬首奪頂級聯(lián)賽冠軍

50歲趙薇臉頰凹陷滄桑得認不出！

多地號召，公職人員帶頭繳納物業(yè)費

軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

態(tài)度原創(chuàng)

：星寶家長必須知道的5個知識點~

深圳終究失去“中國第一高樓”，華潤接手地塊！

用蘇繡的方式，打開江西婺源

有鴻蒙·更美的——全球首臺鴻蒙智選美的智能空調(diào)上市

明明叫作“黑板”，可為什么都是綠色的？

美國政府強力下場蘋果英特爾達成代工協(xié)議

演員文章面館大火后又開酒吧多位明星到場母親也現(xiàn)身

演員文章面館大火后又開酒吧多位明星到場母親也現(xiàn)身

軸距加長/智駕拉滿阿維塔07L定位大五座SUV