<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      AI學會夢里干活!Claude發布3大進化,Dario:單人公司10億美金爆發

      0
      分享至



      今天的 Code with Claude 大會,Anthropic 一口氣發了一堆東西。

      做夢、成果評估、多 Agent 協作,這三項功能正式上線到了 Claude Managed Agents。其中成果評估和多 Agent 協作已經直接可用,做夢則需要單獨申請訪問權限。

      但在所有發布里,有一個功能是從源碼泄露就開始被人惦記的——今天它終于上線了。

      那就是“做夢”。

      從源碼泄露到正式上線

      幾個月前,Claude Code 源碼意外泄露,開發者社區里有人在代碼里發現了一個正在開發的功能,名字叫 Dreaming。當時大家都在猜這是什么東西,有人說是某種記憶壓縮,有人說是后臺自動優化,眾說紛紜。

      用過 Claude 長期項目的人都有一個感受:用的時間越長,Agent 的表現反而開始變奇怪。它會忘記之前學到的東西,或者記住了一堆相互矛盾的信息,有時候同一個問題給出截然不同的答案。

      這不是模型變笨了,是 memory 出了問題。

      Agent 在每次工作 session 中會往 memory store 寫東西,記住自己學到了什么——這個工具怎么用、這個用戶喜歡什么格式、這個任務有什么坑。但時間長了,memory 里會堆滿重復條目、過時信息和相互矛盾的記錄。就像你用了三年的 Notion 筆記庫,打開來全是冗余和過期內容,找有用信息反而比沒有筆記庫更難。

      Dreaming 解決的就是這個退化問題。

      它是一個在 session 之間運行的異步任務,讀取現有的 memory store 和過去最多100個 session 的記錄,然后生成一個全新的、整理好的 memory store:重復的合并,過時的替換成最新值,還能從多個 session 的交叉分析中發現新模式。

      Anthropic 官方的描述是:memory 讓 Agent 在工作中記住學到了什么,dreaming 讓 Agent 在工作間隙想明白這些經驗意味著什么。一個是即時學習,一個是反思整理。

      這個類比非常準確。人類睡覺的時候大腦并沒有停下來,而是在整理白天的記憶、鞏固學到的東西、處理沒解決的問題。Anthropic 給 Agent 設計的 Dreaming,邏輯完全一樣。

      還有一個設計細節值得注意:做夢不會修改原始數據。輸入的 memory store 保持原樣,輸出寫到一個新的 store 里,不滿意可以直接丟掉。這個設計很克制——你不用擔心 Agent“夢游”把重要記憶搞亂了。

      目前支持 claude-opus-4-7和 claude-sonnet-4-6兩個模型,耗時取決于輸入量,通常幾分鐘到幾十分鐘,按標準 API token 費率計費。想試的話需要單獨申請,申請地址:https://claude.com/form/claude-managed-agents

      成果評估:Agent 干完活,自己給自己打分

      以前讓 Agent 干活,最大的問題不是干不完,而是干完了你不知道干得好不好,還得人工檢查。

      成果評估(Outcomes)把這個檢查環節自動化了。

      邏輯是這樣的:你寫一份評分標準(rubric),Agent 干完活之后,一個獨立的 grader 會對著 rubric 逐項打分。這個 grader 運行在獨立的上下文窗口里,不會影響 Agent 的工作上下文。如果判定某些條目沒達標,會把具體差在哪里反饋給 Agent,Agent 拿著反饋改,改完再評,直到全部達標或者迭代次數用完——默認3次,最多20次。

      Anthropic 內部測試的數據:outcomes 比標準 prompting loop 的任務成功率高了最多10個百分點,在文件生成任務上,docx 成功率+8.4%,pptx 成功率+10.1%。越難的任務提升越明顯。

      配合同時推出的 Webhooks,你可以定義好 outcome,讓 Agent 去干,干完了 webhook 通知你,完全不用盯著看。這才是“AI 員工”該有的工作方式——你布置任務、定標準、等結果,中間不用管。

      已經有公司在生產環境跑這套東西了。Wisedocs 是一家醫療文檔質檢公司,用 outcomes 的 rubric 對照內部質檢標準審核文檔,實測數據是 AI 加人類協作比純人類審核快了50%,多抓了30%的錯誤。法律科技公司 Harvey 用 Managed Agents 協調長文法律文書起草,加了 dreaming 之后完成率漲了大約6倍。

      多 Agent 協作:像一個小型項目組

      第三個功能是多 Agent 協作(Multiagent Orchestration),說白了就是讓一群 Agent 分工干活。

      當工作太復雜,一個 Agent 搞不定,系統會讓一個 lead agent 把任務拆成幾塊,分給不同的 specialist agent 并行處理。每個 specialist 有自己的模型、prompt 和工具集,在自己的 session thread 里工作,上下文互相隔離。但它們共享同一個文件系統——一個 agent 寫了文件,另一個 agent 能讀到。

      線程是持久的,lead agent 可以回頭找之前調用過的 agent 繼續聊,那個 agent 還記得之前做了什么。在 Claude Console 里可以追蹤每個 agent 的每一步操作,誰做了什么、什么順序、為什么這么做,全程可見。

      有一個有意的限制:只支持一層委托。Lead agent 可以調用其他 agent,但被調用的 agent 不能再調用下一層。Anthropic 在“能力”和“可控性”之間做了明確的取舍,防止 agent 鏈式調用失控。

      已經有公司在生產環境跑這套東西了。Netflix 的平臺工程團隊用 multiagent 并行分析幾百個 build 的日志,只浮出反復出現的問題模式,忽略一次性噪音。

      寫作工具 Spiral 用了一個很聰明的模型分層方案:Haiku 當領隊接需求、問跟進問題,然后把寫作任務分給 Opus 的子 agent 干,要多個稿件就并行跑,用 outcomes 對著編輯標準和用戶個人風格給每篇稿子打分,不達標不交。

      在推特上,開發者Simon Willison在直播時提到,演示里有Commander、Detector、Navigator三個agent協作處理復雜任務,分工明確、并行執行。這套機制現在已經進入公測,開發者可以直接上手試。

      Dario 說的那句話

      大會上,Dario 說了一句話,此前就在開發者社區里傳得很廣的話:

      AI 時代會出現單人創造10億美金營收的公司。

      這話放在兩年前聽著像吹牛,但放在今天的數據面前,你會覺得它沒那么離譜。

      Lovable,一個 AI 應用構建工具,兩年不到做到4億美金 ARR。Base44,一個人做的 AI 應用構建器,6個月內做到100萬美金 ARR、30萬用戶,然后以8000萬美金現金賣給了 Wix。

      還有一個叫 Medvi 的案例——一個人用 AI 寫代碼、生成廣告、處理客服、分析業務,14個月做到18億美金營收的軌道上,沒有投資人,沒有團隊。

      Cursor 正在沖刺500億美金估值,Claude Code 自己上線12個月市場份額12.5%,年化收入25億美金。

      這些數字背后的邏輯是一致的:傳統意義上,一家公司要做到10億美金營收,需要銷售、客服、運營、技術……少則幾百人,多則幾千人。這不是因為創始人不夠聰明,而是因為人類的時間和精力有上限,一個人能管理的復雜度有天花板。

      但如果 Agent 真的能持續自主運行——幫你寫代碼、跑測試、處理客戶問題、管理供應鏈——那個天花板就不一樣了。一個人能調度的“工作量”,理論上可以無限擴展。

      Dario 不是在說“AI 會幫你賺錢”這種空話,他是在說,組織結構本身會被重寫。

      當然這個預測有很多前提:Agent 的可靠性要足夠高,出錯率要足夠低,用戶對 AI 自主決策的信任要建立起來。這些都還在路上。但今天發布的 Dreaming、Outcomes、Multi-agent,恰好就是在往那個方向鋪路。

      把這些放在一起看

      做夢解決了 Agent 記憶退化的問題,成果評估解決了“干完了誰來檢查”的問題,多 Agent 協作解決了“復雜任務一個人搞不定”的問題。

      三個功能,解決的是同一件事:讓 Agent 真正能獨立工作,而不只是“你問我答”。

      Anthropic 一直被外界貼著“安全派”的標簽,相比 OpenAI 的激進顯得更保守。但今天這些東西放在一起,你會看到一家公司在非常系統地鋪路——不是在做功能,是在搭基礎設施,為一個“AI 真正能獨立工作”的世界做準備。

      Dario 說單人公司10億美金不是夢。今天發布的這些,是他給這句話的注腳。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      兩月蒸發378億,盧比自由落體:當年韓國那場噩夢,離印度不遠了

      兩月蒸發378億,盧比自由落體:當年韓國那場噩夢,離印度不遠了

      鍋鍋愛歷史
      2026-05-16 06:43:22
      老舊預制板房要拆?國家態度亮明,4種補償方式,別稀里糊涂了!

      老舊預制板房要拆?國家態度亮明,4種補償方式,別稀里糊涂了!

      老特有話說
      2026-05-16 17:35:05
      波特蘭媒體人:開拓者嚴重高估楊瀚森即戰力 換帥將帶來全新機會

      波特蘭媒體人:開拓者嚴重高估楊瀚森即戰力 換帥將帶來全新機會

      羅說NBA
      2026-05-16 17:34:52
      巴薩官方致謝萊萬:你如星辰降臨,如傳奇離去,謝謝你

      巴薩官方致謝萊萬:你如星辰降臨,如傳奇離去,謝謝你

      懂球帝
      2026-05-16 19:32:12
      特朗普來中國面相都變了!嚴肅認真謹慎端莊,川你讓我感到陌生

      特朗普來中國面相都變了!嚴肅認真謹慎端莊,川你讓我感到陌生

      大又元
      2026-05-16 20:22:01
      權色交易、陪睡上位,她根本不沾邊,簡直是娛圈的一股“清流”

      權色交易、陪睡上位,她根本不沾邊,簡直是娛圈的一股“清流”

      枯蝶
      2026-05-16 11:38:52
      消息人士:美以或最早下周恢復對伊朗軍事行動

      消息人士:美以或最早下周恢復對伊朗軍事行動

      每日經濟新聞
      2026-05-16 16:18:14
      家中空無一人,陽臺突然起火!深圳業主怒把樓上鄰居全告了!警方揪出重要線索

      家中空無一人,陽臺突然起火!深圳業主怒把樓上鄰居全告了!警方揪出重要線索

      南方都市報
      2026-05-16 17:43:25
      外交部:中俄雙方一直就籌備兩國元首會晤保持著密切溝通

      外交部:中俄雙方一直就籌備兩國元首會晤保持著密切溝通

      新京報
      2026-05-15 19:24:07
      全球資產爆跌,新的鬼故事來了

      全球資產爆跌,新的鬼故事來了

      大何日拱一卒
      2026-05-15 23:04:20
      黃仁勛現身遭大量市民圍堵合影!現場寸步難行,保鏢竟束手無策

      黃仁勛現身遭大量市民圍堵合影!現場寸步難行,保鏢竟束手無策

      烈史
      2026-05-16 10:27:45
      生活的獨處:不是孤獨,是自由的入口

      生活的獨處:不是孤獨,是自由的入口

      疾跑的小蝸牛
      2026-05-16 20:19:02
      41歲詹姆斯年薪砍掉3700萬!湖人壓價,他直接喊“不值”

      41歲詹姆斯年薪砍掉3700萬!湖人壓價,他直接喊“不值”

      阿晞體育
      2026-05-16 20:32:47
      三年不報警不公開,支付寶究竟在害怕什么?

      三年不報警不公開,支付寶究竟在害怕什么?

      聽心堂
      2026-05-15 12:20:38
      最新!國內油價或將迎調整

      最新!國內油價或將迎調整

      91.6陜西交通廣播
      2026-05-16 18:50:59
      涉嫌嚴重違紀違法,劉風被查

      涉嫌嚴重違紀違法,劉風被查

      都市快報橙柿互動
      2026-05-16 19:15:33
      被抓、家中金條堆成山,原來王麗坤和車曉是同類人

      被抓、家中金條堆成山,原來王麗坤和車曉是同類人

      阿傖說事
      2026-05-16 15:46:45
      它是“菜中人參”5月遇到別手軟,全身是寶,隨手一泡,隨吃隨取

      它是“菜中人參”5月遇到別手軟,全身是寶,隨手一泡,隨吃隨取

      阿龍美食記
      2026-05-14 14:55:22
      上海爸爸急哭!3歲兒子公園走丟,2小時后現身40公里外機場

      上海爸爸急哭!3歲兒子公園走丟,2小時后現身40公里外機場

      新民晚報
      2026-05-16 12:06:13
      黃仁勛在北京座邁巴赫,被上萬人擠到水泄不通,最后“落荒而回”

      黃仁勛在北京座邁巴赫,被上萬人擠到水泄不通,最后“落荒而回”

      小娛樂悠悠
      2026-05-16 12:24:54
      2026-05-16 20:55:00
      鯨選AI incentive-icons
      鯨選AI
      最新AI產品化與商業化案例速遞
      159文章數 38關注度
      往期回顧 全部

      科技要聞

      漲的是車價,要的是老命

      頭條要聞

      涉及五個方面 中美經貿磋商初步成果公布

      頭條要聞

      涉及五個方面 中美經貿磋商初步成果公布

      體育要聞

      馬刺2號,少年老成,這集看過?

      娛樂要聞

      謝霆鋒北京街頭騎行被偶遇,側顏帥炸

      財經要聞

      造詞狂魔賈躍亭

      汽車要聞

      高爾夫GTI刷新紐北紀錄 ID. Polo GTI迎全球首秀

      態度原創

      時尚
      游戲
      教育
      藝術
      親子

      女人不管年紀多大,都可以備好一件經典條紋T恤,減齡又舒適

      LCK第二賽段:大難不死,必有后福!T1讓一追二,三局戰勝GEN

      教育要聞

      一圖講透提前批!

      藝術要聞

      23幅 張祖英油畫作品集

      親子要聞

      “白血病”為何專挑孩子下手?建議:這5種食物,孩子再饞也別買

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: sihu永久在线播放地址| 亚洲欧洲美色一区二区三区| 亚洲精品久久久中文字幕痴女| 国产xxxxx| 7777久久亚洲中文字幕蜜桃| 免费国产va在线观看视频| 精品中文人妻在线不卡| 久久er99热精品一区二区| 久久精品水蜜桃av综合天堂| 久久国产精品99精品国产| 桃花岛亚洲成在人线av| 中文字幕亚洲精品2页| 一本色道久久99一综合| 3p在线视频| 最新精品国偷自产在线下载 | 午夜成年影院| 亚洲五月天综合| 久久综合一本中文字幕| 99久久精品日本一区二区免费| 蜜芽国产尤物av尤物在线看| 日本乱一区二区三区在线| 男女动图视频网站在线播放| 日本熟妇色xxxxx欧美老妇 | 宜川县| 亚洲成a人片在线网站| 隔壁放荡人妻bd高清| 婷婷开心中文字幕| 国产区精品系列在线观看| 亚洲成在人线免费观看| 无码av最新高清无码专区| 精品无码久久久久久尤物 | 亚洲狠狠婷婷综合久久久久图片| 色琪琪一区二区三区亚洲区| 栾川县| 波多野结衣视频一区二区| 久久碰国产一区二区三区| 日韩A级毛片| 亚洲日本乱码在线观看| 伊人久久亚洲综合影院首页| 南皮县| 中出无码在线观看高清|