網易首頁 > 網易號 > 正文申請入駐

“10周的工作量，AI只用4天！”Anthropic發布會全程實錄：你引以為傲的復雜工程，在模型眼里只是個玩具

2026-05-12 20:40:18　來源: AI科技大本營

北京舉報

分享至

出品丨AI 科技大本營（ID：rgznai100）

如果你錯過了幾天前 Anthropic 最新舉辦的 “Code w/ Claude” 開發者大會，那你可能正在錯過軟件工程史上最大的一次范式轉移。

整場大會的核心信息只有一個：AI 模型的能力正在呈“指數級”增長，但大多數企業的開發模式仍停留在“線性”階段。為了幫開發者抹平這道鴻溝，Anthropic 祭出了三大殺手锏：更強的底層模型、全新的Claude Platform代理編排能力，以及徹底顛覆日常開發的Claude Code桌面端。

在這場 Keynote 里，Anthropic 請出的幾乎都是自家產品和工程團隊的一號位：首席產品官 Ami Vora 先把背景講透，研究產品負責人 Dianne Penn 解釋模型層為什么還會繼續爆發，Claude Platform 團隊用一場科幻感拉滿的月球無人機演示，把multi-agent、outcomes 和 dreaming這些新能力一次攤開；到了 Claude Code 環節，Cat Wu 和 Claude 負責人 Boris Cherny 則把另一條線徹底講明白——同步編程正在退到后臺，能持續跑任務、自動修 PR、自動處理 CI 報錯的異步開發流，開始成為新的默認選項。

下面我們就按這條主線往下看：Anthropic 到底想怎么定義下一代開發流，Claude 平臺和 Claude Code 分別把哪一部分往前推了一大步。

Ami Vora：大家早上好！很高興見到各位，感謝大家的到來。

回想我今天為什么站在這里，思緒不禁回到了我第一次成功運行代碼的那一刻。我并非從小就接觸編程，我在阿巴拉契亞山脈的山腳下長大，沒自己組裝過電腦，甚至不怎么玩電子游戲。我第一次嘗試構建復雜的項目，是在大學的計算機科學課上。那已經是很久以前的事了，當時我們還得排隊登錄服務器，因為只有它算力夠強，跑得動我們的光線追蹤程序。

在座的有些人對那番場景肯定不陌生：服務器的嗡嗡聲、隔夜披薩和咖啡的混合氣味，還有無窗地下室機房特有的味道。但我依然記得按下“編譯”鍵后等待結果的那種心情——當發現程序真的跑通時，那種純粹的喜悅、發現新大陸的激動、如釋重負的輕松，以及意識到自己在這個世界上創造出前所未有之物的震撼。正是那種感覺讓我徹底著迷，也是我今天站在這里的原因。

時代變了。當年我只能在大學機房排隊求取的東西，如今世上的任何人、在任何地點、任何時候都能唾手可得。無需排隊，沒有怪味，也沒有門檻，但那種激動、喜悅與如釋重負的感覺卻原封未動。我知道在座的很多人深有同感。常有人對我說：“Claude 讓我感覺自己擁有了超能力。” 這是我最愛聽的評價。

我們正在目睹大家如何施展這種超能力。比如，Stripe 的開發基礎設施負責人 Scott MacVicar，他的團隊有5 萬行 Scala 代碼必須轉寫成 Java，才能升級 JDK。他們最初估算這需要耗費工程師整整 10 周的時間。結果他們用了 Claude，只花了4 天就全部搞定。

有時，速度的意義不僅僅在于效率，更在于它能觸達的彼岸。Felicia Curcuru 是 Binti 的聯合創始人兼 CEO，她的軟件系統專門協助社工為寄養兒童尋找家庭。處理文件、上門走訪、資質審核……今年，她的團隊利用 Claude API，把社工從繁瑣的文書中解放出來，讓整個寄養家庭的資質審批流程足足縮短了 20 天。20 天——這絕不僅僅是一個冷冰冰的效率指標，這意味著一個孩子能提前 20 天擁有一個家。

這種激動、喜悅、輕松和發現新事物的震撼，是我從大家身上聽到的共鳴。但我猜，在座各位體驗它的方式各不相同。你們當中，有人每天都在技術的最前沿沖浪；有人在努力帶動身邊的人一起進化；還有人來到這里，是因為和我一樣，感覺到了腳下技術板塊的劇烈運動，想看清未來的圖景。相信我，我經常在一個早上就能體會到上述所有的情緒。我常常帶著計劃來上班，到了午休時就把計劃撕得粉碎，因為又有新突破發生了。這感覺耳熟嗎？

當我們退后一步，看看這些模型進化的速度有多快時，這一切就說得通了。在 Anthropic，我們常把“指數級躍升”掛在嘴邊。我想這正是我們當下的集體感受。大家還記得嗎？僅僅兩年前，模型領域的終極目標，還是寫出一封像樣的電子郵件，我們就已經謝天謝地了。一年前，我們站在這個舞臺上，頭條是 Opus 4，當時“讓一個智能體（Agent）在無需人類干預的情況下連續運行一小時”還像是一個登月計劃。

然而六個月前，智能體已經可以整晚跑端到端的任務，我們每天醒來就能驗收成果。就在上個月，Mythos 通讀了 OpenBSD 的整個源代碼樹，揪出了一個潛伏了 27 年、躲過了人類審查、模糊測試和靜態分析長達近三十年的漏洞。技術飛躍的幅度越來越大，而間隔的時間卻越來越短。

盡管模型的能力正呈指數級爆發，但大多數組織應用 AI 的方式卻依然按部就班。這就導致“AI 能做什么”和“AI 真正在幫人類解決什么”之間，出現了一道鴻溝。彌合這道鴻溝，將模型的能力轉化為普通人解決問題的利器——正是開發者的使命。這正是你們正在做的事，而且成效斐然。在 Claude 平臺上，API 的調用量同比激增了近17 倍；在 Claude Code 上，開發者平均每周花在運行 Claude 上的時間已達20 小時。

和你們一樣，我們最近也處于瘋狂交付的狀態。我們希望大家今天離開時，腦海中能有一幅清晰的未來圖景，這樣你們就能未雨綢繆，與我們一起乘上指數級爆發的東風。我要先聲明，今天我們沒有新模型要發布。今天的主題是——我們如何讓產品更好地為您服務，以便您能為整個世界彌合這道鴻溝。今天上午，我們將為大家展示它的全貌。

首先，Dianne 將談談我們的基石——模型層。她將分享更多關于我們前沿模型的進展和未來規劃。在 Claude 平臺上，我們將對 Claude 托管智能體（Managed Agents）進行重大更新，包括：目標導向（Outcomes）、模型造夢（Dreaming）以及多智能體協同（Multi-agent orchestration）。Angela 和 Katelyn 將為大家演示平臺是如何幫您包攬底層基礎設施，讓您免受繁文縟節之苦的。在 Claude Code 方面，Cat 和 Boris 將指導您如何使用諸如 Routines 等新原語（primitives），讓 Claude Code 能夠自我提示（prompt itself），哪怕您不在電腦前它也能繼續干活。

但這一切，最終都要回歸到你們，以及你們即將創造的產品上。因為絕大多數人一輩子都不會去調用 Claude API，更不會打開終端輸入“Claude”。他們只會通過你們在 Claude 平臺上構建的產品來體驗 AI。無論那是一位用 Canva 探索新靈感的設計師，一位用 Legora 飛速搞定法律文書的律師，還是任何一位使用世界頂尖編程智能體的開發者。感謝你們，是你們塑造了 AI 在世人眼中的模樣。我們永遠無法單槍匹馬地構建出解決所有人問題的所有工具，這只能依靠你們。

為了表達我們的感激之情，我們帶來了一個好消息。從今天起，我們將提高 Claude Code 和 Claude 平臺開發者的速率限制（Rate limits），助你們一臂之力，繼續為世界彌合鴻溝。具體來說，我們不僅為 Pro、Max、Team 和基于席位的 Enterprise 計劃翻倍了 Claude Code 的 5 小時速率限制，還大幅提升了 Claude Opus 的 API 限制。

之所以能做到這一點，是因為我們擴大了算力合作版圖——我們正在與SpaceX合作，滿載調用他們 Colossus 1 數據中心的全部算力。我們將把這些資源直接投資給獨立開發者和小型團隊。隨著時間推移，我們將繼續探索各種途徑幫您發揮 Claude 的最大潛能，無論是現有的算力合作，還是未來更激進的押注。

感謝各位今天的到來。感謝你們與我們攜手，共同定義 AI 在現實世界中的模樣。感謝你們，把超能力交到了大眾手中。接下來，有請我們研究產品團隊的負責人 Dianne。謝謝！

Dianne Penn：謝謝 Ami。我是 Dianne，2023 年加入 Anthropic。從 Claude 2 開始，我見證了每一個模型的誕生。如果有人在數的話，我們已經把橫跨 Haiku、Sonnet、Opus 和現在的 Mythos 的 18 個 Claude 版本，帶給了像你們一樣的用戶和開發者。

我們曾絞盡腦汁，既想讓 Opus 3 完美遵循 JSON 格式，又要讓它成為編寫長篇代碼的王者。在 Sonnet 3.5 New（也就是大家現在終于習慣叫的 Sonnet 3.6）上，我們教會了 Claude 如何安全地操作計算機。到了 Sonnet 3.7，它有時候表現得稍微有些“急功近利”，于是我們找到了合適的方式將其開放給用戶和開發者，讓你們能摸透它的脾氣。去年的這個時候，我們利用 Claude 4 在思維推演（thinking dials）和測試時算力（test-time compute）的調節上找到了完美平衡。我們從未放慢腳步。在過去的 12 個月里，我們向開發者和用戶交付了 8 款前沿模型。每一代都在前一代的肩膀上躍升，讓你們能寫出更優雅的代碼，讓你們構建的產品走得比以往任何時候都遠。

模型層是今天大家將聽到的所有創新的底座。這是最核心的共識。隨著模型智商的躍升，你們的起跑線也隨之前移，你們能做到的事情將突破想象。在 Anthropic，我們常提“指數級躍升”，Ami 剛才也提到了。對我而言，它的意義在于：當模型變聰明時，你們能為用戶打造的應用場景也會呈指數級爆發。比如，擁有自主規劃能力的“智能體編程”，其顛覆性遠遠大于簡單的“代碼補全”。以此類推，新產品和新體驗會開辟新市場，把整個蛋糕做大。

在研究團隊眼里，“指數級躍升”絕不是單純刷 SWE-bench 的跑分。它關乎于創造并追蹤那些我們不刻意設計就不存在的全新能力：工具調用、接管計算機操作系統、根據問題難度自適應的思維深度；能在成百上千個步驟中不忘初心的智能體循環；以及能讓 Claude 吸收全新知識的超長上下文窗口。這些能力絕不局限于寫代碼。今天的 Claude 已經能生成并迭代視覺設計，能分析和創建復雜的業務交付物，還能在充滿不確定性的商業領域游刃有余。這都是因為底層的模型大腦變得足夠聰明、足夠強壯，撐起了這一切。

當你們基于 Claude 進行開發時，你們踩在那條最先創造出這些能力、并花了最長時間打磨其穩定性的模型產品線上。讓我用最新發布的 Opus 4.7 給大家舉個實際的例子。編碼智能體公司 Amp 把他們所有的“智能模式”都遷移到了 Opus 4.7 上，因為它不僅跑分碾壓全場，更重要的是，他們發現可以直接砍掉很多冗余的腳手架和工具——因為模型已經聰明到不需要這些輔助了。樂天（Rakuten）在他們的基準測試中跑了我們的模型，解決的生產環境工程任務數量達到了原來的三倍。Intuit 則發現，Opus 4.7 甚至能在規劃階段自己揪出自己的邏輯漏洞，自我糾錯，回溯重演，最終交出一份執行速度更快、極其清爽的代碼。

Opus 4.7 發布的第二天，我們就推出了 Anthropic 實驗室的“Claude Design”，這是我今年最鐘愛的項目之一。大家已經開始用 Claude Design 和 Claude Code 的組合拳來生成生產級別的 UI 界面了。這是因為 Opus 4.7 擁有極佳的視覺審美品味，懂得拿捏分寸，能在遵循你設計原則的同時呈現出絕佳的細節。在日常交流中我們也常聽到，大家喜歡用 Claude，是因為它不僅能聽懂你分配的任務，還能察覺出哪里不對勁，甚至敢于反問、質疑你的前提假設。

當然，身為開發者的我們心知肚明，現在的模型還是半成品，還在進化中。它們有時會被極其低級的問題絆倒，在塞入大量上下文時也會“斷片兒”。但正因如此，這一切才令人興奮，感謝你們陪我們一起走這條路。

向大家透露一點我們正在攻克的目標：首先是更高階的判斷力和更卓越的代碼品味。這意味著未來的 Claude 能穩穩接住復雜的、完全自主的工程項目。其次是讓人感覺深不見底的上下文窗口，配合高質量的記憶庫，讓模型在處理長時間軸任務時游刃有余，且越做越好。最后是多智能體協同，驅動由多個 Claude 分身組成的智能團隊，協作完成那些單個實例永遠無法獨自消化的宏大目標。

我評估模型智商進步的一個核心維度是“任務視界（Task horizon）”——即一個模型能夠脫離人類干預、自主工作并持續改進成果的時間長度。去年今日，模型只能自主工作幾分鐘。而現在，在座的很多人和我一樣，手里的智能體經常能連續跑上好幾個小時。到了明天，我們將擁有能主動出擊、時刻在線、且絕對不會“迷失自我”的智能體。

作為開發者，我們該如何看待這一切？指數級躍升不會停止，所以你們在構建產品時，必須錨定“未來即將涌現的能力”，而不是局限于當下版本的 Claude 能做什么。因為新一代模型將比你我現在手里的強大得多。過去，我們得靠堆砌各種腳手架來給舊版 Claude“打補丁”；現在，腳手架的作用是去“放大”模型的智慧。過去，你得精心設計復雜的迭代循環，投喂各種工具，苦苦研究重試機制；現在，這些都可以內化為模型自身的思考與執行邏輯。你們已經能窺見未來的模樣了——Opus 的預覽版Mythos，就是這條指數曲線上的下一個爆點，而且跨度極其驚人。

因此，我們所有人和模型打交道的方式都需要重塑。

在 Anthropic，我們總結了以下幾點：首先，為下一個版本的 Claude 做設計，而不僅僅是現在的。無數次的歷史經驗告訴我們，最終贏家總是那些優化了架構、隨時準備擁抱下一次智力爆發的開發者，而不是那些死磕當下那點微小準確率的人。這就要求你們去建立更苛刻的評估體系，去構建那些在今天看來近乎異想天開的原型。因為只有這樣，當指數級曲線悄然躍升時，你們才會第一時間察覺——嘿，那個昨天還跑不通的東西，今天突然自己跑通了！這往往是個信號：你挖到了一個能驚艷用戶的寶藏。

那些把 Claude 用到極致的團隊都明白一個道理：模型的升級，就是商機的爆發。他們早就搭建好了自動化評估、精簡的腳手架框架，以及別人尚未察覺的、充滿野心的原型系統，從而讓每次升級的成本降到最低。

我們堅信，隨著模型越來越聰明，在座的各位開發者將擁有極大的先發優勢，去試水新場景，去創造讓人尖叫的新產品，最終定義新市場，把蛋糕做大。接下來 Katelyn 和 Angela 將向你們展示的所有工具，都將讓這一切從夢想變為現實。非常感謝大家！

Angela Jiang：模型的能力正呈指數級爆發，但企業的運作卻依然按部就班。對于企業來說，能不能真正駕馭這條指數曲線，成為了生死攸關的考驗。究竟是什么攔住了企業跟上步伐的腳步？說到底，就是兩大難題。第一個難題是：拿到滿意的結果（Outcomes）還是太難了。你得做大量的提示詞優化、工具重構、外圍工程的搭建……要讓模型準確駛入你想要的軌道，依然要耗費無數心血。

Katelyn Lesse：沒錯。第二個難題是：你想跑得快，但又想穩穩地擴大規模。現在科技圈卷得飛起，你必須跟上節奏。但要贏，質量也得跟上。做個原型（Prototype）很容易，但在生產環境里規模化（Scale）卻難如登天。我們構建 Claude 平臺，就是為了給你們提供所需的一切：既能拿到出色的成果，又能兼顧速度與規模。平臺上配備了專門針對 Claude 模型調優的 API 原語，為您搭建和擴展智能體系統提供了現成的基礎設施，并賦予您操作這些系統的絕對控制權。

Angela Jiang：就是這樣。如果回看我們經常從企業那里聽到的痛點，我和 Katelyn 最常聽到的就是：企業極度渴求高智商的模型，但同時必須壓低成本。為了解決這個問題，我們推出了“導師策略（Advisor strategy）”。它的實現非常簡單，你只需在 Messages API 中更新你的工具數組（tools array）即可。我們提供了一種分離“執行”與“指導”的智能體架構：在執行層，你可以挑一個小模型，成本很低；但當這個小模型卡殼、需要建議時，它可以直接去向大模型“請教”。

Katelyn Lesse：在實際應用中，這意味著你可以讓 Haiku 或 Sonnet 級別的模型去干體力活，讓 Opus 作為導師在背后坐鎮。當我們運行“Sonnet 執行 + Opus 指導”的架構時，我們發現 Sonnet 的表現遠超它單兵作戰的時候。但更震撼的是，整個流程算下來的成本，甚至比單獨跑 Sonnet 還要便宜，因為 Opus 的一語道破，讓 Sonnet 少走了很多彎路。Eve Legal 就是一個絕佳的例子，他們使用了導師策略后告訴我們，他們用只有原來五分之一的成本，做出了前沿大模型級別的質量。

Angela Jiang：這太棒了。我們特別喜歡這種玩法，因為你可以把它完美應用到“免費增值（Freemium）”的商業模式中。在給用戶提供免費體驗時，你肯定要控制成本，但同時又不想降低體驗質量。在那些并發量極大、ROI 計算極其嚴苛的場景里，這一招簡直是殺手锏。

好，成本和效果的問題解決了，那 Katelyn 剛才提到的“速度與規模化”這對死對頭呢？最近，我們推出了Claude 托管智能體（Claude Managed Agents）。這是一套將智能體運行環境與企業級基礎設施完美綁定的方案。使用它，團隊從原型跑通到上線生產環境，往往只需要幾天時間。與我們合作的團隊，在托管智能體的加持下，交付速度實打實地提升了 10 倍。

托管智能體另一個讓我們引以為傲的地方，是它出廠自帶了許多行業最佳實踐。比如，在構建智能體時，最核心的鐵律之一就是給它裝上“記憶（Memory）”。這樣智能體就能記住用戶的偏好，在每一次交互中越來越懂你。但從頭手寫一個記憶系統是很痛苦的，所以這成了一個我們開箱即用的功能，而且它與 Claude 是天然適配的。同時我要向大家保證：當智能體生成記憶時，這些數據完全歸你所有，你可以隨時把它打包帶走到任何你想去的地方。

Katelyn Lesse：Notion 就是基于托管智能體構建產品的教科書級案例。他們既要速度又要規模，所以果斷選擇了這套方案。他們在產品內部內置了觸發 Claude 智能體的功能，去處理那些耗時長、極度復雜且需要自主運行的任務。

Angela Jiang：那個功能超酷的。今天，我們要給 Claude 托管智能體注入三項極其硬核的新特性：我們將引入“多智能體協同（Multi-agent orchestration）”，讓你能組建智能體艦隊來攻克復雜難關。我們將引入“目標導向（Outcomes）”，允許你精確定義什么是“成功”，然后 Claude 會像咬死獵物的獵犬一樣，不斷迭代直到達成目標。我們還將引入“模型造夢（Dreaming）”。這個功能讓我們非常興奮——通過“造夢”，Claude 獲得了自主學習的能力。它能在空閑時回顧之前的會話，反思自己漏掉了什么技能、該吸取什么教訓，然后自動把這些經驗刻進自己的記憶庫里。與其站在這里干講，不如我們直接給大家來個現場演示吧。Katelyn，我們開始吧。

Angela Jiang：我和 Katelyn 被今天早些時候發布的消息徹底激發了靈感。Opus 的 API 限制放寬了，我們最近又經常和某家太空公司的人混在一起。所以我們倆一拍即合，決定虛構一家我們自己的初創公司，叫 Lumara。在 Lumara，我們要做的是開發一款智能體軟件，實現無人機在月球上的自動著陸。我們對速度和規模有著病態的追求，所以毫無疑問，我們要把它建在 Claude 托管智能體上。

Katelyn Lesse：沒錯。假設我們拿下了第一個客戶，這位虛構的金主爸爸想把無人機降落在月球上，去開采虛構的礦產。這是一個龐大且野心勃勃的工程，盡管我們滿懷夢想，但我倆都不是航天工程師。所以我們迫切需要一群極其硬核的智能體來幫我們干活。我們打算把剛才提到的三大新功能全融進去。我們已經為客戶打了個樣，現在我將用 Claude API 的命令行工具（CLI），向大家演示我們是如何配置的。

首先，活兒太重，所以我們要派多名智能體上陣。大家請看我們為客戶配置的智能體陣容：第一位是“指揮官”，核心職責是大局統籌，確保任務順利；第二位是“探測員”，負責尋礦，找出那些富含高純度礦物的著陸點；最后是“領航員”，負責平穩駕駛無人機，確保安全觸陸。

現在，我把“指揮官”設置為另外兩位智能體的協調員。正如 Angela 所說，在運行過程中，指揮官會拉起一個主會話，而每個子智能體都在自己獨立的線程中運行，擁有獨立的上下文窗口。這是一個極其精妙的設計：我們發現，讓它們獨立思考，最后再將結果匯總給指揮官，能得到最棒的效果。

Angela Jiang：完美的“多智能體”運作。接下來，我們把“目標導向（Outcomes）”加進去。我們的客戶對接下來的任務有極其苛刻的驗收標準。我們希望客戶能用最直白的方式定義這些標準，然后我們派出一個“閱卷智能體（Grader agent）”，死死盯住結果。其實，“目標導向”的配置只需要一個極其簡單的 Markdown 文件。大家看這個文件，一點都不復雜，上面清晰列出了任務成功的硬指標：無人機必須軟著陸；著陸點地勢必須平坦；最關鍵的一點，必須保留足夠的返程燃料，確保無人機能安全回到地球。為了將這份評分標準注入系統，我現在向會話發送一個事件，把這套標準確立為我們的“目標導向”。

Katelyn Lesse：在運行時，就像 Angela 提到的，系統在后臺單獨切出了一個“閱卷人”。這個閱卷智能體會在整個會話過程中冷酷地進行評估：這次的執行是否達標了？當然，系統有可能一把過（one-shot），但更大概率它需要經過幾輪試錯和迭代。大家看 Angela 高亮的地方，你可以自行設定允許它迭代的最大次數。

Angela Jiang：現在我們集齊了多智能體和目標導向，是時候跑一跑測試了。客戶給了我們 6 個潛在著陸點的數據，讓我們跑模擬看看情況。我現在切到 Lumara 的控制臺界面，大家可以看到我針對這 6 個點運行了模擬。

Katelyn Lesse：成績相當不錯。這是整個系統第一次跑出來的結果。融合了多智能體架構和目標導向功能后，大家可以看到，6 個地點里它完美搞定了 4 個。但在 3 號和 4 號點位上，顯然還差了點火候。作為兩個合格的創始人，我們骨子里就有種想要優化系統、不斷攀峰（hill climbing）的沖動。通常來說，持續優化是一個非常折磨人的過程，你得拆解大量的邏輯。但今天我們要演示，只需用“模型造夢（Dreaming）”功能，優化就是彈指一揮間的事。

Angela Jiang：昨天跑完模擬后，我們對結果不滿意。于是我們進入了 Claude 開發者控制臺的“造夢（Dreaming）”界面。大家看，我只需要點一下這個寫著“Dream”的小按鈕，選擇一個記憶庫。隨后，一個專門負責造夢的智能體會去翻閱所有歷史的模擬會話，把學到的血淚教訓全部寫進記憶里。這樣，當我們今天再跑新會話時，系統就能直接調用這些深刻的教訓了。我昨晚讓它做了一場夢，這就是它昨晚沉淀下來的東西。它往記憶庫里寫了大量的認知，太震撼了。最核心、最關鍵的是，這個智能體居然主動撰寫了一份“降落攻略（descent playbook）”！這意味著我們未來跑的所有任務，都能把這套攻略當作外掛來用。這份攻略里甚至包含了它從以往任務中提煉出的極具前瞻性的啟發式算法（heuristics）。這是一份極其硬核的降落寶典。昨晚做完夢后，我今天早上回到 Lumara 的控制臺，在升級后的系統上重新跑了一次模擬。

Katelyn Lesse：太絕了！我們不僅成功實現了系統優化（hill climb），之前表現優異的指標一點沒掉，反而是那兩個拖后腿的著陸點，這次表現堪稱完美。而為了完成這種深度的優化，我們付出的努力僅僅是讓 Angela 在控制臺里點了一個叫“Dream”的按鈕。

Angela Jiang：完美。讓我們總結一下：今天我們在現場演示里給大家看的所有東西，都已經上線了 Claude 平臺，大家現在就可以去用。“多智能體協同”、“目標導向”、“模型造夢”——這三板斧讓 Claude 托管智能體（Managed Agents）變得前所未有的強大。你可以用它來搭建具有深度思考能力、能在生產環境中規模化部署的智能體系統。無論你是要在月球上全自動降落無人機，還是想打造下一個商業帝國，Claude 托管智能體都在你身邊，幫你搭建業務護城河，解決那些曾經無解的難題。現在，我們把舞臺交給 Cat 和 Boris，他們會告訴你，Claude Code 是如何讓寫代碼這件事重新變得性感又好玩的。

Cat Wu：謝謝。Angela 和 Katelyn 剛剛向大家展示了，Claude 平臺是如何彌合“模型能力”與“企業實際落地的智能體”之間的落差的。在 Claude Code 團隊，我們也面臨著一個相似的挑戰：我們想要彌合“模型的極限潛能”與“每一位開發者實際能用它做到什么”之間的落差。

首先，我想對在座的所有開發者說聲謝謝。感謝你們在 Sonnet 3.7 還是最強模型、當我們的產品還有些粗糙的時候，就敢把 Claude Code 接入你們的生產數據庫。你們的支持，是我們團隊每天像打了雞血一樣沖進辦公室、拼命迭代 Claude Code 的動力。

讓我們從 Claude Code 為什么存在說起。軟件開發的形態正在被實時重構。Claude Code 的使命，就是替大家掃平從“一個絕妙的點子”到“把產品推向市場”之間的所有障礙。為了實現這一目標，我們打造了能榨干模型前沿算力的工具，并將它無縫遞到每一位構建者的手中。我們并不覺得手里已經攥著一張畫好的完美路線圖去指導大家；相反，我們更像是并肩攀巖的隊友，與大家一起向著無人涉足的險峰進發，在實踐中摸爬滾打，探索通途。我們與你們一同成長，伴隨 AI 能力的爆發一同前行，并肩跨越那些未知的挑戰。

我還記得一年前，我給 Claude Code 布置一個任務后，我會死死盯著它試圖修改的每一行代碼。我會對每一個權限請求彈窗進行極其苛刻的審查，不厭其煩地告訴它哪里好哪里不好。我就像牽著學步孩童的手一樣，一步步牽著它，直到結果符合預期。有時一個稍微復雜點的任務，我得點上 100 甚至 200 次確認，才能拿到最終成果。但現在呢？你們中的絕大多數人都掛上了“自動擋（auto mode）”。你們直接把權限下放給 Claude，自己去喝杯咖啡，等它干完一大票活、拋出一個 PR（拉取請求）的時候，再去瞅一眼。

在過去的一年里，我們大大拓寬了大家使用 Claude 的場景。我們從終端（Terminal）起步，打入了 IDE（集成開發環境），現在，我們又推出了桌面版。起初只有 CLI（命令行界面），這依然是骨灰級硬核玩家的心頭好，他們喜歡極簡的純文本界面，追求絕對的控制權和自定義能力。接著我們推出了 IDE 插件，因為很多開發者希望保留強大的智能體，但同時想在編輯器里直觀地追蹤每一行代碼的變更。最后，基于大家對更直觀的可視化交互的強烈呼聲，我們知道下一步該往哪走了。

我們發布了全新的載體：Claude Code 桌面版。它專為那些渴望沉浸式大屏圖形界面的開發者量身定制。它內置了預覽功能，你可以眼睜睜看著 Claude 把你的 App 一行行搭起來；側邊欄充當了你的“艦隊控制塔”，你可以俯瞰所有的智能體；它還支持渲染圖像和富文本輸出。我們把桌面版設計成了一個絕對的“中控臺”，不僅能管理你本地的會話，連云端遠程的會話也能盡收眼底。哪個智能體卡殼了，哪個準備就緒了，一目了然。順便說一句，無論是 IDE 插件還是桌面版，底座都是 Claude Agent SDK——這正是你們中許多人已經在用的那個 SDK。

很多企業已經讓 Claude Code 的工具全員覆蓋（wall-to-wall）。在我們 Anthropic 內部，這讓每位工程師產出的 PR 數量暴增了 200%，同時代碼質量的紅線沒有絲毫降低，而這還是在我們工程團隊規模急劇擴張的背景下實現的。我們正與大家一起，在重新定義“軟件工程”未來的模樣。既然面對的是全新的挑戰，我們決定用 Claude 驅動的自動化魔法去一一攻克它們。

我給大家過幾招。以下是我們聽取社區反饋后，與大家共同打磨出的利器。

你們反饋說，代碼審查（Code Review）太耗時間了。于是我們推出了“代碼審查器”。它會派出一支智能體特種部隊，替你死磕那些致命的 Bug。現在成千上萬家公司每天都在用它，包括我們 Anthropic 所有的內部團隊。

你們反饋說，想隨時隨地寫代碼。于是我們推出了“遠程控制”，并把 Claude Code 塞進了 iOS 和 Android 的 Claude App 里。靈感一來，隨時隨地發起任務。你再也不用端著個處于休眠邊緣的筆記本在走廊里晃悠，也不用被死死釘在辦公桌前。你現在完全可以去公園散個步，摸摸草地，同時代碼還能繼續跑。

你們反饋說，在 CI（持續集成）測試失敗、處理審查意見、解決代碼沖突上耗費了太多心血，簡直成了 PR 的保姆。于是我們加了“自動修復（Auto-fix）”。它就像個隱形哨兵，監聽這些事件，一旦有錯它主動提補丁，確保你的 PR 永遠是一片賞心悅目的綠色。

你們反饋說，每次有新的 Jira 工單或者客戶報 Bug，你們都得手動召喚 Claude Code 去處理。于是我們想，為什么不搞個“Routines（例程）”呢？配置一次，一勞永逸。無論是監聽 Webhook、API 事件，還是定時執行，它都會自動幫你把 Claude Code 喚醒。不再需要人工干預，交給 Claude 就行。

最后，你們反饋說，功能迭代太快了，連你們自己的安全團隊都查不過來了。于是我們開發了“Claude Security”。它會在夜深人靜時掃描你們整個代碼庫，一旦嗅到漏洞，自動喚醒 Claude Code 去進行修復。

所有的這些原語組合在一起，構筑了抵御未來工程風暴的城墻。我剛才提到的這一切，今天大家全都能用上。最讓我感到興奮的是，很多公司在整個組織的維度上，徹底接納并應用了這套體系。

先說說 Shopify。他們支撐著全球數以百萬計商家的電商帝國。他們把 AI 的血液注入了整個工程組織的動脈，甚至改變了公司的文化基因。在 Shopify，Claude Code 是全員標配，不僅工程師在用，設計、產品、數據科學團隊也在用。他們把它直接織進了自己的平臺，以驚人的規模構建內部工具。他們的應用 AI 總監 Andrew McNamara 是這么評價的：“速度簡直快到離譜。Claude Code 徹底重塑了我們構建內部工具的范式。”

再看 Mercado Libre（美客多），拉美最大的電商霸主，服務上億買家。他們有一支兩萬三千人的工程師大軍，所有人都在用 Claude Code 運行項目。當這種規模的組織發生質變時，工作的形態就徹底變了。工程師們開始把智能體像巡航導彈一樣，瞄準那些常年無人問津、根本沒時間去管的陳年技術債。在人類的監督下，它已經審查了超過 50 萬個 PR，翻新了超過 9000 個應用程序。他們的技術負責人 Oscar Mullin 立下了一個 Flag：在今年第三季度，實現 90%的自動化編碼和全智能體驅動的 PR 循環。

在整個行業中，類似的聲音不絕于耳。但我最喜歡的其實不是這組數字，而是我們在交流時發現，很多經理、甚至是 VP 級別的高管，又重新挽起袖子，親自下場去代碼庫里“弄臟雙手”了。Claude Code 把寫代碼的樂趣，重新交還給了那些過去十幾年只看路線圖和做審查的高管手中。這在整個行業都在發生。數以百萬計的開發者正在以比過去更高的質量，交付海量的產品。

說了這么多，這玩意兒跑起來到底是什么感覺？讓我們掌聲有請 Claude Code 業務負責人 Boris Cherny 帶大家一探究竟！

Boris Cherny：在開始演示之前，我想先掏下心窩子。今天我們展示的所有東西，對我來說依然充滿著魔力感。我每天都在倒騰 Claude Code，哪怕在 Anthropic 內部，我們也經常互相甩截圖，驚嘆大家用 Claude 做出的各種騷操作。老實說，能和大家在這個探索的旅程中同行，我感到無比興奮。

今天，我非常激動能再給大家展示幾個硬核案例。很遺憾，我們不能所有人都去造月球無人機。所以在接下來的演示中，假設我們是 Acme Pay（一家支付基礎設施公司）的工程師。我們啟動 Claude 桌面版。首先從一個單線任務開始。在這個會話中，Claude 的任務是給 Acme 的商戶后臺添加一個“退款”功能。它正在構建一套全量的實現邏輯：包含冪等性（idempotency），防止重復的 Webhook 讓商戶被扣兩次錢；涵蓋 Acme 所有運營區域的多幣種處理機制；以及為合規團隊準備的審計日志。它寫完了代碼，現在準備自己驗證自己的工作。Claude 調起了商戶后臺，觸發了一筆退款。啊哦，界面上沒有彈出成功提示（success toast）。這是一個極其隱蔽的邊緣測試用例。Claude 捕捉到了這個失敗，順藤摸瓜，發現問題出在樂觀更新（optimistic update）的競態條件上。它動手修補了邏輯。在它判定任務完成之前，它甚至會在瀏覽器里再跑一遍驗證。

現在，讓我們把視角拉遠。這個會話并不是在孤軍奮戰。它只是無數個同時并行運行、被同時管理的會話之一。在 Claude 桌面版中，你現在可以開啟“上帝視角”，俯瞰你所有的 Claude Code 會話。哪個正在狂奔，哪個卡住了需要你拍板，哪個已經提了 PR 并合并完畢，盡收眼底。“盯著它一行行寫代碼”這種同步編碼模式，將只是未來開發場景中的冰山一角。我們堅信，未來的趨勢是，海量的代碼將以“異步”的方式被生產出來。這就是為什么我們死磕“自主驗證（verification）”的原因。如果 Claude 能自己檢查自己的作業，你完全可以讓它去跑，自己去干別的事，回來直接驗收完美運行的成果。

就拿我個人來說，我現在大部分的代碼，其實都是 Routines（例程）幫我寫的。我不再親自給 Claude 寫提示詞了，我的工作變成了“創建一個去給 Claude 下發提示詞的 Routine”。在座的各位工程師，大家可以把它理解為“高階函數（higher-order function）”。而 Routines，就是一種高階提示詞。就拿剛才那個“退款功能”的演示來說吧，其實是一個同事大半夜在 GitHub 上提了個 Issue。一直在后臺監聽代碼庫的 Routine 逮住了這個更新，異步喚醒了 Claude，把活兒派給了它。有了 Routines，開發者可以布下天羅地網的異步自動化機制，然后每天早上醒來，看著一堆準備好被 Merge 的 PR 喝咖啡。這就是我們的 Routines 管理界面。你可以讓它定時跑，可以通過 Webhook 喚醒它，甚至可以通過隨意的 API 調用去觸發它。它不僅能跑在你的本地機器上，還能跑在遠端云服務器上。

我們再看最后一個功能。也就是 Cat 剛才提到的“CI 自動修復”。它的任務，就是給剛才上一個會話提交的 PR 當保姆。它要一路護送這個 PR 殺進生產環境。代碼審查和安全審查甩過來的修改意見？它自動修復。CI 飄紅了？它自動修復。代碼合并不了起沖突了？它自動 Rebase。大家看剛才發生了什么：CI 因為網絡超時閃退了。Routine 秒醒，把脈發現這是個已知的基建網絡抖動，直接重跑了任務，綠燈放行。說個秘密，其實在 Claude Code 自己的代碼庫里，我們不僅讓它重試，我們還要求它每次都去順手把根本原因給修了。這樣一來，負責這個 PR 的工程師這輩子都不會看到令人窒息的紅叉。這部分爛攤子，徹底從他們肩上卸下來了。

這就是范式的轉變。默認的操作不再是“我要去給 Claude Code 寫提示詞”，而是“我要讓 Claude 去給 Claude Code 寫提示詞”。剛才大家看到的這些，包括 Routines 和最新版的 Claude 桌面端，今天全量上線。我們已經迫不及待想看大家上手把玩，并聽到你們的反饋了。我們希望這些功能，能徹底抹平你的靈感與產品上線之間的鴻溝。

今天所有的演講，其實都在指著同一個方向。Dianne 展示的能力躍升曲線，Angela 和 Katelyn 演示的會自我評分、自我進化的智能體，以及 Cat 和我剛剛向大家秀的肌肉。這是同一個故事的三個切面。模型的能力已然降臨，剩下的唯一懸念，是我們用多快的速度把它投入戰場。我強烈建議大家在接下來的時間里，盡情去探索這三個層面：如果你在評估模型，去聽研究團隊的分享；如果你在為用戶構建系統，去參加 Claude 平臺的環節；如果你想把 Claude 深植于日常的開發流，就去 Claude Code 的工作坊。一頭扎進去，深挖它，和我們一起構建未來吧。謝謝大家！

（投稿或尋求報道：zhanghy@csdn.net）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.