<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      6小時,200美元,0人類代碼:Anthropic把AI編程推過了臨界點

      0
      分享至


      新智元報道

      編輯:KingHZ

      【新智元導讀】代碼沒有消失,但它不再是少數(shù)人特權(quán)。在「創(chuàng)造平權(quán)」的AI時代,真正稀缺的不再是編程能力,而是你是否有一個值得讓機器為你燃燒幾百美元算力的好想法。

      真正讓人不安的,不是AI提高生產(chǎn)力,而是AI開始主導「生產(chǎn)關(guān)系」。

      Anthropic最危險的進步,不是AI會寫代碼,而AI開始獨自把項目做完。

      一句話需求、6個小時、200美元。


      沒有產(chǎn)品經(jīng)理、沒有程序員、沒有設(shè)計師,甚至全程人類補一行代碼。

      Anthropic把Claude丟進一個任務里:做一套完整的復古游戲編輯器。

      結(jié)果,Claude沒有只交出一個像樣的頁面。

      它自己拆需求,自己寫代碼,自己測試,自己返工,最后交出一個真的能跑起來的成品。






      在Anthropic這次實驗里,AI已經(jīng)不只是生成代碼,而是在逼近交付。

      過去我們聊AI編程,聊的是它寫得快不快。現(xiàn)在問題變成了:它能不能連續(xù)工作幾個小時,在第5輪、第10輪修改里不跑偏,最后把東西交出來。

      Anthropic這次給出的答案是:能。

      但前提不是把AI當一個人使,而是把它組織成一個團隊。


      原文鏈接:https://www.anthropic.com/engineering/harness-design-long-running-apps

      AI不是不聰明,而是不穩(wěn)定

      過去的AI很像一個天賦很高的實習生。

      第一版,沖得很猛。

      第一個頁面,出得很快。

      第一輪代碼,看上去也像那么回事。

      但任務一拉長,它就開始亂:

      邏輯散了,上下文丟了。

      該修的沒修,該測的沒測。

      最麻煩的是,它常常會提前進入一種「看起來做完了」的狀態(tài)。

      Anthropic點得很準:問題不一定出在智力上,而是出在長程執(zhí)行上。

      Anthropic做了一個對照實驗,結(jié)果很殘酷。

      單智能體模式下,AI用20分鐘、9美元,也做出了一個「像游戲編輯器」的東西。


      問題是,一上手就露餡——

      交互沒打通;實體沒正常響應;核心玩法直接失靈。



      這說明一件事:

      以前大家總以為AI不行,是因為還不夠聰明。

      現(xiàn)在看,很多時候真正拖AI后腿的,不是智商,而是穩(wěn)定性

      很多人一說AI記不住,第一反應都是:那就給它更大的上下文窗口。

      聽起來很合, 但Anthropic這次潑了一盆冷水。

      窗口更大,不一定更強。很多時候,只是把混亂一起放大了。

      東西越堆越多,但真正重要的主線,反而越容易被淹掉。這就是所謂的「上下文腐爛」。

      更麻煩的是,模型還容易高估自己。

      Anthropic發(fā)現(xiàn),程序明明一跑就崩,模型卻覺得自己做得不錯。

      于是單智能體會掉進兩個坑:一邊越寫越亂;一邊越亂越覺得自己沒問題。

      這就是為什么,單純靠更大模型、更長窗口、更高token上限,AI并不能獨立完成項目交付。

      為了取得突破,Anthropic Labs成員Prithvi Rajasekaran探索了一些新穎的AI工程方法。


      這些方法在兩個截然不同的領(lǐng)域中均適用:一個由主觀品味定義,另一個則以可驗證的正確性和可用性為準。

      受對抗生成網(wǎng)絡(luò)(GANs)的啟發(fā),他設(shè)計了一種包含生成器和評估器的多智能體結(jié)構(gòu)。

      沒造「超人」,但Anthropic造了神團隊

      這次最關(guān)鍵的變化,不是參數(shù)。不是窗口。也不是什么神秘提示詞。

      真正的變化是,Anthropic不再逼一個AI單槍匹馬干完整個項目。

      它開始讓AI分工。

      這套結(jié)構(gòu)很像一個小型產(chǎn)品團隊。

      • Planner,負責想清楚。它先把一句模糊需求,擴成規(guī)格,定義產(chǎn)品到底要做什么。

      • Generator,負責動手。它下場寫代碼,搭前后端,接交互,做集成,一輪輪推進。

      • Evaluator,負責挑錯。它不負責體面。它只負責驗收。點頁面、試按鈕、查數(shù)據(jù)庫、測接口,把問題一個個揪出來,再打回去重做。


      最后一步特別關(guān)鍵,因為一邊寫,一邊給自己打分,最后AI很容易說服自己:差不多就行。

      但把兩者拆開,很多本來會被糊弄過去的問題,就過不去了。

      拿那套復古游戲編輯器來說,Planner最初拿到的只有一句話需求。

      但最后擴出來的,是一份包含16個功能、10個沖刺的規(guī)格書。

      精靈動畫、音效系統(tǒng)、行為模板、AI精靈生成、關(guān)卡設(shè)計助手、導出分享,全部被拆進流程里。

      這已經(jīng)不是「AI寫代碼」了,AI開始學會像團隊一樣做產(chǎn)品。

      真正拉高質(zhì)量的,是高壓驗收

      今天很多AI產(chǎn)品都有一種共同氣質(zhì)——看著完整,配色安全,布局規(guī)整。

      挑不出大錯,但也沒什么靈魂。這種東西叫AISlop「AI泔水」。說白了,就是「像成品的樣子貨」。

      顯然,Anthropic不滿足于這種結(jié)果。

      所以它不只讓Evaluator查bug,還讓它盯四件事:

      設(shè)計質(zhì)量、原創(chuàng)性、工藝感、功能性。

      而且,它還故意把「原創(chuàng)性」和「設(shè)計質(zhì)量」的權(quán)重拉高。

      譯成人話就是:別總交最安全的答案,做點真的像作品的東西出來。

      這背后是一個很重要的信號:

      很多人以為AI的創(chuàng)造力來自靈光一現(xiàn),但很多時候,AI的創(chuàng)造力,恰恰是被高標準一點點逼出來的。

      所以,下一階段真正稀缺的能力,可能不是「誰更會生成」,而是「誰更會評價」。

      你有多會挑錯,決定AI最終能走多遠。

      最可怕的是,AI真能改到第10輪

      這次實驗最讓人不安的,是Claude開始形成很強的閉環(huán)感。

      還是看RetroForge,也就是那套復古游戲編輯器。

      同樣一句話需求。

      單智能體版,20分鐘,9美元。很快,也很便宜,但更像一個空殼。


      三智能體版本,6小時,200美元。貴得多,慢得多,但最后結(jié)果完全不是一個量級。

      它真的把27條驗收標準,一條一條啃過去了。

      這里面暴露出來的,是實打?qū)嵉能浖こ虇栴}。比如:

      函數(shù)寫了,但事件沒觸發(fā)。

      接口有了,但路由順序錯了,參數(shù)被錯誤解析。

      這說明它做的,已經(jīng)不只是拼頁面,開始進入真正的工程地帶。

      另一個例子更夸張。

      Claude用了不到4小時、約124.7美元,做出一個能在瀏覽器里跑的DAW,也就是數(shù)字音頻工作站。

      它有排列視圖、有混音器、有傳輸控制、有實時波形預覽。

      還內(nèi)置了一個AI智能體,可以直接理解自然語言的音樂指令。

      你告訴它節(jié)奏、調(diào)性、旋律、鼓軌、混響,它能繼續(xù)往下做。

      更關(guān)鍵的是,Evaluator沒有放過它:


      恰恰是這些被揪出來的問題,證明了這套系統(tǒng)真的形成了閉環(huán):

      不止要做完,還要被打回去改。改到能過驗收,才算結(jié)束。

      這才是軟件開發(fā)里最難、也最有價值的部分。

      第一版從來不難,難的是第8版、第9版、第10版。

      真正的分水嶺,

      AI第一次反復改到交付

      Anthropic這次最值得行業(yè)警惕的,不是讓Claude變成了一個更強的程序員。

      而是讓它第一次表現(xiàn)得像一個真正的產(chǎn)品組織,分工明確,各司其職。

      這就是為什么,這次突破看起來不像「生產(chǎn)力升級」,更像一次「生產(chǎn)關(guān)系升級」。

      過去,AI最強的能力是「生成一個答案」。

      現(xiàn)在,它開始逼近另一種更難的能力:

      圍著一個目標,持續(xù)工作,持續(xù)修正,直到交付。

      這才是真正的臨界點。

      代碼沒有消失,它只是在失去作為少數(shù)人特權(quán)的地位。

      在這個「創(chuàng)造平權(quán)」的時代,你是否真的有一個值得讓機器為你燃燒算力的好主意?

      這才是最值得深思的問題。

      參考資料:

      https://www.anthropic.com/engineering/harness-design-long-running-apps

      https://x.com/AnthropicAI/status/2036481033621623056

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      鐘南山院士建議:老年人多吃這5道家常菜,軟爛養(yǎng)胃、少鹽少脂更健康!

      鐘南山院士建議:老年人多吃這5道家常菜,軟爛養(yǎng)胃、少鹽少脂更健康!

      荷蘭豆愛健康
      2026-05-12 09:54:14
      60歲蔣雯麗現(xiàn)狀:定居英國,素顏又瘦又老,沒想到一代女神也老了

      60歲蔣雯麗現(xiàn)狀:定居英國,素顏又瘦又老,沒想到一代女神也老了

      娛說瑜悅
      2026-03-20 14:38:40
      未來可期,AJ·迪班薩透露訓練中給勒布朗·詹姆斯帶來的“驚喜”

      未來可期,AJ·迪班薩透露訓練中給勒布朗·詹姆斯帶來的“驚喜”

      好火子
      2026-05-15 04:38:24
      情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

      情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

      新歐洲
      2026-04-21 19:37:05
      剛向191國發(fā)出通知,大陸轉(zhuǎn)頭放行臺當局,鄭麗文公開力挺一中

      剛向191國發(fā)出通知,大陸轉(zhuǎn)頭放行臺當局,鄭麗文公開力挺一中

      千羽解讀
      2026-05-14 10:17:47
      四川武警營門前女子鬧事后續(xù)!涉案6人均被處理,網(wǎng)友:膽子真大

      四川武警營門前女子鬧事后續(xù)!涉案6人均被處理,網(wǎng)友:膽子真大

      逍遙浪騰云
      2026-05-14 16:10:47
      外交部:維護臺海和平穩(wěn)定是中美雙方最大公約數(shù) 美方務必慎之又慎處理臺灣問題

      外交部:維護臺海和平穩(wěn)定是中美雙方最大公約數(shù) 美方務必慎之又慎處理臺灣問題

      極目新聞
      2026-05-14 15:47:18
      蒂姆·哈達威:詹姆斯不在歷史前五,這六人排他前面

      蒂姆·哈達威:詹姆斯不在歷史前五,這六人排他前面

      競技風云錄
      2026-05-15 01:46:19
      記者:尤文給阿利松3年合同年薪500萬,即將向利物浦開首份報價

      記者:尤文給阿利松3年合同年薪500萬,即將向利物浦開首份報價

      懂球帝
      2026-05-15 06:32:06
      美股收盤:納指、標普500指數(shù)續(xù)創(chuàng)新高 英偉達總市值達5.71萬億美元

      美股收盤:納指、標普500指數(shù)續(xù)創(chuàng)新高 英偉達總市值達5.71萬億美元

      財聯(lián)社
      2026-05-15 04:02:11
      6月1日起全國入戶調(diào)查,只問5類信息,這3類人必須配合

      6月1日起全國入戶調(diào)查,只問5類信息,這3類人必須配合

      老特有話說
      2026-05-14 16:34:19
      清華系團隊出手!一張 4090 即可「爆改」,1.3B小鋼炮震撼開源

      清華系團隊出手!一張 4090 即可「爆改」,1.3B小鋼炮震撼開源

      新智元
      2026-05-13 12:11:23
      里克爾梅緊急召集競選伙伴,已聯(lián)系克洛普執(zhí)教皇馬

      里克爾梅緊急召集競選伙伴,已聯(lián)系克洛普執(zhí)教皇馬

      懂球帝
      2026-05-14 20:57:08
      痛心!17歲少年求職接連碰壁,遭父親惡語指責,身無分文失聯(lián)7天

      痛心!17歲少年求職接連碰壁,遭父親惡語指責,身無分文失聯(lián)7天

      魔都姐姐雜談
      2026-05-14 07:50:36
      英如鏑直播怒斥巴圖:改名宋驍,半年不回私信想當大伯?

      英如鏑直播怒斥巴圖:改名宋驍,半年不回私信想當大伯?

      陳意小可愛
      2026-05-12 09:28:38
      2026南京重點高中大洗牌,真正的王牌原來是這幾所

      2026南京重點高中大洗牌,真正的王牌原來是這幾所

      金哥說新能源車
      2026-05-15 01:30:17
      女孩到KTV面試高薪工作 當天被拉上手術(shù)臺整容 超60名女孩遭遇“招工醫(yī)美貸”騙局

      女孩到KTV面試高薪工作 當天被拉上手術(shù)臺整容 超60名女孩遭遇“招工醫(yī)美貸”騙局

      閃電新聞
      2026-05-13 22:36:30
      楊受成“霸占”容祖兒半生:不娶也不放,她到底圖什么?

      楊受成“霸占”容祖兒半生:不娶也不放,她到底圖什么?

      橙星文娛
      2026-05-12 15:17:44
      研究表明:性生活次數(shù)不達標,不管男女容易早衰且癌癥風險增高!

      研究表明:性生活次數(shù)不達標,不管男女容易早衰且癌癥風險增高!

      黯泉
      2026-05-03 20:25:37
      買車半年維修9次!蔚來車主:不敢開了,要求退車

      買車半年維修9次!蔚來車主:不敢開了,要求退車

      深圳晚報
      2026-05-14 08:45:16
      2026-05-15 07:27:00
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
      15211文章數(shù) 66867關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克說會談很順利 黃仁勛點贊 庫克比耶

      頭條要聞

      馬斯克幼子裝扮“火”了 衣服包包都是中國造

      頭條要聞

      馬斯克幼子裝扮“火”了 衣服包包都是中國造

      體育要聞

      爭議抽象天王山,和季后賽最穩(wěn)定中鋒

      娛樂要聞

      何九華官宣當爸!全程不提孩子媽

      財經(jīng)要聞

      李強會見美國工商界代表

      汽車要聞

      雙零重力座椅/AI智能體/調(diào)光天幕 啟境GT7內(nèi)飾發(fā)布

      態(tài)度原創(chuàng)

      房產(chǎn)
      旅游
      時尚
      本地
      教育

      房產(chǎn)要聞

      海南樓市新政要出!擬調(diào)公積金貸款額度,最高可貸168萬!

      旅游要聞

      非洲旅游業(yè)邁向增長新階段(國際視點)

      白色上衣+彩色下裝:今年夏天最火搭配,時髦又減齡!

      本地新聞

      用蘇繡的方式,打開江西婺源

      教育要聞

      炸了啊:英國24所大學將面臨破產(chǎn)倒閉!

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 国产盗摄xXxX视频XXXⅩ| 国产精品免费福利久久播放| 性XXXX视频播放免费直播| 国产一卡2卡3卡四卡精品网站免费国| 国产成人无码免费视频在线| av无码a在线观看| 国产一区二区高清不卡| 午夜成年影院| 无码中文av有码中文a| 国产成人免费永久播放视频平台| 久久国产精品偷任你爽任你| 亚洲成av人片在www色猫咪| 亚州无码熟女| 亚洲AV成人片不卡无码| 国产成人精品日本亚洲77上位| 69精品人人人人| 成人无码午夜在线观看| 成人午夜免费无码视频在线观看| 精品少妇三级亚洲| 超碰国产精品久久国产精品99| 久久这里只有精品23| 天天干天天射天天操| 亚洲中文久久久精品无码| 亚洲精品无码一区二区三区久久久| 中文字幕日韩精品亚洲一区| 国模吧双双大尺度炮交gogo| 久久久久香蕉国产线看观看伊| 免费AV观看| 国产成人免费一区二区三区| 日韩视频a| 四虎影视在线永久免费观看| 亚洲αv在线精品糸列| 潮喷大喷水系列无码视频| 亚洲熟女乱色一区二区三区| 每日更新AV| 国产亚洲精品久久yy50| 久精品色妇丰满人妻| 欧美三级不卡在线播放| 中文无码一区二区不卡av| 色综合久久88色综合天天| 最新国产精品好看的精品|