<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      Token 剛定了中文名,AI 圈又多了個翻譯不了的詞

      0
      分享至

        馬上又來了一個亟需被認證的新詞 Harness。

        這年頭想要在 AI 圈子里當個「全面發展的專業人士」,每天要學習的概念是真的多。從最早一個 ChatGPT 能指代一切 AI,我能知道 ChatGPT 就已經領先身邊大多數人。

        到后面慢慢發展到,我要去學習什么是 Prompt,是提示詞還是文令、「已死的」MCP,是被 CLI 替代的模型上下文協議、RAG 是風靡一時的檢索增強生成、Agent 不是代理,是智能體、Skills 是技能,也是專家、Claude Code 是代碼助手。

        還有因為爪子 Claw 得名龍蝦的 OpenClaw、以及龍蝦太火需要大量消耗的 Token = xxx……

        這些堪比「顆粒度」、「對齊」的職場黑話,如果你都聽過,大概率還是能在一些聊 AI 的飯局上稍微顯露一波的。

        

        之前 MiniMax M2.7 模型介紹博客里提到的 Agent Harness 能力

        但現在,新的詞又來了,什么是 Harness。有網友在社交媒體上用一張淘寶搜索的截圖回應,表示「很好理解」。

        

        很離譜,但是我們把 AI 當牛馬去指揮它干活,Harness 翻譯成套在 AI 身上的馬具/束縛,也并不是全無道理。

        其實 Harness 最早被真正放進 Agent 領域,還是在 Anthropic 去年十一月的一篇博客,文章里他們探討了現在的 Agent 要執行的任務越來越長,需要一個有效的 Harness 來確保 Agent 的運作正常。

        

        博客鏈接:https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

        到了今年本地運行的 Agent 重新搬上臺面,一眾 AI 開發者和研究員在自己的技術博客里,也頻繁提到 Harness 這個詞。知名博主 Mitchell 提到 Harness Engineering 的理念是,「每當發現某個智能體犯錯時,就花時間設計一個解決方案,確保它以后不再犯同樣的錯誤?!?/p>

        緊接著 OpenAI 在今年二月也發了幾篇博客,講的也是 Harness engineering,在他們看來,未來工程師的工作,不是寫代碼,而是設計智能體的「工作環境」,Harness 就是這個工作環境。

        

        在 OpenAI 官網選擇中文后,直接翻譯成了「工程技術」,博客鏈接:https://openai.com/zh-Hans-CN/index/harness-engineering/

        為什么 Harness 開始被重視

        無論是 Anthropic 最早的博客,還是后面 OpenAI 的 Harness 工程,它們在文章里面描述的故事都是一樣的。

        Harness 是一種包含環境配置、多 Agents 協作機制、嚴格架構約束和上下文管理的系統,它彌補了 AI 的「上下文焦慮」和易錯性。

        兩家頂級 AI 實驗室都用大量的內部工程實踐證明了,讓大模型自主寫出百萬行代碼的關鍵,并非模型本身有多聰明,而在于構建了一個強大的 Harness(工作流框架 / 護欄系統)。

        

        我們讓 Claude 畫了一張圖,來完整介紹一下 Agent Harness,Harness = Agent 的運行容器 + 安全邊界 + 調度控制器

        在 Anthropic 的內部實驗中,研究員們發現 AI 竟然也會有「心理問題」。

        當 Claude 執行長周期的代碼任務時,一旦它感覺到自己的上下文窗口快要填滿了,它就會產生「上下文焦慮」。就像快要下班的打工人,開始瘋狂敷衍,試圖趕緊結束任務。

        要命的是,Claude 并不覺得自己在敷衍,當研究員要求 AI 評估這些「為了下班趕緊結束任務」所編寫的代碼時,它發現不了其中的問題。

        面對這種毛病,傳統的提示詞設計毫無用處。Anthropic 的研究員給出的 Harness 解法是:改變組織架構。

        他設計了一個包含三個角色的 Harness 閉環:

        規劃師(Planner):負責把一句話需求擴寫成詳細的產品文檔。

        生成器(Generator):純粹的牛馬,只負責按文檔寫代碼。

        評估器(Evaluator):極其冷酷的 QA 兼產品經理,手握自動化測試工具。

        

        Anthropic 的報告中提到,應用了 Harness 框架的 Agent 在生成網頁質量上要好很多,但是成本和時間更長。

        要求是開發一個游戲制作器,沒有 Harness 的那組,AI 跑了 20 分鐘,花了 9 美元。結果是界面能看,但核心功能是壞的——游戲里的角色出現在屏幕上,但對任何鍵盤操作都沒有反應,游戲沒法玩。

        有 Harness 的那組,跑了 6 小時,花了 200 美元。結果是游戲不只是能玩,還有動畫系統、音效、AI 輔助的關卡設計。

        在這套 Harness 里,生成器寫完一段代碼,評估器就會像真實用戶一樣去點擊、測試,一旦發現 Bug 或是那種充滿「AI 塑料味」的平庸設計,直接打回重做。

        包括我們經常用來測試 AI Coding 能力的網頁生成,Anthropic 也發現,Harness 的潛力相當大。在一個設計荷蘭藝術博物館網頁的任務中,前 9 次迭代,AI 都在老老實實地畫平庸的網頁。

        但在評估器不斷施壓下,第 10 次迭代,AI 突然拋棄了所有常規模板。它交出了一個特立獨行的 3D 空間:畫作懸掛在透視棋盤格的房間里,用戶需要像走迷宮一樣穿梭。

        

        如果說 Anthropic 的 Harness 側重于組織架構,去探索 Harness 的設計原理,OpenAI 的 Codex 團隊則是把這件事做成了一種工程文化,更多地把 Harness 當作一種工作流框架。

        他們的核心約束只有一條,那就是沒有人工手寫的代碼。所有代碼——業務邏輯、測試、CI 配置、文檔、內部工具、生產監控儀表盤——都由 Codex 寫。工程師的工作不是寫代碼,而是設計讓 AI 能可靠工作的環境。

        一開始他們用一個超長的 AGENTS.md 文件告訴 AI 所有的規則。但很快就因為上下文限制,導致 AI 只會進行本地模式匹配,沒有真正理解。而且文件很快過時,沒有人維護,AI 開始被一堆可能不再成立的規則誤導。

        

        一套完整的工作流程

        后來的做法是:AGENTS.md 只有 100 行,只充當一個「目錄」,把 AI 指向結構化的 docs/ 文件夾。架構文檔、產品規格、設計決策、技術債務追蹤,全部是可以被 AI 直接讀取的版本化文件。每個 doc 由 AI 寫,由 AI 維護,定期有「文檔園丁」Agent 掃描過時的文檔來自動更新。

        他們不在乎 AI 怎么寫具體的邏輯,但在 Harness 中設置了極其嚴格的 Linter(代碼檢查工具)和物理依賴邊界。業務代碼只能單向調用,越界就會被系統無情切斷,根本合并不進項目主分支。

        在這個 Harness 中,我們所設置的規則,變成了 AI 不可違背的意志。AI 就像生活在「楚門的世界」里,它擁有寫代碼的絕對自由,但這種自由,永遠在人類設定的結界,即 Harness 之內。

        把這些研究放在一起,其實 harness 的本質就是一套系統,用來補償當前 AI 不擅長的事。

        AI 不擅長長期記憶,Harness 就用進度文件、git 歷史、結構化來補。

        AI 評價自己太寬松,用獨立的評估 Agent,帶著具體標準和真實環境測試。

        AI 在復雜任務里容易偏航,用任務分解、結構化、合約約定來約束范圍。

        AI 不具備對代碼庫架構品味的直覺,因此需要用文檔和自動化規范檢查,將人類的判斷轉化為系統規則。

        

        Claude 生成的 Harness 在 AI 領域的位置信息圖

        有意思的是,隨著模型能力增強,harness 的有些部分會變得不再必要,但新的部分又會出現。

        Anthropic 在升級到 Opus 4.6 之后,發現之前為了對抗「上下文焦慮」設計的「上下文重置」機制可以直接去掉了,因為新模型已經能自己處理了。

        但同時,他們發現了新的方向,用 harness 來讓 AI 在應用里自動集成 AI 功能,這是之前模型做不到的事。

        對 Harness 來說,模型越強,Harness 不是變得更簡單,而是要去做更難的事。

        怎么翻譯 Harness

        在那篇詢問「繼 token、Agent 之后,又來了一個難以翻譯的詞:Harness」推文下,除了給出那張炸裂的「戰術胸帶 Harness」截圖外,還有很多網友給出了自己的翻譯。

        有人說應該叫「線束」,因為這個詞在汽車行業已經很多年了。還有「駕馭層」、「駕馭系統」、「Agent 框架」、「控制框架」、「管控層」、「錨定層」、「= Scaffold 腳手架」……

        更有意思的回復是「安全套」、「套馬桿」、以及約束牛馬該做什么不該做什么的「槽具」。

        

        微博上關于 Harness 怎么翻譯的討論也很多,Token 可以翻譯成智元的話,那 Harness 就叫智馭吧……也有人覺得和 MCP 現在無人問津的狀態一樣,Harness 這個概念只是現在熱,過一段時間又會有新的詞被造出來、被流行。

        我們問了問 Claude,它給了好幾個答案。

        「框架」,它認為很多東西都叫框架,framework 可以,architecture 也可以;「執行框架」,強調了運行層面,但中性,沒有「約束」的感覺。

        「駕馭層」中文語境下不太用這種說法;「管控層」強調了「約束」,但是沒有「執行」;「套具」在 AI 領域完全是陌生的概念。

        

        所以最后它說比較實用的方案是,不翻譯,就用 Harness

        一個概念如果能被一個詞完整概括,翻譯本來順理成章的事。Harness 之所以又是一個不容易確定的詞,是因為它在 LLM 這套流程里,同時包含了「約束」、「執行」、「環境」、「系統」等幾層意思,拆開來哪個都只說對了一半。

        和 Token 最終被認證為「詞元」,Harness 大概率也會有自己的官方中文。在那天之前,你在技術文章里看到這個詞,知道它在說什么就夠了。

        然后在某個聊到 AI 的飯局上,記得說一句,「在未來,會寫提示詞和 Skills 都不是核心競爭力。真正的頂級人才,是那些懂得如何設計 Harness 的人。」

        關于 Harness 的詳細內容,還可以閱讀下面這些文章:

        1、Anthropic, Harness design for long-running application development, 適用于長時間運行應用程序開發的 Harness 設計, 2026-03-24, https://www.anthropic.com/engineering/harness-design-long-running-apps

        2、OpenAI, Harness engineering: leveraging Codex in an agent-first world, Harness 工程:在智能體優先的世界中利用 Codex, 2026-02-11, https://openai.com/index/harness-engineering/

        3、Mitchell Hashimoto, My AI Adoption Journey, 我的 AI 應用之旅, 2026-02-05, https://mitchellh.com/writing/my-ai-adoption-journey

        4、OpenAI, Unlocking the Codex harness: how we built the App Server, 解鎖 Codex 的 Harness:我們如何構建 App Server, 2026-02-04, https://openai.com/index/unlocking-the-codex-harness/

        5、Anthropic, Effective harnesses for long-running agents, 適用于長期運行 Agents 的有效 Harness, 2025-11-26, https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

      聲明:包含AI生成內容

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      打起來了!特朗普不宣而戰,美軍發起斬首行動,伊朗或再次上當

      打起來了!特朗普不宣而戰,美軍發起斬首行動,伊朗或再次上當

      溫讀史
      2026-05-10 03:12:59
      60歲張衛健曬19歲舊照,同款姿勢引回憶殺,網友:帥到犯規

      60歲張衛健曬19歲舊照,同款姿勢引回憶殺,網友:帥到犯規

      木子娛你同行
      2026-05-09 09:25:23
      鄭永剛:巴吉G1展現了護框能力,今晚比賽他將面臨不小的挑戰

      鄭永剛:巴吉G1展現了護框能力,今晚比賽他將面臨不小的挑戰

      懂球帝
      2026-05-10 13:46:11
      77歲港星在東莞租房養老,35平米月租1300,無兒無女靠老本度日

      77歲港星在東莞租房養老,35平米月租1300,無兒無女靠老本度日

      喜歡歷史的阿繁
      2026-05-10 00:04:45
      臺電新Logo由“綠友友”96萬元得標,網紅揭重點:百萬以內無需招標

      臺電新Logo由“綠友友”96萬元得標,網紅揭重點:百萬以內無需招標

      海峽導報社
      2026-05-10 11:12:08
      詩妮娜揮手拜拜,貴妃出現在機場返回德國,整容恢復后人也靚多了

      詩妮娜揮手拜拜,貴妃出現在機場返回德國,整容恢復后人也靚多了

      舊事別提
      2026-05-10 00:36:49
      “保殼”無望 十余家公司鎖定退市

      “保殼”無望 十余家公司鎖定退市

      環球網資訊
      2026-05-10 10:49:16
      電動自行車頭盔放哪兒防丟?北京交警解鎖新方法!

      電動自行車頭盔放哪兒防丟?北京交警解鎖新方法!

      家住朝陽
      2026-05-09 18:05:17
      CBA季后賽奎因扛起廣東隊 張皓嘉完成絕殺

      CBA季后賽奎因扛起廣東隊 張皓嘉完成絕殺

      中國青年報
      2026-05-10 13:37:01
      女人富養自己最好的方式,不靠錢,而是...

      女人富養自己最好的方式,不靠錢,而是...

      十點讀書
      2026-05-08 19:07:26
      7800億軍購案通過背后,藍營一人背棄鄭麗文,趙少康發起挑戰

      7800億軍購案通過背后,藍營一人背棄鄭麗文,趙少康發起挑戰

      夢史
      2026-05-10 13:49:44
      李嘉誠次子花1.7億拿下轉播權,大陸21億僵局,誰在當冤大頭?

      李嘉誠次子花1.7億拿下轉播權,大陸21億僵局,誰在當冤大頭?

      觀星娛記
      2026-05-10 13:15:08
      “520”“521”上海結婚登記線上預約基本已滿,未能預約者亦可現場辦理

      “520”“521”上海結婚登記線上預約基本已滿,未能預約者亦可現場辦理

      澎湃新聞
      2026-05-10 13:42:27
      中方連夜發布聲明,涉疫船舶轉交第三國!疫情暴發,譚德塞已行動

      中方連夜發布聲明,涉疫船舶轉交第三國!疫情暴發,譚德塞已行動

      基斯默默
      2026-05-10 07:06:00
      工齡27年,個人賬戶460220.94元,廣州退休養老金出乎意料!

      工齡27年,個人賬戶460220.94元,廣州退休養老金出乎意料!

      養老規劃羅姐說
      2026-05-08 20:15:23
      “4只皮皮蝦1035元”,游客稱未收到退款,官方回復:未超出調控價格,已對司機和餐館展開調查

      “4只皮皮蝦1035元”,游客稱未收到退款,官方回復:未超出調控價格,已對司機和餐館展開調查

      極目新聞
      2026-05-07 18:29:41
      慘,封單好大!洲際、海王、聞泰、華幸、際華…何時才會開板?

      慘,封單好大!洲際、海王、聞泰、華幸、際華…何時才會開板?

      丁丁鯉史紀
      2026-05-10 11:25:21
      當年23個70后一把手,團干14人,費高云是機關內逐級晉升者

      當年23個70后一把手,團干14人,費高云是機關內逐級晉升者

      江南江南
      2026-05-10 11:02:41
      前助教大膽預判!只要保持健康狀態,C羅有望征戰2030世界杯

      前助教大膽預判!只要保持健康狀態,C羅有望征戰2030世界杯

      小皷拍客在北漂
      2026-05-10 14:42:26
      徐帆回應離婚9個月后,馮小剛和其前任同聚,和養女關系引爭議

      徐帆回應離婚9個月后,馮小剛和其前任同聚,和養女關系引爭議

      樂悠悠娛樂
      2026-05-10 12:00:32
      2026-05-10 15:23:00
      AppSo incentive-icons
      AppSo
      讓智能手機更好用的秘密
      6364文章數 26832關注度
      往期回顧 全部

      科技要聞

      DeepSeek融資,改寫所有人的估值

      頭條要聞

      中國在德7名精英組群性侵女性手段殘忍 群主哈工大畢業

      頭條要聞

      中國在德7名精英組群性侵女性手段殘忍 群主哈工大畢業

      體育要聞

      詹姆斯生涯第6次0-3困境:今年會被橫掃嗎

      娛樂要聞

      大S女兒玥兒開通賬號,用煙花緬懷母親

      財經要聞

      白酒大逃殺

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      房產
      旅游
      數碼
      手機
      公開課

      房產要聞

      低價甩賣!??谶@個地標商業,無人接盤!

      旅游要聞

      新華視點|城鄉文旅創新業態 體驗經濟激發消費新活力

      數碼要聞

      銘瑄新板,小身材大能量?

      手機要聞

      華為智慧屏S7發布:搭載全新自研鴻鵠芯片,3999元起

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日韩乱码人妻无码超清蜜桃| 欧亚av| 天堂av在线男女av| 欧美激情精品久久999| 亚洲高清成人AV电影网站| 中文字幕一区二区人妻电影 | 99精品热6080yy久久| 德格县| 日韩精品亚洲专在线电影| 中文字幕一区二区三区四区五区| 亚洲韩国人妻中文字幕一区| 手机看片久久国产永久免费| 国产日韩精品中文字无码| 高中女无套中出17p| 日本免费一区二区三区中文字幕| 日韩欧无码一区二区三区免费不卡| 两个少妇互摸同性| 亚洲精品系列| 日韩精品久久久免费观看| 狠狠色综合tv久久久久久| 可以在线观看的亚洲视频| 青青草乱人| 丰满白嫩大屁股ass| 193尤物| 欧美曰批视频免费播放免费 | 日本欧美一区二区免费视频 | 中文字幕无码白丝袜| 亚洲三区av| 精品国产卡二2卡3卡4卡乱码| 欧美成人www免费全部网站| 99国产精品久久久蜜芽| 亚洲人网站| 国产精品白浆一区二小说| 久久综合精品无码av一区二区三区 | 国产精品毛片在线完整版| 精品国产中文字幕av| 国产高清在线精品一本大道| 一个色综合国产色综合| 亚洲熟妇自偷自拍另类| av在线亚洲一区| 国产绿帽在线视频看|