智譜今天推出 GLM-5-Turbo,一個從訓(xùn)練階段就針對 OpenClaw 龍蝦場景深度優(yōu)化的基座模型,就...一個蝦搞的模型
同步推出龍蝦套餐(個人版和 Team 版),以及面向企業(yè)級場景的 Claw 安全管理體系
![]()
為什么要做龍蝦原生模型
用過 OpenClaw 的人大概都有一個體感:模型能聊好天,但未必能干好活
問題不在 OpenClaw 框架本身。通用大模型在對話能力上可以很強(qiáng),但進(jìn)入真實的龍蝦場景之后,面對的是多輪理解、任務(wù)拆解、工具調(diào)用、狀態(tài)銜接、時間觸發(fā)、持續(xù)執(zhí)行這些長鏈路工作流。通用模型在這些環(huán)節(jié)容易出現(xiàn)指令遵循偏差、工具調(diào)用不穩(wěn)定、長任務(wù)中途失速
Harness 再多,不如模型自身變強(qiáng)
GLM-5-Turbo 的思路是把優(yōu)化從框架層下沉到基座模型層。從訓(xùn)練數(shù)據(jù)構(gòu)造到優(yōu)化目標(biāo)設(shè)計,直接用真實 Agent 工作流來訓(xùn)練,讓模型在龍蝦任務(wù)中具備可執(zhí)行性。重點增強(qiáng)四項核心能力:
?Tool Calling——強(qiáng)化對外部工具與各類 Skills 的調(diào)用能力,調(diào)用不掉鏈子
?Instruction Following——對復(fù)雜多層、長鏈路指令的理解和拆解更準(zhǔn)確,支持識別目標(biāo)、規(guī)劃步驟、多智能體協(xié)同
?定時與持續(xù)性任務(wù)——針對定時觸發(fā)、長時間運行的場景做了重點優(yōu)化,能更好理解時間維度上的要求,長任務(wù)不中斷
?高吞吐長鏈路——針對數(shù)據(jù)吞吐量大、鏈條長的任務(wù)提升執(zhí)行效率與穩(wěn)定性,適合長程業(yè)務(wù)流程
隨著 OpenClaw 鋪開,怎么評測模型在龍蝦場景里的能力變成了一個行業(yè)問題。智譜基于 OpenClaw 大量真實用例的分析,發(fā)布了龍蝦場景端到端 Agent 評測基準(zhǔn) ZClawBench
先看一組生態(tài)數(shù)據(jù)。當(dāng)前 OpenClaw 的任務(wù)類型已經(jīng)覆蓋安裝配置、代碼開發(fā)、信息搜集、數(shù)據(jù)分析、內(nèi)容創(chuàng)作等多元場景,用戶群體從早期的開發(fā)者擴(kuò)展到效率辦公人群、金融從業(yè)者、運維工程師、內(nèi)容創(chuàng)作者和研究分析人員。Skills 的使用比例在短時間內(nèi)從 26% 快速增長至 45%,Agent 能力正在向模塊化和技能化的方向走
ZClawBench 的評測結(jié)果:GLM-5-Turbo 在 OpenClaw 場景中相比 GLM-5 提升顯著,在多項關(guān)鍵任務(wù)上整體領(lǐng)先于多家主流模型,取得國產(chǎn)模型第一
![]()
ZClawBench 評測結(jié)果
題庫與測試軌跡已全面公開,歡迎業(yè)界驗證
盲測和大廠評價
Benchmark 是一回事,用戶真實體驗是另一回事
GLM-5-Turbo 以 Pony-Alpha-2 為代號接入 AutoClaw 澳龍,在用戶盲測中,90% 的受訪者認(rèn)為 GLM-5-Turbo 的表現(xiàn)優(yōu)于其他國產(chǎn)模型
內(nèi)測階段幾家互聯(lián)網(wǎng)大廠的反饋:
阿里 QoderWork 模型測評團(tuán)隊
「精準(zhǔn)的工具調(diào)用配合長程任務(wù)的穩(wěn)定可靠,完美驅(qū)動了桌面級 Agent 上的跨應(yīng)用數(shù)據(jù)流轉(zhuǎn)與系統(tǒng) API 操控。在攻克辦公場景的'幻覺'痛點上表現(xiàn)優(yōu)秀」
扣子 Coze 測評團(tuán)隊
「指令遵循力壓群雄,面對長任務(wù)更精準(zhǔn)不掉鏈子,極大提升了多智能體構(gòu)建的成功率」
美團(tuán)模型測評團(tuán)隊
「定時與長鏈路任務(wù)穩(wěn)健,對比同類模型展現(xiàn)出明顯第一梯隊的優(yōu)勢,非常靠譜」
快手萬擎測評團(tuán)隊
「高吞吐執(zhí)行極快且不失速,響應(yīng)穩(wěn)定性領(lǐng)跑同類模型,真正解決了 Agent 的執(zhí)行難題」
編程場景的表現(xiàn)延續(xù)了 GLM 模型 Agentic Engineering 的路線:
字節(jié) TRAE 團(tuán)隊
「編程能力穩(wěn)居第一梯隊,在 Coding Agent 實測中優(yōu)于同類模型,處理長鏈路代碼任務(wù)非常穩(wěn)健」機(jī)械革命龍蝦盒子
GLM-5-Turbo 已經(jīng)接入軟通動力旗下機(jī)械革命盒子。全球首發(fā)接入 GLM 模型的機(jī)械革命「龍蝦盒子」,做的是原生 AI Agent 終端體驗
![]()
機(jī)械革命龍蝦盒子 龍蝦套餐
龍蝦太能干活,自然也吃 tokens
一個典型的龍蝦任務(wù),比如完成一次跨部門的會議紀(jì)要整理與任務(wù)分發(fā),可能涉及數(shù)十輪工具調(diào)用與上下文銜接,tokens 消耗遠(yuǎn)超普通對話。對于用龍蝦的企業(yè)和個人來說,tokens 是最大的成本瓶頸
智譜即日起推出基于 GLM-5-Turbo 的龍蝦套餐,包含個人版和 Team 版。一人公司、創(chuàng)業(yè)團(tuán)隊、大中型企業(yè)都能根據(jù)業(yè)務(wù)規(guī)模靈活訂閱
龍蝦套餐定價
每個賬號最多購買 5 個。企業(yè)可通過 Team 版按實際員工數(shù)靈活訂閱,用可控成本保障 tokens 供給和 AI 員工的穩(wěn)定在線
Claw for Enterprise Security
在龍蝦套餐的基礎(chǔ)上,智譜專門構(gòu)建了一套面向企業(yè)級場景的 OpenClaw 安全管理體系「Claw for Enterprise Security」
這套體系做了幾件事:
?統(tǒng)一調(diào)度與權(quán)限編排——無論是信息搜集、數(shù)據(jù)分析、代碼開發(fā)還是跨系統(tǒng)操作,企業(yè)可以根據(jù)業(yè)務(wù)流程靈活組合 Claw 能力
?實時可視化監(jiān)控——通過集中化管控臺,對每一個 Agent 任務(wù)的執(zhí)行路徑、工具調(diào)用鏈路和資源消耗進(jìn)行監(jiān)控,多 Agent 協(xié)同不再是黑盒
?基于角色的權(quán)限管理——每個 Claw 只能在授權(quán)范圍內(nèi)調(diào)用工具和訪問數(shù)據(jù)
?完整審計日志——所有操作生成審計記錄,滿足企業(yè)合規(guī)要求
?數(shù)據(jù)安全——敏感業(yè)務(wù)數(shù)據(jù)全程加密處理,嚴(yán)格遵守數(shù)據(jù)本地化要求,不離開企業(yè)可控邊界
?人工審批機(jī)制——關(guān)鍵業(yè)務(wù)節(jié)點保留人工審批,防止自動化流程產(chǎn)生不可控的業(yè)務(wù)風(fēng)險
GLM-5-Turbo 現(xiàn)已上線,幾個接入路徑:
API 接入
? 智譜開放平臺:BigModel.cn
? Z.ai:api.z.ai
GLM Coding Plan
? Coding Plan Max 已支持 GLM-5-Turbo
? Pro 套餐本月盡快支持
? Lite 套餐 4 月支持
? Coding Plan 也可用于 OpenClaw 接入體驗;如果需要長期穩(wěn)定運行、后臺持續(xù)執(zhí)行或更高負(fù)載的 Agent 場景,建議優(yōu)先用龍蝦套餐
額度消耗規(guī)則GLM-5、GLM-5-Turbo 作為對標(biāo) Claude Opus 的高階模型,按「高峰期 3 倍,非高峰期 2 倍」系數(shù)消耗額度。限時福利:GLM-5-Turbo 非高峰期僅作 1 倍抵扣,持續(xù)到 4 月底
AutoClaw 澳龍默認(rèn)模型已切換為 GLM-5-Turbo,非程序員群體也可以直接體驗龍蝦能力,享受一定免費額度。即日起至 3 月 22 日為澳龍限時福利,加油包最高享 3.4 折優(yōu)惠
(加油包自購買起 7 日內(nèi)有效)
![]()
澳龍福利
在線體驗
? AutoClaw 澳龍客戶端:https://autoglm.zhipuai.cn/autoclaw
? Z.ai:z.ai
? 智譜清言 APP / 網(wǎng)頁版
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.