<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      GLM-5.1 開源:零介入,交付整套的 Linux 桌面系統

      0
      分享至

      PRODUCT

      今天,智譜開源了 GLM-5.1:744B 參數,40B 激活,MIT 協議

      零人工介入,能獨立工作超過 8 小時,GLM-5.1 從零交付了一套完整的 Linux 桌面系統:窗口管理器、文件瀏覽器、終端、文本編輯器、系統監視器、游戲庫等,共計 4.8MB

      8小時,構建Linux 桌面系統

      SWE-Bench Pro 58.4,超過 GPT-5.4 和 Claude Opus 4.6,全球最高

      三項編碼基準綜合平均,全球第三、開源第一


      三項編碼基準綜合平均分

      給更多時間,真的會更好

      GLM-5.1 能夠在長時間任務中持續保持有效工作,這讓它可以做到以前短對話里做不了的事情。以下是兩個硬核的例子

      自主優化一個搜索引擎,連續跑了 655 輪

      AI 搜索和推薦系統的背后都有一個向量數據庫,它的查詢速度直接決定用戶體驗。GLM-5.1 用 Rust 從零寫了一個向量搜索引擎,然后自己反復跑測試、看結果、改代碼,連續迭代了 655 輪

      向量數據庫 655 輪優化

      過程中模型完成了 6 次結構性的策略跳躍,從全庫掃描一路優化到兩級路由 + 提前剪枝,最終把查詢速度從 3108 QPS 提升到 21472 QPS,提高了 6.9 倍


      向量數據庫優化軌跡:階梯型跳躍模式

      給 50 個 AI 模型寫加速代碼,跑了 1000 多輪

      KernelBench 給模型一個挑戰:拿到 50 個真實 AI 模型(MobileNet、VGG、MiniGPT、Mamba 等)的 PyTorch 代碼,想辦法寫出運行更快的 GPU 版本,功能完全一樣但速度要快


      KernelBench Level 3 優化曲線:四個模型對比

      GLM-5.1 在 1000 多輪工具調用中自主編寫了 Triton 和 CUDA 加速代碼,最終達到 3.6 倍加速,遠超 PyTorch 自帶優化器 torch.compile 的 1.49 倍

      Benchmark 詳細數據

      GLM-5.1 的提升集中在編碼和智能體兩個維度,提升幅度在 19%-42% 之間。推理能力和 GLM-5 基本持平,和 Gemini 3.1 Pro、GPT-5.4 還有明顯差距


      GLM-5.1 Benchmark 總覽

      編碼能力

      SWE-Bench Pro 衡量的是模型能否在真實 GitHub 倉庫中定位并修復高難度工程 Bug,是目前最接近真實軟件開發的單項指標。GLM-5.1 得分 58.4,全球最高,超過 GPT-5.4(57.7)和 Claude Opus 4.6(57.3)

      NL2Repo 要求模型根據自然語言描述從零構建完整的代碼倉庫,測試的是系統級工程能力。GLM-5.1 得分 42.7,vs GLM-5 的 35.9,提升 19%。和 Claude Opus 4.6(49.8)還有 7 分差距

      Terminal-Bench 2.0 讓模型在真實終端環境中解決系統管理、運維和開發任務。GLM-5.1 得分 63.5,vs GLM-5 的 56.2

      CyberGym 是網絡安全編碼基準,要求模型完成滲透測試、漏洞分析等安全工程任務。GLM-5.1 得分 68.7,vs GLM-5 的 48.3,提升 42%,進步最大的單項


      編碼能力詳細對比

      智能體能力

      BrowseComp 測試模型能否通過自主瀏覽網頁解決復雜信息檢索問題。GLM-5.1 帶上下文管理得分 79.3

      τ3-Bench 在模擬客服場景中測試對話式 Agent 的雙向控制能力。GLM-5.1 得分 70.6

      MCP-Atlas 衡量模型在多步驟工作流中調用外部工具(MCP 服務器)的能力。GLM-5.1 得分 71.8

      Vending Bench 2 讓模型經營一年的模擬自動售貨機生意,測試長期規劃和資源管理。GLM-5.1 最終賬戶余額 $5634,vs GLM-5 的 $4432。和 Claude Opus 4.6($8017)還有明顯差距


      智能體能力詳細對比

      推理能力

      HLE 被稱為「人類最后的考試」,由各領域專家出題,專門測試模型的知識和推理極限。GLM-5.1 得分 31.0,和 Gemini 3.1 Pro(45.0)、GPT-5.4(39.8)有明顯差距

      AIME 2026 是美國數學邀請賽 2026 年賽題。GLM-5.1 得分 95.3,各家模型在這項上已經非常接近

      GPQA-Diamond 是由博士級專家出題的科學問答,涵蓋物理、化學、生物等領域。GLM-5.1 得分 86.2

      推理維度整體和 GLM-5 持平,GLM-5.1 的提升集中在編碼和智能體


      推理能力詳細對比

      技術報告解讀

      GLM-5.1 的技術細節沿用 GLM-5 的論文框架,論文已公開在 arXiv(2602.15763)。這里提取幾個和長程能力直接相關的核心要點


      異步 RL 基礎設施


      GLM-5 整體訓練管線

      傳統同步 RL 處理 Agent 任務時 GPU 空閑嚴重,因為不同任務的軌跡長度差異極大。智譜把訓練引擎和推理引擎解耦到不同 GPU 設備上:推理引擎持續生成軌跡,達到閾值后批量送訓練引擎更新模型,權重定期同步

      通過一個「多任務 Rollout 編排器」支持超過 1000 個并發 rollout,每個任務實現為獨立的微服務,注冊到中央編排器統一調度

      TITO(Token-in-Token-out)

      異步 RL 中一個容易被忽視的問題:把推理引擎當作黑箱只取最終文本,訓練器需要重新分詞來重建軌跡。分詞邊界的微小不一致會在數千步的 Agent 任務中逐步累積

      TITO 直接消費推理引擎產出的 token ID 流和元數據,保持 action 級別的精確對應,消除重新分詞帶來的誤差

      DSA 與 RL 的適配


      DSA 訓練 SFT loss 對比

      GLM-5 在預訓練階段引入 DSA(DeepSeek Sparse Attention),用動態稀疏注意力把長上下文的注意力計算降低約 1.5-2 倍

      在 RL 階段出現了一個實踐發現:DSA 的 indexer 必須使用確定性的 torch.topk。非確定性的 CUDA 實現會導致 RL 訓練幾步之后 entropy 急劇下降,性能嚴重退化

      雙側重要性采樣

      異步 RL 中不同軌跡可能由不同版本的模型生成,off-policy 問題嚴重。傳統方案需要維護歷史策略檢查點來計算重要性采樣比率

      智譜的做法更直接:直接用 rollout 時的 log-probability 作為行為策略的代理,用 token 級別的雙側裁剪機制控制信任域,超出區間的 token 從梯度計算中屏蔽。不需要跟蹤歷史策略

      環境規模


      BrowseComp 上下文管理策略對比

      編碼任務:構建超過 10000 個可驗證訓練環境,覆蓋 Python、Java、Go、C、C++、JavaScript、TypeScript、PHP、Ruby 9 種語言

      搜索任務:構建 Web 知識圖譜,從 200 萬+ 高信息網頁中抽取實體和關系,合成高難度多跳 QA 對

      國產芯片全棧適配

      GLM-5 從第一天起就完成了七家國產芯片平臺的全棧適配:華為昇騰、摩爾線程、海光、寒武紀、昆侖芯、沐曦、燧原

      在華為昇騰上通過 W4A8 混量化、Lightning Indexer 融合算子、MLAPO 預處理優化等手段,單節點性能接近雙卡國際集群

      開源與使用

      GLM-5.1 權重以 MIT 協議開源,提供 BF16 和 FP8 兩個版本。支持 vLLM、SGLang、xLLM(華為昇騰)、Ktransformers 本地部署

      API 方面,GLM-5.1 已納入 GLM Coding Plan(Max/Pro/Lite 套餐),支持 Claude Code、OpenCode、Kilo Code、Roo Code、Cline 等工具接入

      GLM-5.1 即將上線 chat.z.ai

      參考材料

      GLM-5.1 Blog
      https://z.ai/blog/glm-5.1

      GLM-5 Technical Report
      https://arxiv.org/abs/2602.15763

      GitHub
      https://github.com/zai-org/GLM-5

      Hugging Face
      https://huggingface.co/zai-org/GLM-5.1

      ModelScope 魔搭社區
      https://modelscope.cn/models/ZhipuAI/GLM-5.1

      GLM Coding Plan
      https://z.ai/subscribe

      BigModel 開放平臺
      https://docs.bigmodel.cn/cn/guide/models/text/glm-5.1

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      鐘漢良假發意外爆紅,成全網熱議名場面

      鐘漢良假發意外爆紅,成全網熱議名場面

      小椰的奶奶
      2026-05-08 11:58:54
      兒子病逝,兒媳改嫁,9歲孫子和73歲爺爺相依為命,怕爺爺也去世,每天偷偷把肉帶回家,老師:他懂事得讓人心疼

      兒子病逝,兒媳改嫁,9歲孫子和73歲爺爺相依為命,怕爺爺也去世,每天偷偷把肉帶回家,老師:他懂事得讓人心疼

      觀威海
      2026-04-13 10:00:08
      暫停使用!已陪伴廣州人22年!街坊:不舍

      暫停使用!已陪伴廣州人22年!街坊:不舍

      廣州生活美食圈
      2026-05-08 11:47:10
      71.5%!歷史性暴跌,以貸養貸的泡沫崩了

      71.5%!歷史性暴跌,以貸養貸的泡沫崩了

      月滿大江流
      2026-04-16 13:54:38
      楊冪新劇未播先火!哭得渾身發抖面部猙獰,才知85花含金量有多高

      楊冪新劇未播先火!哭得渾身發抖面部猙獰,才知85花含金量有多高

      一娛三分地
      2026-05-09 20:29:35
      沒想到,世乒賽還沒結束,乒協主席王勵勤竟傳來另一大好消息

      沒想到,世乒賽還沒結束,乒協主席王勵勤竟傳來另一大好消息

      野渡舟山人
      2026-05-10 00:08:43
      巨爽啊啊啊啊啊啊啊啊啊!!!黏糊糊熱醒的夜晚,是時候和這條A類深睡被鎖死了

      巨爽啊啊啊啊啊啊啊啊啊!!!黏糊糊熱醒的夜晚,是時候和這條A類深睡被鎖死了

      英國報姐
      2026-05-08 21:15:35
      14支球隊鎖定下賽季歐冠名額:巴薩、拜仁、皇馬、阿森納在列

      14支球隊鎖定下賽季歐冠名額:巴薩、拜仁、皇馬、阿森納在列

      懂球帝
      2026-05-09 16:43:08
      5年坐擁7首輪+1互換權!火箭隊交易籌碼太豪華!追逐4巨星有戲了

      5年坐擁7首輪+1互換權!火箭隊交易籌碼太豪華!追逐4巨星有戲了

      熊哥愛籃球
      2026-05-09 12:39:39
      中國選手世界杯集體爆發!團體殺入決賽,傳統霸主韓國隊遭打擊

      中國選手世界杯集體爆發!團體殺入決賽,傳統霸主韓國隊遭打擊

      羅掌柜體育
      2026-05-09 11:42:21
      為什么腦梗逐年增多?提醒:與肥肉無關,有一樣東西要少碰

      為什么腦梗逐年增多?提醒:與肥肉無關,有一樣東西要少碰

      芹姐說生活
      2026-04-19 08:33:41
      方媛這身材,50歲的郭富城怎么頂的住,從每月20萬到黑卡隨便刷!

      方媛這身材,50歲的郭富城怎么頂的住,從每月20萬到黑卡隨便刷!

      一盅情懷
      2026-03-12 18:10:03
      郵報:輪休、變陣、心理戰,埃梅里的魄力配得上1200萬鎊年薪

      郵報:輪休、變陣、心理戰,埃梅里的魄力配得上1200萬鎊年薪

      懂球帝
      2026-05-09 11:58:07
      美國160多份UFO文件公開(含多段視頻)!2023年不明飛行物近海面飛行,超百公里時速多次90°轉向;2020年一實心白色物體在水上不規則運動

      美國160多份UFO文件公開(含多段視頻)!2023年不明飛行物近海面飛行,超百公里時速多次90°轉向;2020年一實心白色物體在水上不規則運動

      都市快報橙柿互動
      2026-05-09 09:26:00
      車評臺|預售補貼價21.99萬元起 MPV該有的防滾梁問道V9給配上了

      車評臺|預售補貼價21.99萬元起 MPV該有的防滾梁問道V9給配上了

      車評臺
      2026-04-28 23:15:36
      【舊事】鄧麗君真正死因:控制不了自己,到時候就會“欲罷不能”

      【舊事】鄧麗君真正死因:控制不了自己,到時候就會“欲罷不能”

      年之父
      2026-05-09 04:05:03
      沒人信 C 羅當年的話,如今皇馬付出了慘痛代價

      沒人信 C 羅當年的話,如今皇馬付出了慘痛代價

      瀾歸序
      2026-05-09 05:19:18
      跟隊:皮奧和恰20本輪踢不了拉齊奧,但前者能在意杯決賽復出

      跟隊:皮奧和恰20本輪踢不了拉齊奧,但前者能在意杯決賽復出

      懂球帝
      2026-05-09 20:57:16
      體內有癌,睡眠先預警!有這3種睡覺習慣的人,更容易得癌

      體內有癌,睡眠先預警!有這3種睡覺習慣的人,更容易得癌

      鳳凰衛視
      2026-05-08 14:53:07
      安徽省科學技術協會原黨組書記、副主席金春龍被“雙開”

      安徽省科學技術協會原黨組書記、副主席金春龍被“雙開”

      界面新聞
      2026-05-09 19:33:37
      2026-05-10 02:43:00
      賽博禪心
      賽博禪心
      拜AI古佛,修賽博禪心
      429文章數 53關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協議

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      體育要聞

      成立128年后,這支升班馬首奪頂級聯賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認不出!

      財經要聞

      多地號召,公職人員帶頭繳納物業費

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      藝術
      游戲
      教育
      親子
      軍事航空

      藝術要聞

      深圳終究失去“中國第一高樓”,華潤接手地塊!

      Windows 11 PC上的Xbox模式不支持多顯示器

      教育要聞

      天津女教師懟家長!完整錄音曝光,老師很囂張,飯碗恐不保了

      親子要聞

      媽媽說女兒休學一年,我教她3個笨辦法

      軍事要聞

      美伊突然再次交火 伊朗外長:戰爭準備程度是1000%

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国色天香成人一区二区| 99久久精品无码一区二区三区 | 东乡族自治县| 日本一区二区三区小视频| 无码av最新无码av专区| 国产亚洲精品久久久久久无亚洲| 精久国产av一区二区三区孕妇| 亚洲中文字幕无码一区| 视频一区视频二区日韩专区| 国产高清在线精品一区APP| 黑人又粗又长又大| 欧美一级高清片在线观看| 日韩av无码精品人妻系列| 亚洲爆乳少妇无码激情| 成人亚洲精品一区二区三区嫩花| 日韩久久久| 都昌县| 亚洲V天堂V手机在线| 国产麻豆天美果冻无码视频| 国产精品护士在线播放| a∨无码天堂av| 日本一区二区三深夜不卡| 成人电影c.cc| 国产99久久九九精品无码| 一边摸一边抽搐一进一出视频| 无码人妻aⅴ一区二区三区有奶水| 97在线视频人妻无码| 亚洲综合网美国十次| 中国杭州少妇xxxx做受| 女女女女女裸体处开bbb| 国产成人无码专区| www国产| 夜色爽爽影院18禁妓女影院| 青草伊人网| 综合久久久久| 天堂国产一区二区三区| 国产婷婷色综合av蜜臀av| 亚洲综合网国产精品一区| 国产一区二区丝袜在线播放国产日韩欧美色综合 | 成人神马九九| 国产精品美女一区二区视频|