<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      OpenClaw太貴?QuantClaw幫你挑精度,成本砍掉21%,還能提速15%

      0
      分享至



      華為聯合新加坡國立大學和中國科學技術大學研究人員提出 QuantClaw。

      這是一款面向 OpenClaw 的即插即用動態模型精度路由插件,基于大規模低精度量化實證研究,讓模型精度成為可動態分配的資源,實現服務質量不降反升、成本下降、延遲降低的三重收益。



      項目主頁:https://sparkengineai.github.io/QuantClaw/

      GitHub 倉庫:https://github.com/SparkEngineAI/QuantClaw-plugin

      arXiv 論文:https://arxiv.org/abs/2604.22577

      OpenClaw 很強大,但成本讓人頭疼

      2026 年,OpenClaw 已經成長為最火爆的開源 AI Agent 框架之一。它不只是「聊天機器人」,而是能操控瀏覽器、執行 Shell 命令、讀寫文件、管理記憶的全功能數字助手。但真正用過 OpenClaw 的開發者和用戶都知道一個痛點:Token 消耗太猛了。

      一個看似簡單的查詢,可累積消耗超 23 萬 Token,你付的錢不只是為了那個最終答案,而是在為整個 Agent 系統的「運行開銷」買單。更糟的是,目前這些系統通常以固定精度運行。無論任務是簡單查個資料,還是寫一段復雜代碼,模型都在全力輸出,導致不同任務復雜度與計算資源之間缺乏匹配機制。該策略同時帶來不必要的計算開銷、推理延遲增加以及整體成本上升。

      破局思路:不是每個任務都需要「超算級」精度

      量化(Quantization)是業界常用的降本手段。把模型的數值精度從 32 位浮點壓縮到 4 位甚至 2 位,能顯著減少內存占用和計算量。但問題是:量化對復雜 Agent 任務的影響到底有多大?所有任務都適合壓低精度嗎?目前仍缺乏系統性的研究來回答這一問題。

      華為聯合新加坡國立大學、中國科學技術大學,對 OpenClaw 工作負載進行了系統性的量化研究,基于 ClawEval 評測集(release v0.0.0),覆蓋 24 類任務、104 個實例、6 個主流大模型(9B–744B),系統揭示了 OpenClaw 框架下 Agent 量化的核心規律:

      (1)Scaling Effect:模型越大,量化容忍度越高



      在 OpenClaw 量化評測結果上,研究團隊發現了一個清晰的模型規模和性能下降之間的關系:

      • 小模型(<30B):量化后性能下降 3-5%。
      • 中等模型(30B-70B):下降通常在 2% 以內。
      • 大模型(200B+):下降不到 2%,部分模型(如 GLM-5、MiniMax-M2.5)量化后反而有輕微性能提升(+0.9% 到 +1.4%)。

      實驗結果顯示,模型規模與量化誤差容忍度呈正相關,這可能源于更大參數量的模型擁有更高的表征冗余,從而削弱了量化噪聲的影響。

      (2)量化對 Agent 的影響,顯著依賴任務類型

      研究團隊對所有測試模型的結果取平均值并進行任務敏感度分析,根據敏感度將 OpenClaw 任務分為三類:高、中、低。



      • 高精度敏感區(推薦 16bit/8bit):涉及代碼生成、安全關鍵決策和復雜操作工作流的任務對量化高度敏感。這些領域的共同特征是需要精確的邊界判斷,模型輸出的微小擾動都可能導致性質完全錯誤的行為,例如錯誤的工具調用、策略違規或代碼邏輯錯誤。
      • 低精度友好區(推薦 4bit):知識檢索、分析類與問答類任務對量化具有較強容忍度,有的甚至還能小幅提升。這可能是因為量化充當了隱式正則化器的角色,從而促進更具泛化性的表示。

      (3)如何實現得分、速度與成本的平衡?



      真正決定是否應該對某個任務使用低精度,不能只看分數變化,必須把速度和成本一起納入考量。基于任務敏感性分析,研究團隊給出了兩種實用的優化視角:

      • 得分 vs 速度(更快):在不犧牲質量的前提下降低推理時延,優先選擇速度收益大于分數邊際變化的任務。
      • 得分 vs 成本(更便宜):在質量基本持平的情況下壓低推理成本,重點關注成本降低時仍能保持或提升質量的任務。

      QuantClaw:開箱即用的精度調度引擎

      基于以上發現,研究團隊推出了 QuantClaw,一個為 OpenClaw 設計的即插即用的任務路由量化插件。



      (1)QuantClaw 的工作邏輯非常清晰:

      • 任務識別:用戶發來請求,QuantClaw 首先判斷它屬于哪種任務類型。
      • 精度路由:根據預設的「任務-精度敏感度檔案」,自動將請求分配給 4bit、8bit 或 16bit 的模型實例。
      • 透明執行:用戶無感知,不用手動選擇精度,系統在后臺完成一切。

      (2)QuantClaw 的架構設計兼顧了實用性和靈活性:





      實測效果:省錢、提速、分數還漲了

      研究團隊在 PinchBench 上進行端到端評估。結果表明,QuantClaw 在省錢提速的同時,任務完成質量反而更高。低敏感任務用低精度高效執行,高敏感任務保留高精度確保可靠,實現整體上更好的質量、成本和時延平衡。

      (1)GLM-4.7-Flash(PinchBench v1.2.0):相比 BF16 基線,得分 +2.85,成本 -21.6%,延遲 -8.4%



      (2)GLM-5(PinchBench v2.0.0):相比 FP8 基線,得分 +2.09,成本 -21.4%,延遲 -15.7%



      展望

      QuantClaw 不止是一個插件,更提供了一種將精度納入系統調度的實現路徑:把精度當作像算力、內存一樣的動態調度資源;輕任務跑低成本配置,重任務保留高精度。

      當精度成為可動態調配的資源,Agent 系統才能真正從演示場景走向生產級應用。未來,個人 AI 助手不再是「單模型滿負荷跑」,而是多精度、多能力協同的智能系統。QuantClaw 正是這一方向的關鍵一步。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      揚眉吐氣史無前例!第一次把在任美國國務卿永久攔在中國國門外

      揚眉吐氣史無前例!第一次把在任美國國務卿永久攔在中國國門外

      雪中風車
      2026-05-12 13:10:31
      丟絕平三分!里夫斯8進球伴隨8失誤狀態奇特 湖人還給2.4億頂薪?

      丟絕平三分!里夫斯8進球伴隨8失誤狀態奇特 湖人還給2.4億頂薪?

      顏小白的籃球夢
      2026-05-12 13:30:31
      京滬高鐵漲價,罵聲一片

      京滬高鐵漲價,罵聲一片

      鳳眼論
      2026-05-12 16:53:49
      伊朗官員:若再次遭襲,伊方或選擇將濃縮鈾豐度提升至90%

      伊朗官員:若再次遭襲,伊方或選擇將濃縮鈾豐度提升至90%

      界面新聞
      2026-05-12 14:55:29
      劉雨鑫打卡潮汕天價海鮮!同款瀨尿蝦對標三亞,價格真相大白

      劉雨鑫打卡潮汕天價海鮮!同款瀨尿蝦對標三亞,價格真相大白

      行者聊官
      2026-05-11 12:23:14
      黃仁勛給大家指出一條明路

      黃仁勛給大家指出一條明路

      販財局
      2026-05-12 16:36:15
      前腳剛考上公務員獲公示,他轉身就將攝像頭伸進女生裙底!這一次真的該感謝舉報者

      前腳剛考上公務員獲公示,他轉身就將攝像頭伸進女生裙底!這一次真的該感謝舉報者

      瀟拾億郎
      2026-05-12 18:03:02
      梁靖崑:幸福嘍!明星老婆特意去倫敦見證奪冠,離婚復婚后超寵妻

      梁靖崑:幸福嘍!明星老婆特意去倫敦見證奪冠,離婚復婚后超寵妻

      阿訊說天下
      2026-05-12 12:32:35
      痛心!青海17歲女生遺體已找到,凌晨復印試卷家長無視讓人意難平

      痛心!青海17歲女生遺體已找到,凌晨復印試卷家長無視讓人意難平

      社會日日鮮
      2026-05-12 08:03:00
      47歲資本大佬戴學斌,涉嫌刑事犯罪被拘!旗下藍潤系曾坐擁超千億元資產,知情人:去年就已有風聲

      47歲資本大佬戴學斌,涉嫌刑事犯罪被拘!旗下藍潤系曾坐擁超千億元資產,知情人:去年就已有風聲

      每日經濟新聞
      2026-05-12 11:24:13
      浙大鄭強教授:我不承認中國大學生就業難,是舒服的工作難找,建議少點抱怨少點索取

      浙大鄭強教授:我不承認中國大學生就業難,是舒服的工作難找,建議少點抱怨少點索取

      TOP大學來了
      2026-05-11 16:39:00
      全球進入北京時間

      全球進入北京時間

      環球時報國際
      2026-05-12 14:44:04
      賣掉格力換來的416億,被他們“敗”光了!

      賣掉格力換來的416億,被他們“敗”光了!

      犀利強哥
      2026-05-11 08:30:22
      90后新婚夫妻患同種罕見病后癱瘓,全球共患情況僅有個位數,孩子出生即夭折,專家:可能是兩人接觸了同一個感染源

      90后新婚夫妻患同種罕見病后癱瘓,全球共患情況僅有個位數,孩子出生即夭折,專家:可能是兩人接觸了同一個感染源

      魯中晨報
      2026-05-12 18:23:18
      特朗普還沒上訪華飛機,美方先發起一道制裁令,中方回應斬釘截鐵

      特朗普還沒上訪華飛機,美方先發起一道制裁令,中方回應斬釘截鐵

      知法而形
      2026-05-12 17:47:08
      武大開了一個壞頭

      武大開了一個壞頭

      燕梳樓頻道
      2026-05-12 12:31:28
      曝國際足聯高官本周到北京:兩屆世界杯打包,主動給央視大幅降價

      曝國際足聯高官本周到北京:兩屆世界杯打包,主動給央視大幅降價

      影像溫度
      2026-05-12 11:33:30
      創業板迎來第二只千元股!中際旭創一度突破1000元,近一年上漲956%

      創業板迎來第二只千元股!中際旭創一度突破1000元,近一年上漲956%

      界面新聞
      2026-05-12 11:58:06
      特斯拉宣布停產,震驚全網!

      特斯拉宣布停產,震驚全網!

      財經三分鐘pro
      2026-05-12 15:10:58
      下降6%!一季度結婚數再創新低,同比減少11萬對,離婚數也少了

      下降6%!一季度結婚數再創新低,同比減少11萬對,離婚數也少了

      網易新聞出品
      2026-05-12 15:45:59
      2026-05-12 20:11:03
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12976文章數 142648關注度
      往期回顧 全部

      科技要聞

      宇樹發布載人變形機甲,定價390萬元起

      頭條要聞

      媒體:斯塔默能否保住相位 現在已成英國政壇最大懸念

      頭條要聞

      媒體:斯塔默能否保住相位 現在已成英國政壇最大懸念

      體育要聞

      總是掉鏈子的“倒霉蛋”,闖進了歐戰決賽

      娛樂要聞

      白鹿風波升級!掉粉20萬評論區淪陷

      財經要聞

      黃仁勛真是被白宮徹底封殺了

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      時尚
      藝術
      教育
      旅游
      房產

      征集|| 她們也太會買裙子了!邊看邊種草

      藝術要聞

      這位畫家的油畫美人讓人驚嘆不已!

      教育要聞

      【預告】5月15日 | 南方教研大講堂第185場——AI賦能創意實踐 提升學生物化能力

      旅游要聞

      方松街道|來方松 來放松|解鎖微度假,邂逅好時光!FUN小松帶你游方松~

      房產要聞

      穗八條引爆樓市!萬博寶藏紅盤,五一勁銷出圈

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人妻熟女久久久久久久| 久热天堂在线视频精品伊人| 成人做爰A片免费看奶头| 国产在线欧美日韩精品一区二区| 伊人久久大香线蕉午夜| 亚洲成年轻人电影网站www | 中文字幕在线网址| 无码国产精品成人| 色噜噜狠狠综曰曰曰| 福利视频不卡| 男女啪啪进出阳道猛进| 激情综合图区| 日韩乱码人妻无码系列中文字幕| 女人让男人桶爽30分钟小视频免费| 狼友导航| 国产成人夜色91| 粉嫩蜜臀av一区二区绯色| 国产乱淫av国产8| 亚洲av网一区天堂福利| 亚洲日韩AV无码不卡一区二区三区 | 全部免费的毛片在线看| 日韩丝袜亚洲国产欧美一区| 米奇影院888奇米色99在线| 天天久久狠狠伊人第一麻豆| 国产aⅴ精品一区二区三区久久| 国产★浪潮AV无码性色| 亚洲国产午夜精品理论片妓女| 亚洲AV日韩AV永久无码网站| 99久久婷婷国产综合精品 | 无码中文字幕日韩专区| 国产亚洲一区二区三区av| 日韩av一本| 欧美一区二区精品| 彰武县| 欧美牲交A欧美在线| 中文字幕一区二区三区四区五区| 日韩亚洲中文图片小说| 亚洲日韩精品无码一区二区三区| 亚洲VA无码专区国产乱码| 亚洲色精品aⅴ一区区三区| 日韩在线欧美在线|