<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      OpenClaw太貴?QuantClaw幫你挑精度,成本砍掉21%,還能提速15%

      0
      分享至



      華為聯合新加坡國立大學和中國科學技術大學研究人員提出 QuantClaw。

      這是一款面向 OpenClaw 的即插即用動態模型精度路由插件,基于大規模低精度量化實證研究,讓模型精度成為可動態分配的資源,實現服務質量不降反升、成本下降、延遲降低的三重收益。



      項目主頁:https://sparkengineai.github.io/QuantClaw/

      GitHub 倉庫:https://github.com/SparkEngineAI/QuantClaw-plugin

      arXiv 論文:https://arxiv.org/abs/2604.22577

      OpenClaw 很強大,但成本讓人頭疼

      2026 年,OpenClaw 已經成長為最火爆的開源 AI Agent 框架之一。它不只是「聊天機器人」,而是能操控瀏覽器、執行 Shell 命令、讀寫文件、管理記憶的全功能數字助手。但真正用過 OpenClaw 的開發者和用戶都知道一個痛點:Token 消耗太猛了。

      一個看似簡單的查詢,可累積消耗超 23 萬 Token,你付的錢不只是為了那個最終答案,而是在為整個 Agent 系統的「運行開銷」買單。更糟的是,目前這些系統通常以固定精度運行。無論任務是簡單查個資料,還是寫一段復雜代碼,模型都在全力輸出,導致不同任務復雜度與計算資源之間缺乏匹配機制。該策略同時帶來不必要的計算開銷、推理延遲增加以及整體成本上升。

      破局思路:不是每個任務都需要「超算級」精度

      量化(Quantization)是業界常用的降本手段。把模型的數值精度從 32 位浮點壓縮到 4 位甚至 2 位,能顯著減少內存占用和計算量。但問題是:量化對復雜 Agent 任務的影響到底有多大?所有任務都適合壓低精度嗎?目前仍缺乏系統性的研究來回答這一問題。

      華為聯合新加坡國立大學、中國科學技術大學,對 OpenClaw 工作負載進行了系統性的量化研究,基于 ClawEval 評測集(release v0.0.0),覆蓋 24 類任務、104 個實例、6 個主流大模型(9B–744B),系統揭示了 OpenClaw 框架下 Agent 量化的核心規律:

      (1)Scaling Effect:模型越大,量化容忍度越高



      在 OpenClaw 量化評測結果上,研究團隊發現了一個清晰的模型規模和性能下降之間的關系:

      • 小模型(<30B):量化后性能下降 3-5%。
      • 中等模型(30B-70B):下降通常在 2% 以內。
      • 大模型(200B+):下降不到 2%,部分模型(如 GLM-5、MiniMax-M2.5)量化后反而有輕微性能提升(+0.9% 到 +1.4%)。

      實驗結果顯示,模型規模與量化誤差容忍度呈正相關,這可能源于更大參數量的模型擁有更高的表征冗余,從而削弱了量化噪聲的影響。

      (2)量化對 Agent 的影響,顯著依賴任務類型

      研究團隊對所有測試模型的結果取平均值并進行任務敏感度分析,根據敏感度將 OpenClaw 任務分為三類:高、中、低。



      • 高精度敏感區(推薦 16bit/8bit):涉及代碼生成、安全關鍵決策和復雜操作工作流的任務對量化高度敏感。這些領域的共同特征是需要精確的邊界判斷,模型輸出的微小擾動都可能導致性質完全錯誤的行為,例如錯誤的工具調用、策略違規或代碼邏輯錯誤。
      • 低精度友好區(推薦 4bit):知識檢索、分析類與問答類任務對量化具有較強容忍度,有的甚至還能小幅提升。這可能是因為量化充當了隱式正則化器的角色,從而促進更具泛化性的表示。

      (3)如何實現得分、速度與成本的平衡?



      真正決定是否應該對某個任務使用低精度,不能只看分數變化,必須把速度和成本一起納入考量。基于任務敏感性分析,研究團隊給出了兩種實用的優化視角:

      • 得分 vs 速度(更快):在不犧牲質量的前提下降低推理時延,優先選擇速度收益大于分數邊際變化的任務。
      • 得分 vs 成本(更便宜):在質量基本持平的情況下壓低推理成本,重點關注成本降低時仍能保持或提升質量的任務。

      QuantClaw:開箱即用的精度調度引擎

      基于以上發現,研究團隊推出了 QuantClaw,一個為 OpenClaw 設計的即插即用的任務路由量化插件。



      (1)QuantClaw 的工作邏輯非常清晰:

      • 任務識別:用戶發來請求,QuantClaw 首先判斷它屬于哪種任務類型。
      • 精度路由:根據預設的「任務-精度敏感度檔案」,自動將請求分配給 4bit、8bit 或 16bit 的模型實例。
      • 透明執行:用戶無感知,不用手動選擇精度,系統在后臺完成一切。

      (2)QuantClaw 的架構設計兼顧了實用性和靈活性:





      實測效果:省錢、提速、分數還漲了

      研究團隊在 PinchBench 上進行端到端評估。結果表明,QuantClaw 在省錢提速的同時,任務完成質量反而更高。低敏感任務用低精度高效執行,高敏感任務保留高精度確保可靠,實現整體上更好的質量、成本和時延平衡。

      (1)GLM-4.7-Flash(PinchBench v1.2.0):相比 BF16 基線,得分 +2.85,成本 -21.6%,延遲 -8.4%



      (2)GLM-5(PinchBench v2.0.0):相比 FP8 基線,得分 +2.09,成本 -21.4%,延遲 -15.7%



      展望

      QuantClaw 不止是一個插件,更提供了一種將精度納入系統調度的實現路徑:把精度當作像算力、內存一樣的動態調度資源;輕任務跑低成本配置,重任務保留高精度。

      當精度成為可動態調配的資源,Agent 系統才能真正從演示場景走向生產級應用。未來,個人 AI 助手不再是「單模型滿負荷跑」,而是多精度、多能力協同的智能系統。QuantClaw 正是這一方向的關鍵一步。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      俄加強對普京的保護措施,歐洲情報機構猜測,可能與紹伊古有關

      俄加強對普京的保護措施,歐洲情報機構猜測,可能與紹伊古有關

      阿甘天天傳
      2026-05-10 23:20:20
      《權游》紀錄將被打破?HBO新劇要播15季

      《權游》紀錄將被打破?HBO新劇要播15季

      娛圈觀察員
      2026-05-11 02:38:29
      29歲中國工程師背叛馬斯克,套現700萬,偷走核心代碼投奔死對頭

      29歲中國工程師背叛馬斯克,套現700萬,偷走核心代碼投奔死對頭

      阿器談史
      2026-05-10 04:03:40
      國務卿魯比奧被中國拒之門外,北京寧繞彎傳話也不給他開門!

      國務卿魯比奧被中國拒之門外,北京寧繞彎傳話也不給他開門!

      故事終將光明磊落
      2026-05-10 15:02:43
      認死理的商家,炸出了一個「僅退款」大省!

      認死理的商家,炸出了一個「僅退款」大省!

      家傳編輯部
      2026-05-10 20:27:14
      我要被武漢大學笑死了

      我要被武漢大學笑死了

      林中木白
      2026-05-10 20:13:05
      毛主席83歲給華國鋒的珍貴書法,練字真的有意義嗎?

      毛主席83歲給華國鋒的珍貴書法,練字真的有意義嗎?

      書畫相約
      2026-05-11 10:09:02
      吳君如很早就說過了,陳妍希私下就是這樣穿

      吳君如很早就說過了,陳妍希私下就是這樣穿

      八卦王者
      2026-05-10 13:24:46
      賽前叫囂要和國乒清算!遭橫掃后22歲張本智和蔫了:離冠軍仍遙遠

      賽前叫囂要和國乒清算!遭橫掃后22歲張本智和蔫了:離冠軍仍遙遠

      我愛英超
      2026-05-11 08:12:48
      宣示與民進黨強力競爭!鄭麗文重話警告“臺獨”,吁美棄“第一島鏈”

      宣示與民進黨強力競爭!鄭麗文重話警告“臺獨”,吁美棄“第一島鏈”

      海峽導報社
      2026-05-11 10:44:05
      中國首款定制癌癥疫苗落地!11大癌種可申請,晚期患者絕處逢生

      中國首款定制癌癥疫苗落地!11大癌種可申請,晚期患者絕處逢生

      新時代的兩性情感
      2026-05-10 09:40:15
      麻省理工發現:喚醒孩子自律最快的方法,竟是飛輪效應!

      麻省理工發現:喚醒孩子自律最快的方法,竟是飛輪效應!

      戶外阿毽
      2026-05-10 19:24:43
      馬光遠:AI泡沫一定會破滅,而且一定會以非常慘烈的方式破滅!

      馬光遠:AI泡沫一定會破滅,而且一定會以非常慘烈的方式破滅!

      混沌錄
      2026-05-10 19:32:20
      人大代表建議機關事業單位雙休制調整為“大周休3天,小周休2天”

      人大代表建議機關事業單位雙休制調整為“大周休3天,小周休2天”

      細說職場
      2026-05-10 10:34:41
      香港拿下世界杯轉播僅1天,炸出一堆牛鬼蛇神,李嘉誠恐進退兩難

      香港拿下世界杯轉播僅1天,炸出一堆牛鬼蛇神,李嘉誠恐進退兩難

      混沌錄
      2026-05-10 19:42:39
      實錘了!俄媒公布俄軍真實傷亡數字,比利時向烏克蘭提供53架F16

      實錘了!俄媒公布俄軍真實傷亡數字,比利時向烏克蘭提供53架F16

      史政先鋒
      2026-05-10 21:05:57
      摩洛哥姑娘嫁江蘇農村小伙,婚禮全程開心大笑,攝影師感慨:拍了七年婚禮沒見過這樣的

      摩洛哥姑娘嫁江蘇農村小伙,婚禮全程開心大笑,攝影師感慨:拍了七年婚禮沒見過這樣的

      可達鴨面面觀
      2026-05-10 13:46:52
      這一次,被韓媒憤怒批評的張本智和,終究是為父母的荒唐買了單

      這一次,被韓媒憤怒批評的張本智和,終究是為父母的荒唐買了單

      圓夢的小老頭
      2026-04-23 12:00:21
      是誰在偷換了世界杯轉播權之爭的邏輯?

      是誰在偷換了世界杯轉播權之爭的邏輯?

      魯先生的筆
      2026-05-10 21:12:47
      張本智和:輸球責任在我!林詩棟站球臺慶祝,陳玘直言完了不能站

      張本智和:輸球責任在我!林詩棟站球臺慶祝,陳玘直言完了不能站

      排球黃金眼
      2026-05-11 06:12:53
      2026-05-11 13:12:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12965文章數 142648關注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機會

      頭條要聞

      姑娘海底撈吃完飯遭多名男子毆打 兩顆門牙被一拳打斷

      頭條要聞

      姑娘海底撈吃完飯遭多名男子毆打 兩顆門牙被一拳打斷

      體育要聞

      那個曾讓詹姆斯抱頭的兄弟,40歲從大學畢業了

      娛樂要聞

      謝霆鋒沒想到,王菲靠張藝謀重返巔峰

      財經要聞

      "手搓汽車"曝光:偽造證件、電池以舊代新

      汽車要聞

      全球化成國內車企未來勝負手,誰是出海最強"水手"?

      態度原創

      旅游
      時尚
      藝術
      親子
      本地

      旅游要聞

      濟南“泉水游”爆火背后:解碼歷下如何擦亮“泉水長涌”金名片

      輕松拿捏又甜又酷的造型,試試這些輕熟穿搭,溫柔有女人味兒

      藝術要聞

      2026中央美術學院博士生畢業作品選

      親子要聞

      孩子心疼父母,反而是對家的傷害?

      本地新聞

      用蘇繡的方式,打開江西婺源

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲一区二区av免费| 日日摸日日碰夜夜爽无码| 精品国产三级在线观看| 中文字幕乱人伦高清视频| 久久精品国产99国产精品导航| 亚洲自拍成人在线视频| 国精品无码一区二区三区在线| 精品久久久久久无码人妻热| 国产午夜成人久久无码一区二区| 亚洲精品中文字幕乱码无线| 国产suv精品一区二区33| 亚洲日本欧美日韩中文字幕| 日韩av手机免费观看| 精品国产午夜肉伦伦影院| 国产在线国偷精品免费看| 亚洲日本不卡| 中国毛片网| 国产一级三级视频在线| 找国产毛片看| 亚洲日本va午夜中文字幕一区| 久久99国产亚洲高清观看首页| 亚洲国产精品久久久久婷婷图片| 亚洲香蕉成人av网站在线观看| 妇女性内射冈站hdwwwooo| 国产男女猛烈无遮挡免费视频| 日日操夜夜爽| 国产精品一区二区在线观看99| 国产午夜福利在线观看播放| XXXX18HD亚州护土| 成人一级黄色毛片| 亚洲人成影院在线播放高清| 日本一本正道综合久久dvd| 天天天天躁天天爱天天碰| 97人人模人人爽人人喊电影| 成年午夜精品久久精品| 国产精品久久久久人妻无码| 好看的国产精品自拍视频| 女av在线| 77777亚洲午夜久久多人| 亚洲欧美国产精品久久久| 国产久操视频|