<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek硬核突破!DualPath破解Agent推理瓶頸,V4升級方向清晰了

      0
      分享至

      大模型的進化正迎來關鍵拐點。

      從單輪對話的聊天機器人,快速迭代為能自主規劃、調用工具、完成百輪交互的Agent智能體,而這一轉變也讓底層推理架構的核心瓶頸徹底暴露——GPU算力不再是制約性能的關鍵,KV-Cache存儲I/O帶寬成為了Agent大模型落地的最大攔路虎。


      就在DeepSeek V4發布前夕,DeepSeek-AI聯合北大、清華團隊發布了重磅研究DualPath。

      DualPath通過創新的雙路徑架構,讓Agentic大模型離線推理吞吐量最高提升1.87倍,在線服務吞吐量平均提升1.96倍,還在1152張GPU的千卡集群完成驗證,為下一代模型的升級打下了堅實的技術基礎。


      之所以會出現如此嚴重的I/O瓶頸,核心源于Agent大模型的工作特性。


      與傳統短對話不同,Agent需要在數十甚至上百輪的環境交互中累積上下文,長度可達百萬tokens,而每輪新增的有效信息僅有數百tokens,這讓KV-Cache命中率普遍超過95%。

      此時,GPU的大量時間并非用于計算,而是在等待從外部SSD存儲中讀取海量的歷史KV-Cache數據。

      再加上現代大模型推理普遍采用的Prefill-Decode(預填充-解碼)分離架構,進一步加劇了這一矛盾,即所有KV-Cache都只能從外部存儲加載到預填充節點,這導致預填充節點的存儲網卡帶寬被完全占滿,成為系統性能的絕對瓶頸,而解碼節點的存儲網卡卻長期處于閑置狀態,算力資源被嚴重浪費。


      同時,硬件發展的失衡也讓問題雪上加霜,GPU計算力的增長速度遠超網絡帶寬和顯存容量,計算與I/O的比例嚴重失調,讓這一瓶頸愈發突出。


      DualPath的核心創新,正是抓住了解碼節點帶寬閑置的關鍵痛點,重構了KV-Cache的加載架構。

      在傳統的“存儲→預填充節點”加載路徑之外,它創新性地開辟了第二條“存儲→解碼節點→預填充節點”的加載通道,通過動態分配兩條路徑的數據流,把原本單一節點的I/O壓力,轉化為全局資源池化的負載分擔,充分聚合所有節點的存儲帶寬,從根源上打破了帶寬天花板。


      在第一條預填充讀取路徑中,KV-Cache從持久化存儲讀入預填充節點的內存緩沖,再傳輸到GPU顯存完成計算,最后將完整的KV-Cache傳給解碼節點。

      而新增的解碼讀取路徑,則讓KV-Cache先讀入解碼節點的內存緩沖,在預填充階段通過高速RDMA計算網絡,以層級流式傳輸的方式傳給預填充節點參與計算,整個過程中數據加載還能與模型計算無縫重疊,進一步提升效率。

      當然,把這個看似直觀的想法,落地到亞毫秒級延遲敏感的大模型推理系統中,需要攻克兩大核心工程難題。

      第一個難題是網絡流量的干擾,額外的KV-Cache傳輸極易與模型推理中的關鍵集合通信沖突,拖慢推理速度。

      對此DualPath設計了以計算網卡為中心的流量管理機制,讓所有進出GPU的流量都強制通過計算網卡,再利用底層網絡的QoS控制能力,將模型推理通信分配到占99%帶寬的高優先級通道,KV-Cache傳輸則分配到低優先級通道,僅在計算網絡的空閑間隙傳輸,實現了兩者的完美隔離,既保證了推理延遲,又充分利用了閑置帶寬。

      第二個難題是動態負載均衡,面對復雜多變的請求,系統需要實時決定每條請求的讀取路徑,同時兼顧網卡隊列長度和GPU負載。


      DualPath為此打造了自適應請求調度器,將Token數量作為核心負載指標,把節點劃分為過載、低讀取隊列、高讀取隊列三類,優先將任務分配給未過載且讀取隊列較短的節點。

      同時在節點內部,還會基于時間預估機制,將執行時間相近的請求打包成批,最大程度減少GPU同步時的計算氣泡,讓硬件利用率達到最優。


      實測數據足以印證DualPath的強悍性能。

      研究團隊在NVIDIA Hopper GPU集群上,基于DeepSeek-V3.2 660B、DS 27B、Qwen2.5-32B三大模型,結合真實的Agent強化學習軌跡數據集完成了全面測試。

      在離線批量推理場景(如RL訓練的Rollout階段),DualPath對基線系統實現了碾壓式超越,處理DeepSeek 660B模型時吞吐量最高提升1.87倍,且無論每輪追加Token長度、生成長度如何變化,都能保持穩定的性能提升,證明其徹底消除了存儲網絡瓶頸。


      在在線服務場景中,在首字延遲≤4秒的嚴格SLO約束下,DualPath能支撐的請求到達率相比基線最高提升2.25倍,還能保持極低的端到端生成延遲。


      而消融實驗也證實,雙路徑加載機制和自適應調度算法,是推動性能大幅提升的核心關鍵。

      更值得一提的是,DualPath還具備極強的大規模擴展性,在1152張GPU的千卡集群中,系統實現了近乎線性的性能擴展,調度器CPU占用還不到10個核心,完全滿足生產級的部署需求。


      從DualPath的技術突破中,我們也能清晰看到DeepSeek V4的核心升級方向。

      首先,模型與推理系統的協同優化將進一步深化,V4大概率會內置對雙路徑加載的原生支持,讓模型層的KV-Cache結構優化與系統層的路徑調度深度融合,實現更高的帶寬利用率。

      其次,自適應資源配置能力會成為重點,針對不同的工作負載,系統能在線動態調整預填充/解碼節點的比例,讓資源分配更貼合實際需求,避免固定配置的效率浪費。

      同時,KV-Cache的智能拆分加載也有望落地,將單個請求的KV-Cache拆分到兩條路徑并行加載,進一步挖掘I/O性能潛力。

      此外,結合DeepSeek已有的稀疏注意力技術,V4還可能將模型結構優化與DualPath的系統優化結合,在降低計算量的同時減少KV-Cache數據量,形成“模型+系統”的雙輪驅動。

      此次DualPath的發布,不僅為Agentic大模型的推理性能突破提供了全新的解決方案,更讓行業看到了大模型發展的新趨勢。

      當模型規模接近物理極限時,底層架構的創新與模型算法的深度協同,將成為突破性能天花板的核心關鍵。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      糖尿病一口番茄不能嘗?再次強調:不想得糖尿病腎病,遠離這6物

      糖尿病一口番茄不能嘗?再次強調:不想得糖尿病腎病,遠離這6物

      健康之光
      2026-05-11 16:35:09
      我60歲了絕經已經6年,被閨蜜拉著跟67歲退休醫生去云南玩8天

      我60歲了絕經已經6年,被閨蜜拉著跟67歲退休醫生去云南玩8天

      小虎新車推薦員
      2026-05-08 19:40:44
      青海17歲女學生溺亡!主動去的橋邊,知情人曝猛料,恐不止是意外

      青海17歲女學生溺亡!主動去的橋邊,知情人曝猛料,恐不止是意外

      北緯的咖啡豆
      2026-05-12 11:29:42
      女子線上買榴蓮破防,5房果開出3房幾乎沒肉的“榴蓮糖”,聯系客服后退款50%

      女子線上買榴蓮破防,5房果開出3房幾乎沒肉的“榴蓮糖”,聯系客服后退款50%

      大象新聞
      2026-05-12 22:46:09
      申花簽下馬萊加三年長約,鋒線補強球迷期待新賽季

      申花簽下馬萊加三年長約,鋒線補強球迷期待新賽季

      漫川舟船
      2026-05-13 00:16:35
      入住兩年,發現打再多柜子,都不如一個800庫好用,讓雜物全消失

      入住兩年,發現打再多柜子,都不如一個800庫好用,讓雜物全消失

      室內設計師有料兒
      2026-05-11 09:30:15
      特朗普上飛機前坦白,對華稱呼已變,美參議員:不能再向中國讓步

      特朗普上飛機前坦白,對華稱呼已變,美參議員:不能再向中國讓步

      觸摸史跡
      2026-05-13 01:59:17
      褲子上這兩根繩,一定還有它存在的道理!

      褲子上這兩根繩,一定還有它存在的道理!

      新住家居
      2026-05-12 06:06:10
      蚌埠演唱會驚天騙局?成龍20 分鐘撈金離場?觀眾花千元看場笑話

      蚌埠演唱會驚天騙局?成龍20 分鐘撈金離場?觀眾花千元看場笑話

      做一個合格的吃瓜群眾
      2026-05-12 15:10:23
      張本智和回到日本 當眾懺悔:本該贏下梁靖崑 心理和技術都有問題

      張本智和回到日本 當眾懺悔:本該贏下梁靖崑 心理和技術都有問題

      風過鄉
      2026-05-12 20:36:06
      南京一學區房小區24小時狂增250套!一學區房5天大降70萬元!

      南京一學區房小區24小時狂增250套!一學區房5天大降70萬元!

      科學發掘
      2026-05-13 00:01:50
      季后賽被橫掃后就退役!湖人離隊第一人!三年“躺賺”3300萬美元

      季后賽被橫掃后就退役!湖人離隊第一人!三年“躺賺”3300萬美元

      鳴哥說體育
      2026-05-12 18:44:49
      女子因18元奶茶被親姐拉黑,崩潰大哭:離婚帶娃5年,都看不起我

      女子因18元奶茶被親姐拉黑,崩潰大哭:離婚帶娃5年,都看不起我

      辣媒專欄記錄
      2026-05-11 08:21:59
      卡塞米羅驚人評價:貝爾比C羅更全面,梅西是防守者的噩夢

      卡塞米羅驚人評價:貝爾比C羅更全面,梅西是防守者的噩夢

      星耀國際足壇
      2026-05-13 00:14:08
      太神奇了!場場三分命中率五成以上,苦熬七年,終于能拿億元合同

      太神奇了!場場三分命中率五成以上,苦熬七年,終于能拿億元合同

      球毛鬼胎
      2026-05-12 21:38:02
      寶媽就兒子割包皮跟寶爸吵了八百回,網友說:割了能更持久?

      寶媽就兒子割包皮跟寶爸吵了八百回,網友說:割了能更持久?

      燈錦年
      2026-05-10 19:22:52
      以軍被炸上天,給全世界教訓:大意輕敵,再精銳也能輸得一塌糊涂

      以軍被炸上天,給全世界教訓:大意輕敵,再精銳也能輸得一塌糊涂

      愛吃醋的貓咪
      2026-05-10 22:06:14
      2026最火的6部韓劇,每部都太適合熬夜追了

      2026最火的6部韓劇,每部都太適合熬夜追了

      小Q侃電影
      2026-05-12 22:20:48
      專家:女性生育力“余額”無聲流失,35歲后呈斷崖式下降

      專家:女性生育力“余額”無聲流失,35歲后呈斷崖式下降

      南方都市報
      2026-05-12 08:48:40
      水谷隼徹底揭穿張本宇一家在日本受尊重的謊言!

      水谷隼徹底揭穿張本宇一家在日本受尊重的謊言!

      生活新鮮市
      2026-05-13 02:38:57
      2026-05-13 04:48:49
      AI先鋒官 incentive-icons
      AI先鋒官
      AIGC大模型及應用精選與評測
      506文章數 74關注度
      往期回顧 全部

      科技要聞

      宇樹發布載人變形機甲,定價390萬元起

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

      體育要聞

      騎士終于玩明白了?

      娛樂要聞

      白鹿風波升級!掉粉20萬評論區淪陷

      財經要聞

      利潤再腰斬 京東干外賣后就沒過過好日子

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      藝術
      數碼
      手機
      本地
      公開課

      藝術要聞

      震驚!他竟用鏡頭看透了所有女人的秘密!

      數碼要聞

      看電視的人越來越多了 3億臺電視在線 小米第一

      手機要聞

      10年支持不變:谷歌力保現有Chromebook

      本地新聞

      用蘇繡的方式,打開江西婺源

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 99热国产在线手机精品| 美女自卫慰黄网站i| 最大成人精品一区| 亚洲日韩乱码中文字幕| 超薄肉色丝袜一区二区| 国产精品中文字幕视频| 天美麻花果冻视频大全英文版| 国产亚洲真人做受在线观看 | 四虎WWW永久在线精品| 麻豆国产精品视频| 深夜在线观看免费av| 边做边爱完整版| 精品视频国产香人视频| 六间房隐藏房间入口网站| 精品欧洲av无码一区二区14| 性做久久久久久久免费看| 午夜国产小视频| 欧美成人片一区二区三区| 欧美性受xxxx黑人猛交| 亚洲av无码牛牛影视在线二区| 乱人伦视频69| 男女性爽大片视频免费看| 久久精品国产亚洲AV高清特级| 中文字幕丝袜精品久久| 亚州av综合色区无码一区| 99久久久无码国产精品秋霞网| 国产综合自拍| www.大熟女| 91资源| 人妻夜夜爽天天爽爽一区| 不卡一区二区三区在线视频 | av一区二区三区精品| 国产中文成人精品久久久| 自拍偷拍亚洲| 欧美槡bbbb槡bbb少妇| 韩国免费A级毛片久久| 国产白浆喷水在线视频| 蜜臀91精品国产高清在线| 国产精品一区在线麻豆| 精品无码久久久久国产| 亚洲人人色|