網易首頁 > 網易號 > 正文申請入駐

Graph RAG的代際斷裂：當檢索從"一錘子買賣"變成智能體協作

2026-05-08 10:49:14　來源: 爬蟲飼養員

北京舉報

分享至

全球7000種語言，AI能翻譯的不到200種。而企業數據的"翻譯"困境同樣尖銳：你的向量數據庫可能認識"春季促銷"，卻永遠搞不懂它和"3月新會員數"之間隔著多少張表的關聯。

airCloset CTO Ryan在最近的技術博客里拋出一個尖銳觀察。他們內部搭建了17個MCP服務器，覆蓋數據庫圖譜、業務圖譜、沙箱部署三個完全不同的領域，但底層設計哲學驚人一致——他稱之為"Agentic Graph RAG"。

這個詞容易讓人誤解。微軟開源的Graph RAG項目名聲在外，但Ryan強調，同樣的詞在不同時代指代完全不同的東西。2023年的檢索假設是"一錘子買賣"：用戶提問，系統一次性撈出所有相關文本塞進提示詞。當時的Agent技術尚未成熟——OpenAI的Function Calling 2023年6月才發布，多輪工具調用既慢又貴。

向量檢索（Vector RAG）就是在這個約束下誕生的最優解：文本切塊、嵌入向量、相似度匹配。它解決了"找相似文本"的問題，卻栽在"跟關系"上。Ryan舉了個典型場景：問"上月SNS廣告如何影響新會員注冊"，向量檢索能撈出廣告文案，但跨不過三道坎——廣告屬于哪個 initiative、投放周期是哪天到哪天、同期會員數變化在哪張表。這不是相似度問題，是數據結構的遍歷問題。

Graph RAG最初就是為填這個坑而生的：提取實體（人、組織、概念）和關系，用圖結構顯式表達關聯。但Ryan的"Agentic"前綴加了關鍵限定——當Claude Code、Codex這類工具成為編排者，檢索不再是一次性動作，而是智能體循環中的可調用工具。圖譜的查詢接口被封裝成MCP服務器，Agent按需多次檢索、逐步收斂。

這個轉變的代價和收益都很實在。代價是系統復雜度：需要定義節點類型、關系模式、查詢接口。收益是精確性：當Agent可以問"先找3月投放的廣告，再拉同期會員表"，向量檢索的語義漂移問題被結構化的顯式關系替代。

Ryan沒有給出放之四海的標準答案。他的17個MCP服務器各自為政，ORM解析生成的DB Graph、手工設計Week節點的Biz Graph、面向部署的Sandbox MCP，實現路徑迥異。但共享同一套元問題：在Agent主導的工作流里，如何把領域知識編碼成可遍歷、可組合、可驗證的圖結構。

這或許是2024-2025年企業AI架構的隱性主線。當基座模型的上下文窗口膨脹到百萬token，RAG是否還有必要？Ryan的實踐給出了一個中間態答案：不是扔掉檢索，而是讓檢索從"預處理"變成"運行時工具"——由Agent決定何時查、查什么、查多深。圖譜的價值不在于一次性喂飽模型，而在于為推理過程提供可審計的結構化路徑。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.