全球7000種語言,AI能翻譯的不到200種。而企業數據的"翻譯"困境同樣尖銳:你的向量數據庫可能認識"春季促銷",卻永遠搞不懂它和"3月新會員數"之間隔著多少張表的關聯。
airCloset CTO Ryan在最近的技術博客里拋出一個尖銳觀察。他們內部搭建了17個MCP服務器,覆蓋數據庫圖譜、業務圖譜、沙箱部署三個完全不同的領域,但底層設計哲學驚人一致——他稱之為"Agentic Graph RAG"。
![]()
這個詞容易讓人誤解。微軟開源的Graph RAG項目名聲在外,但Ryan強調,同樣的詞在不同時代指代完全不同的東西。2023年的檢索假設是"一錘子買賣":用戶提問,系統一次性撈出所有相關文本塞進提示詞。當時的Agent技術尚未成熟——OpenAI的Function Calling 2023年6月才發布,多輪工具調用既慢又貴。
向量檢索(Vector RAG)就是在這個約束下誕生的最優解:文本切塊、嵌入向量、相似度匹配。它解決了"找相似文本"的問題,卻栽在"跟關系"上。Ryan舉了個典型場景:問"上月SNS廣告如何影響新會員注冊",向量檢索能撈出廣告文案,但跨不過三道坎——廣告屬于哪個 initiative、投放周期是哪天到哪天、同期會員數變化在哪張表。這不是相似度問題,是數據結構的遍歷問題。
Graph RAG最初就是為填這個坑而生的:提取實體(人、組織、概念)和關系,用圖結構顯式表達關聯。但Ryan的"Agentic"前綴加了關鍵限定——當Claude Code、Codex這類工具成為編排者,檢索不再是一次性動作,而是智能體循環中的可調用工具。圖譜的查詢接口被封裝成MCP服務器,Agent按需多次檢索、逐步收斂。
這個轉變的代價和收益都很實在。代價是系統復雜度:需要定義節點類型、關系模式、查詢接口。收益是精確性:當Agent可以問"先找3月投放的廣告,再拉同期會員表",向量檢索的語義漂移問題被結構化的顯式關系替代。
Ryan沒有給出放之四海的標準答案。他的17個MCP服務器各自為政,ORM解析生成的DB Graph、手工設計Week節點的Biz Graph、面向部署的Sandbox MCP,實現路徑迥異。但共享同一套元問題:在Agent主導的工作流里,如何把領域知識編碼成可遍歷、可組合、可驗證的圖結構。
這或許是2024-2025年企業AI架構的隱性主線。當基座模型的上下文窗口膨脹到百萬token,RAG是否還有必要?Ryan的實踐給出了一個中間態答案:不是扔掉檢索,而是讓檢索從"預處理"變成"運行時工具"——由Agent決定何時查、查什么、查多深。圖譜的價值不在于一次性喂飽模型,而在于為推理過程提供可審計的結構化路徑。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.