網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

三分天下：為什么Agent Memory框架是死路

2026-04-19 21:41:15　來源: 老馮云數(shù)

北京舉報(bào)

分享至

幾個(gè)月前，老馮寫過一篇。那篇文章里我做了個(gè)判斷：Agent 基礎(chǔ)設(shè)施的下一場(chǎng)熱鬧會(huì)發(fā)生在“記憶”這個(gè)方向，圍繞著“Agent 該怎么記住東西”會(huì)冒出一大批創(chuàng)業(yè)公司和開源項(xiàng)目，資本會(huì)涌進(jìn)來，架構(gòu)圖會(huì)畫得越來越花。

果不其然，Mem0 又融了一輪，MemGPT 改名 Letta 繼續(xù)融，Zep、Cognee、Hindsight、MemoryScope、Memobase、SuperMemory、Graphiti、LangMem、EverMemOS——一抓一大把。

每家的技術(shù)博客上都掛著差不多的架構(gòu)圖：底下一個(gè) episodic 層，中間一個(gè) semantic 層，頂上一個(gè) reflection 或 procedural 層，層與層之間箭頭來回穿梭，寫著 consolidation、retrieval、forgetting。GitHub star 在漲，arXiv 論文在刷榜，技術(shù)大會(huì)每場(chǎng)都有一個(gè) Agent Memory 的 track。熱鬧是真的熱鬧。

但這次我想潑個(gè)冷水： 這條賽道火歸火，但也許兩年后就不存在了 。

這不是論證，而是直覺。但這句話得先說清楚，我不是說 Agent 不需要記憶——恰恰相反，記憶是整場(chǎng) Agent 革命里最重的籌碼，是終局壁壘所在。我說的是： Agent 需要記憶，但不需要今天這種被稱作“Memory 框架”的東西 。

這兩句話聽起來像同一件事，其實(shí)差兩個(gè)字，差一條賽道的生死。

下面講講為什么 —— 當(dāng)然，這只是老馮的個(gè)人觀點(diǎn)。

一、終局是三分天下

要看清今天的賽道，得先把終局畫出來。

這里先交代一句：下面說的“終局”指的是 嚴(yán)肅的企業(yè)級(jí) Agent，以及任何把數(shù)據(jù)當(dāng)成核心資產(chǎn)的組織與個(gè)人 。消費(fèi)端也許另一幅圖景——普通用戶用一個(gè) ChatGPT、一個(gè) Gemini，廠商順手把記憶也做了。

老馮對(duì) AI Agent 的終局判斷很簡(jiǎn)單 —— 三分天下 。一個(gè)成熟的 Agent，在終局狀態(tài)下，大體就是這樣一副架子：

DB_URL=postgres://user:pass@host:5432/memory

一個(gè) URL 提供智力，一個(gè) URL 提供記憶，中間由 Harness 負(fù)責(zé)把模型套起來、駕馭它去完成具體任務(wù)——加載 Skills、組織 context、調(diào)用工具、處理循環(huán)。想換模型廠商？換 MODEL_URL。想把數(shù)據(jù)遷到別家？換 DB_URL。想本地自建？?jī)蓚€(gè)都換成 localhost。三層徹底解耦：智力層由模型廠商提供，記憶層由數(shù)據(jù)庫(kù)廠商提供， 駕馭執(zhí)行的那一層由 Harness 承擔(dān) ——Claude Code、Cursor、Devin 這些今天還在爆發(fā)式演化的產(chǎn)品，本質(zhì)上都是 Harness。

這套格局不是架構(gòu)師一廂情愿的設(shè)計(jì)品味，它背后有一套很樸素的動(dòng)力學(xué)。

終局里真正的壁壘，不在算力，也不在模型。算力短期關(guān)鍵長(zhǎng)期攤平，和“永恒的電力壟斷不存在”是一回事。模型中期關(guān)鍵長(zhǎng)期平權(quán)，開源模型一年一個(gè)臺(tái)階往上追，GPT-5 和 DeepSeek V4 的差距比 GPT-4 時(shí)代已經(jīng)小了一大截。再過兩年，Agent 能用的模型大概率是個(gè)豐儉由人的菜市場(chǎng)。真正拿得住的壁壘只有一樣—— 私有數(shù)據(jù) 。

而嚴(yán)肅的企業(yè)用戶不會(huì)允許自己的核心數(shù)據(jù)被“一鍋端”，也不會(huì)允許它和別家的數(shù)據(jù)無序混在同一個(gè)服務(wù)商的黑箱里。一旦被鎖住，這家服務(wù)商對(duì)你就有永恒的議價(jià)權(quán)——過去三十年從數(shù)據(jù)庫(kù)到云的采購(gòu)史，都是這條邏輯寫的。于是博弈的終點(diǎn)就是上面那副架子—— 模型廠商管智能，Harness 管駕馭執(zhí)行，數(shù)據(jù)庫(kù)廠商管記憶 ，三方互不吞并、互相制衡。

三分天下的圖畫完了—— 模型、Harness、數(shù)據(jù)庫(kù)，各自獨(dú)立，各自為王 。

現(xiàn)在可以回頭問那個(gè)關(guān)鍵問題：今天市面上這些 Memory 框架，坐在哪一塊上？

二、Memory 框架是什么？

先對(duì) Memory 框架做一次顆粒度區(qū)分，免得一竿子打翻一船人。

今天被塞進(jìn)“Memory 框架”這個(gè)筐里的項(xiàng)目，其實(shí)不是同一種東西，大致可以分成四類，每一類的命運(yùn)不一樣。

第一類，數(shù)據(jù)庫(kù)套殼 SDK 。代表是早期的 Mem0、LangMem、MemoryScope、SuperMemory 這一批。它們的核心能力就是在一個(gè)數(shù)據(jù)庫(kù)（通常是 PG+pgvector 或 SQLite）上封裝一套“extract / store / retrieve / update”的 API，把 episodic 和 semantic 分兩張表，加幾條重要性打分和時(shí)間衰減規(guī)則。這一類離“數(shù)據(jù)庫(kù)薄薄一層皮”這個(gè)描述最貼切， 技術(shù)上沒有壁壘，產(chǎn)品上有一點(diǎn)用戶心智 。

第二類，知識(shí)圖譜 / 時(shí)序圖譜構(gòu)建器 。代表是 Graphiti、Cognee、Hindsight。它們做的事比第一類要重一些——bi-temporal knowledge graph、增量實(shí)體消歧、沖突檢測(cè)與失效、hybrid 檢索（語義 + 關(guān)鍵詞 + 圖遍歷）。這類項(xiàng)目的策略層確實(shí)有工程含量，不是“幾條 SQL”能一筆帶過的。但它們的命運(yùn)是—— 策略層會(huì)被模型吸收（模型自己會(huì)做實(shí)體消歧、沖突判斷），存儲(chǔ)層會(huì)歸回?cái)?shù)據(jù)庫(kù)（圖能力通過 PG 擴(kuò)展或?qū)Ｓ脠D數(shù)據(jù)庫(kù)承載），獨(dú)立賽道依然不成立。

第三類，Agent Runtime / Agent OS 。代表是 Letta/MemGPT。它們做的根本不是 Memory 框架該做的事——把 context window 當(dāng) RAM、把外部存儲(chǔ)當(dāng) Disk、讓模型自己通過 tool call 在兩者之間 swap——這是操作系統(tǒng)意義上的虛擬內(nèi)存管理。它門檻不低，但它的準(zhǔn)確名字是 Agent Runtime ，是 Harness 下位的執(zhí)行引擎層。其實(shí)，它應(yīng)該歸到 Runtime / Harness 賽道，不是 Memory 賽道。

第一類會(huì)被 Skill + 模型自己寫 SQL 直接替代；第二類的策略層會(huì)被模型吸收，存儲(chǔ)層會(huì)歸回?cái)?shù)據(jù)庫(kù)；

三、它沒有壁壘

回到第一類（數(shù)據(jù)庫(kù)套殼 SDK）——這一類占了市面上的大多數(shù)，也是這篇文章主要的打擊對(duì)象。

把它們拆到最細(xì)，干的事情就兩件： 替 Agent 設(shè)計(jì)幾張表的 schema，替 Agent 封裝幾條 SQL 。

所謂 episodic 和 semantic 分表，是 schema 設(shè)計(jì)。所謂重要性打分、時(shí)間衰減、反思?jí)嚎s，是寫入時(shí)跑的幾段規(guī)則。所謂向量召回加 BM25 加 cross-encoder 重排加 RRF 融合，是查詢組合。所有 PR 稿的術(shù)語、所有類腦箭頭圖剝掉，底下就是 建表和 SQL 。

建表和 SQL 有壁壘嗎？這是程序員第一周就會(huì)的東西。那框架憑什么值錢？憑它們“替 Agent 想好了該怎么建表、怎么寫查詢”。

那“替 Agent 想好”這件事，值多少？

老馮前陣子琢磨過這個(gè)——用 PG 加幾個(gè)擴(kuò)展加一組存儲(chǔ)過程，把 Mem0 干的事從頭糊一遍，幾天夠了。最后沒做。為什么沒做？ 沒意思，沒壁壘 。任何一個(gè)懂點(diǎn) PG 的工程師，周末抽一下午就能寫出個(gè)基礎(chǔ)版 Mem0，功能上九成相似。剩下那一成是 UI、是 SaaS 控制臺(tái)、是發(fā)布節(jié)奏、是開發(fā)者關(guān)系——那是運(yùn)營(yíng)和產(chǎn)品的壁壘，不是技術(shù)壁壘。

那“教會(huì) Agent 怎么用這套東西”又要多少？ 一個(gè) Skill，一張 markdown 。

幾百個(gè) token 的一段指令，告訴模型“你有一個(gè) PostgreSQL 數(shù)據(jù)庫(kù)連接在 DATABASE_URL，用戶說話時(shí)你自己判斷哪些事實(shí)值得存，每次回答前做向量加全文的混合檢索，發(fā)現(xiàn)新舊沖突就 UPDATE 舊的”——就這樣。Mem0 那套 ADD / UPDATE / DELETE / NOOP 流水線、Cognee 的圖譜構(gòu)建、Graphiti 的時(shí)序圖——這些“認(rèn)知架構(gòu)”能做的事，現(xiàn)在的模型自己寫 SQL 就能做到，而且寫得比你干凈。

Claude 的 Skills 機(jī)制已經(jīng)把這條路走通一半。用戶寫個(gè) memory-skill.md，描述清楚“記憶怎么存、怎么查”，Claude 在需要時(shí)自動(dòng)調(diào)用，不需要任何外部 Memory 框架。哪天 Anthropic 或 OpenAI 把一個(gè)官方 memory skill 作為最佳實(shí)踐發(fā)出來，這一整批項(xiàng)目從模型側(cè)就被架空了。

你以為的護(hù)城河，其實(shí)是一張寫著幾百字的 markdown 。生產(chǎn)環(huán)境里這張 markdown 背后自然會(huì)接上受控工具和固化的數(shù)據(jù)庫(kù) pipeline——但那些位置該歸 Harness 的歸 Harness，該歸數(shù)據(jù)庫(kù)的歸數(shù)據(jù)庫(kù)，依然沒有獨(dú)立 Memory 框架的位置。

四、苦澀的教訓(xùn)

上一節(jié)是從產(chǎn)業(yè)結(jié)構(gòu)上說 Memory 框架沒位置。再往深一層，從方法論上也有一把刀—— The Bitter Lesson 。

Sutton 2019 年那篇一千多字的博客，講的事很簡(jiǎn)單：過去七十年，AI 領(lǐng)域反復(fù)上演同一個(gè)劇本——研究者把自己對(duì)某個(gè)領(lǐng)域的精心理解編碼進(jìn)系統(tǒng)，短期看效果不錯(cuò)，長(zhǎng)期必輸給“讓模型自己學(xué)”的通用方法。國(guó)際象棋的評(píng)估函數(shù)輸給搜索，圍棋的棋譜先驗(yàn)輸給自我對(duì)弈，語音識(shí)別的音素建模輸給統(tǒng)計(jì)方法，CV 的 SIFT 輸給深度學(xué)習(xí)。每一次，靠“領(lǐng)域理解”的路線都輸了，贏的是看起來“沒有智慧”、只是能吃算力和數(shù)據(jù)的方法。

這把刀落到 Memory 框架上要小心——它不打所有系統(tǒng)抽象。操作系統(tǒng)、數(shù)據(jù)庫(kù)、編譯器都是人類設(shè)計(jì)的抽象，它們沒有被端到端學(xué)習(xí)吃掉，也不會(huì)被吃掉，因?yàn)樗鼈兲峁┑氖强煽康牡讓臃e木，不是替 AI 做決策。Sutton 打的是后者。

Memory 框架的問題在于它 站在后者那一邊 。它硬編碼的那些東西——什么信息值得記、記在哪一層、什么時(shí)候觸發(fā)反思、怎么組合向量和全文——每一項(xiàng)都是“替 Agent 做認(rèn)知決策”的意見，而不是通用積木（向量存儲(chǔ)、全文檢索、事務(wù)、索引這些真正的積木，早就被數(shù)據(jù)庫(kù)提供了）。今天 Agent 需要這些意見，只是因?yàn)槟Ｐ瓦€不夠強(qiáng)；等模型強(qiáng)到能自己判斷——這件事已經(jīng)在發(fā)生——這些手工認(rèn)知策略會(huì)像 SIFT 遇見 AlexNet 那樣，一夜之間變成廢鐵。

產(chǎn)業(yè)結(jié)構(gòu)上它沒位置，方法論上它也撐不住。兩條線在這里合攏。

五、真正的壁壘

那什么有壁壘？

三分天下那張圖里，嚴(yán)格來說只有兩個(gè)位置上的壁壘是確定的，另一塊的壁壘還在成形。

模型那塊 會(huì)打血戰(zhàn)。閉源和開源拉鋸、價(jià)格一年一腰斬、廠商排名每半年洗一次牌。這塊有壁壘，但壁壘屬于少數(shù)幾家頭部模型廠商，且局勢(shì)仍在劇烈變動(dòng)。

Harness 那塊 還沒定型。Claude Code / Codex 現(xiàn)在跑在最前面，但其他的也開始露頭：OpenClaw，Hermes；Letta/MemGPT 那支 Agent Runtime 方向如果真能做成也挺有意思。Harness 這塊今天剛長(zhǎng)出些壁壘，又被 Claude Code 開源給掀翻拉平到一個(gè)水平線。

剩下那塊—— 數(shù)據(jù)庫(kù) ——是全局里 確定性最高 的位置。

確定性來自一個(gè)結(jié)構(gòu)性事實(shí)： 數(shù)據(jù)庫(kù)不在 AI 沖擊的范圍內(nèi) 。

什么東西會(huì)被 AI 沖擊？?jī)r(jià)值來自“信息加工”的東西——文案、設(shè)計(jì)、初級(jí)編程、法律文書、客服、PPT。它們的本質(zhì)是把信息 A 映射到信息 B，而 LLM 做的就是這件事。LLM 有多強(qiáng)，它們被壓縮得有多狠。

那什么不在這個(gè)前線上？ 物理世界的持久化層 。數(shù)據(jù)庫(kù)干的事情是在真實(shí)的磁盤上、通過真實(shí)的操作系統(tǒng)和文件系統(tǒng)、對(duì)抗真實(shí)的斷電和崩潰、在多節(jié)點(diǎn)間用真實(shí)的網(wǎng)絡(luò)達(dá)成共識(shí)，讓字節(jié)在二十年后還能被準(zhǔn)確讀回來。這件事的本質(zhì)不是信息加工，是 物理世界的可靠性保證 。LLM 再聰明變不出一塊磁盤，保證不了 fsync 的語義，也不會(huì)代替兩階段提交。

Agent 越強(qiáng)大，它越需要一個(gè)可靠的物理世界錨點(diǎn)。Agent 革命不會(huì)削弱數(shù)據(jù)庫(kù)的價(jià)值， 只會(huì)放大它 。

所以三分天下的終局里，模型那塊會(huì)打到流血，Harness 那塊還在摸索， 只有數(shù)據(jù)庫(kù)這塊地基，三十年前就定了，三十年后還會(huì)在 。

六、數(shù)據(jù)庫(kù)的盡頭是 PG

那具體到記憶層，會(huì)是哪個(gè)數(shù)據(jù)庫(kù)？

這里要分階段看。

現(xiàn)階段 ——對(duì)一個(gè)跑在本地的個(gè)人 Agent、或者單機(jī)場(chǎng)景下的輕量 Agent 來說， SQLite 甚至文件系統(tǒng)也完全夠用 。SQLite 零運(yùn)維、文件形態(tài)、本地跑、原生支持 JSON 和向量擴(kuò)展，單體 Agent 的記憶需求它完全扛得住。相當(dāng)多的 Agent 應(yīng)用在本地持久化上就是直接用 SQLite。這個(gè)階段講“記憶層需要 PG”是過度工程。

但往前演化一步——一旦 Agent 需要跨 Agent 協(xié)作、跨設(shè)備持久化、跨組織可遷移、面對(duì)多租戶和并發(fā)——也就是需要“通用可遷移的記憶層”——局勢(shì)就會(huì)收斂。收斂到哪？

PostgreSQL 。

原因有三層。

第一層，事實(shí)已經(jīng)在發(fā)生 。相當(dāng)一部分認(rèn)真做 Agent 基礎(chǔ)設(shè)施的嚴(yán)肅項(xiàng)目都在向 PG 或 PG 兼容后端靠攏——Letta 官方支持 PG + pgvector，Hindsight 明確只支持 PG + pgvector，Tiger Data 直接把產(chǎn)品線命名為 Agentic Postgres。這不是 PG 生態(tài)自我證明（Supabase、Neon 這種本來就是 PG 家族的不算），是 原本站在其他路線上的項(xiàng)目在往 PG 收斂 。

第二層，線纜協(xié)議（Wire Protocol）是事實(shí)標(biāo)準(zhǔn) 。PG 協(xié)議之于通用記憶層，就像 HTTP 之于應(yīng)用層——夠老、夠穩(wěn)、夠通用、夠開放，沒有哪家廠商能擁有它，也沒有哪家廠商能替換它。模型在訓(xùn)練語料里見過幾百萬次 SQL 和 psql，它天然會(huì)說這門語言，不需要額外訓(xùn)練。私有協(xié)議的數(shù)據(jù)庫(kù)在 AI 時(shí)代已經(jīng)輸了一半，因?yàn)槟Ｐ筒皇焖?/p>

第三層，擴(kuò)展生態(tài)已經(jīng)把記憶層需要的所有檢索原語覆蓋了 。向量有 pgvector，全文有 tsvector 加 GIN，圖有 AGE 以及新一代基于 PG 的圖擴(kuò)展，時(shí)序有 TimescaleDB，地理有 PostGIS，水平擴(kuò)展有 Citus。這些都是擴(kuò)展插進(jìn)來的，不是重寫整個(gè)系統(tǒng)——因?yàn)?PG 三十年前就做了個(gè)關(guān)鍵決定：不替上層預(yù)設(shè)語義。這是 PG 真正牛逼的地方，三十年后任何新工作負(fù)載都能插進(jìn)來。

所以這條演化路徑是清楚的—— 在“通用可遷移的記憶層”這件事上，除了 PG 協(xié)議沒別的選 。圖數(shù)據(jù)庫(kù)、對(duì)象存儲(chǔ)、端側(cè) SQLite、專用搜索系統(tǒng)——它們會(huì)在各自的專用場(chǎng)景里繼續(xù)存在，這不沖突。但在“通用 Agent 記憶”這個(gè)場(chǎng)景里，PG 就是那個(gè)終局。

SQLite 和 PG 在架構(gòu)紀(jì)律上是一族人——都是通用持久化層、都不預(yù)設(shè)上層語義、都有幾十年的可靠性積累、都不在 AI 沖擊的前線上、都有靈活的擴(kuò)展極致。SQLite 是端側(cè)和本地場(chǎng)景的 PG，PG 是服務(wù)端和協(xié)作場(chǎng)景的 SQLite。它們是同一條路上的兩個(gè) size。

真正被三分天下分食掉的，是那種“介于數(shù)據(jù)庫(kù)和應(yīng)用之間的中間件”——也就是今天的 Memory 框架。

回到三分天下這張圖。模型層在流動(dòng)，Harness 層在成形，記憶層在沉淀。三塊地盤各自為王，沒有哪一塊是今天“Memory 框架”的位置。它們不是某一方的對(duì)手——它們是過渡態(tài)下代管了三方工作的中間商，而真空一旦被填滿，中間商就無處可去。

十年后再回望 2026 年這場(chǎng) Memory 框架喧嘩，會(huì)看到一件很平淡的事——那些號(hào)稱“給 Agent 設(shè)計(jì)認(rèn)知”的框架，最后真正留下來的代碼，是它們最樸素的那一部分： 把數(shù)據(jù)老老實(shí)實(shí)塞進(jìn) PostgreSQL 的那幾行 SQL 。

其他的，都會(huì)被端到端學(xué)習(xí)吃掉。

數(shù)據(jù)庫(kù)老司機(jī)

點(diǎn)一個(gè)關(guān)注 ??，精彩不迷路

對(duì) PostgreSQL， Pigsty，下云，AI 感興趣的朋友

歡迎加入 PGSQL x Pigsty 交流群 QQ 619377403

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.