幾個(gè)月前,老馮寫過一篇 。那篇文章里我做了個(gè)判斷:Agent 基礎(chǔ)設(shè)施的下一場(chǎng)熱鬧會(huì)發(fā)生在“記憶”這個(gè)方向,圍繞著“Agent 該怎么記住東西”會(huì)冒出一大批創(chuàng)業(yè)公司和開源項(xiàng)目,資本會(huì)涌進(jìn)來,架構(gòu)圖會(huì)畫得越來越花。
果不其然,Mem0 又融了一輪,MemGPT 改名 Letta 繼續(xù)融,Zep、Cognee、Hindsight、MemoryScope、Memobase、SuperMemory、Graphiti、LangMem、EverMemOS——一抓一大把。
每家的技術(shù)博客上都掛著差不多的架構(gòu)圖:底下一個(gè) episodic 層,中間一個(gè) semantic 層,頂上一個(gè) reflection 或 procedural 層,層與層之間箭頭來回穿梭,寫著 consolidation、retrieval、forgetting。GitHub star 在漲,arXiv 論文在刷榜,技術(shù)大會(huì)每場(chǎng)都有一個(gè) Agent Memory 的 track。熱鬧是真的熱鬧。
但這次我想潑個(gè)冷水: 這條賽道火歸火,但也許兩年后就不存在了 。
這不是論證,而是直覺。但這句話得先說清楚,我不是說 Agent 不需要記憶——恰恰相反,記憶是整場(chǎng) Agent 革命里最重的籌碼,是終局壁壘所在。我說的是: Agent 需要記憶,但不需要今天這種被稱作“Memory 框架”的東西 。
這兩句話聽起來像同一件事,其實(shí)差兩個(gè)字,差一條賽道的生死。
下面講講為什么 —— 當(dāng)然,這只是老馮的個(gè)人觀點(diǎn)。
一、終局是三分天下
要看清今天的賽道,得先把終局畫出來。
這里先交代一句:下面說的“終局”指的是 嚴(yán)肅的企業(yè)級(jí) Agent,以及任何把數(shù)據(jù)當(dāng)成核心資產(chǎn)的組織與個(gè)人 。消費(fèi)端也許另一幅圖景——普通用戶用一個(gè) ChatGPT、一個(gè) Gemini,廠商順手把記憶也做了。
老馮對(duì) AI Agent 的終局判斷很簡(jiǎn)單 —— 三分天下 。一個(gè)成熟的 Agent,在終局狀態(tài)下,大體就是這樣一副架子:
DB_URL=postgres://user:pass@host:5432/memory ![]()
一個(gè) URL 提供智力,一個(gè) URL 提供記憶,中間由 Harness 負(fù)責(zé)把模型套起來、駕馭它去完成具體任務(wù)——加載 Skills、組織 context、調(diào)用工具、處理循環(huán)。想換模型廠商?換 MODEL_URL。想把數(shù)據(jù)遷到別家?換 DB_URL。想本地自建??jī)蓚€(gè)都換成 localhost。三層徹底解耦:智力層由模型廠商提供,記憶層由數(shù)據(jù)庫(kù)廠商提供, 駕馭執(zhí)行的那一層由 Harness 承擔(dān) ——Claude Code、Cursor、Devin 這些今天還在爆發(fā)式演化的產(chǎn)品,本質(zhì)上都是 Harness。
這套格局不是架構(gòu)師一廂情愿的設(shè)計(jì)品味,它背后有一套很樸素的動(dòng)力學(xué)。
終局里真正的壁壘,不在算力,也不在模型。算力短期關(guān)鍵長(zhǎng)期攤平,和“永恒的電力壟斷不存在”是一回事。模型中期關(guān)鍵長(zhǎng)期平權(quán),開源模型一年一個(gè)臺(tái)階往上追,GPT-5 和 DeepSeek V4 的差距比 GPT-4 時(shí)代已經(jīng)小了一大截。再過兩年,Agent 能用的模型大概率是個(gè)豐儉由人的菜市場(chǎng)。真正拿得住的壁壘只有一樣—— 私有數(shù)據(jù) 。
而嚴(yán)肅的企業(yè)用戶不會(huì)允許自己的核心數(shù)據(jù)被“一鍋端”,也不會(huì)允許它和別家的數(shù)據(jù)無序混在同一個(gè)服務(wù)商的黑箱里。一旦被鎖住,這家服務(wù)商對(duì)你就有永恒的議價(jià)權(quán)——過去三十年從數(shù)據(jù)庫(kù)到云的采購(gòu)史,都是這條邏輯寫的。于是博弈的終點(diǎn)就是上面那副架子—— 模型廠商管智能,Harness 管駕馭執(zhí)行,數(shù)據(jù)庫(kù)廠商管記憶 ,三方互不吞并、互相制衡。
三分天下的圖畫完了—— 模型、Harness、數(shù)據(jù)庫(kù),各自獨(dú)立,各自為王 。
現(xiàn)在可以回頭問那個(gè)關(guān)鍵問題:今天市面上這些 Memory 框架,坐在哪一塊上?
二、Memory 框架是什么?
先對(duì) Memory 框架做一次顆粒度區(qū)分,免得一竿子打翻一船人。
今天被塞進(jìn)“Memory 框架”這個(gè)筐里的項(xiàng)目,其實(shí)不是同一種東西,大致可以分成四類,每一類的命運(yùn)不一樣。
第一類,數(shù)據(jù)庫(kù)套殼 SDK 。代表是早期的 Mem0、LangMem、MemoryScope、SuperMemory 這一批。它們的核心能力就是在一個(gè)數(shù)據(jù)庫(kù)(通常是 PG+pgvector 或 SQLite)上封裝一套“extract / store / retrieve / update”的 API,把 episodic 和 semantic 分兩張表,加幾條重要性打分和時(shí)間衰減規(guī)則。這一類離“數(shù)據(jù)庫(kù)薄薄一層皮”這個(gè)描述最貼切, 技術(shù)上沒有壁壘,產(chǎn)品上有一點(diǎn)用戶心智 。
第二類,知識(shí)圖譜 / 時(shí)序圖譜構(gòu)建器 。代表是 Graphiti、Cognee、Hindsight。它們做的事比第一類要重一些——bi-temporal knowledge graph、增量實(shí)體消歧、沖突檢測(cè)與失效、hybrid 檢索(語義 + 關(guān)鍵詞 + 圖遍歷)。這類項(xiàng)目的策略層確實(shí)有工程含量,不是“幾條 SQL”能一筆帶過的。但它們的命運(yùn)是—— 策略層會(huì)被模型吸收(模型自己會(huì)做實(shí)體消歧、沖突判斷),存儲(chǔ)層會(huì)歸回?cái)?shù)據(jù)庫(kù)(圖能力通過 PG 擴(kuò)展或?qū)S脠D數(shù)據(jù)庫(kù)承載),獨(dú)立賽道依然不成立 。
第三類,Agent Runtime / Agent OS 。代表是 Letta/MemGPT。它們做的根本不是 Memory 框架該做的事——把 context window 當(dāng) RAM、把外部存儲(chǔ)當(dāng) Disk、讓模型自己通過 tool call 在兩者之間 swap——這是操作系統(tǒng)意義上的虛擬內(nèi)存管理。它門檻不低,但它的準(zhǔn)確名字是 Agent Runtime ,是 Harness 下位的執(zhí)行引擎層。其實(shí),它應(yīng)該歸到 Runtime / Harness 賽道,不是 Memory 賽道。
第一類會(huì)被 Skill + 模型自己寫 SQL 直接替代;第二類的策略層會(huì)被模型吸收,存儲(chǔ)層會(huì)歸回?cái)?shù)據(jù)庫(kù);
三、它沒有壁壘
回到第一類(數(shù)據(jù)庫(kù)套殼 SDK)——這一類占了市面上的大多數(shù),也是這篇文章主要的打擊對(duì)象。
把它們拆到最細(xì),干的事情就兩件: 替 Agent 設(shè)計(jì)幾張表的 schema,替 Agent 封裝幾條 SQL 。
所謂 episodic 和 semantic 分表,是 schema 設(shè)計(jì)。所謂重要性打分、時(shí)間衰減、反思?jí)嚎s,是寫入時(shí)跑的幾段規(guī)則。所謂向量召回加 BM25 加 cross-encoder 重排加 RRF 融合,是查詢組合。所有 PR 稿的術(shù)語、所有類腦箭頭圖剝掉,底下就是 建表和 SQL 。
建表和 SQL 有壁壘嗎?這是程序員第一周就會(huì)的東西。那框架憑什么值錢?憑它們“替 Agent 想好了該怎么建表、怎么寫查詢”。
那“替 Agent 想好”這件事,值多少?
老馮前陣子琢磨過這個(gè)——用 PG 加幾個(gè)擴(kuò)展加一組存儲(chǔ)過程,把 Mem0 干的事從頭糊一遍,幾天夠了。最后沒做。為什么沒做? 沒意思,沒壁壘 。任何一個(gè)懂點(diǎn) PG 的工程師,周末抽一下午就能寫出個(gè)基礎(chǔ)版 Mem0,功能上九成相似。剩下那一成是 UI、是 SaaS 控制臺(tái)、是發(fā)布節(jié)奏、是開發(fā)者關(guān)系——那是運(yùn)營(yíng)和產(chǎn)品的壁壘,不是技術(shù)壁壘。
那“教會(huì) Agent 怎么用這套東西”又要多少? 一個(gè) Skill,一張 markdown 。
幾百個(gè) token 的一段指令,告訴模型“你有一個(gè) PostgreSQL 數(shù)據(jù)庫(kù)連接在 DATABASE_URL,用戶說話時(shí)你自己判斷哪些事實(shí)值得存,每次回答前做向量加全文的混合檢索,發(fā)現(xiàn)新舊沖突就 UPDATE 舊的”——就這樣。Mem0 那套 ADD / UPDATE / DELETE / NOOP 流水線、Cognee 的圖譜構(gòu)建、Graphiti 的時(shí)序圖——這些“認(rèn)知架構(gòu)”能做的事,現(xiàn)在的模型自己寫 SQL 就能做到,而且寫得比你干凈。
Claude 的 Skills 機(jī)制已經(jīng)把這條路走通一半。用戶寫個(gè) memory-skill.md,描述清楚“記憶怎么存、怎么查”,Claude 在需要時(shí)自動(dòng)調(diào)用,不需要任何外部 Memory 框架。哪天 Anthropic 或 OpenAI 把一個(gè)官方 memory skill 作為最佳實(shí)踐發(fā)出來,這一整批項(xiàng)目從模型側(cè)就被架空了。
你以為的護(hù)城河,其實(shí)是一張寫著幾百字的 markdown 。生產(chǎn)環(huán)境里這張 markdown 背后自然會(huì)接上受控工具和固化的數(shù)據(jù)庫(kù) pipeline——但那些位置該歸 Harness 的歸 Harness,該歸數(shù)據(jù)庫(kù)的歸數(shù)據(jù)庫(kù),依然沒有獨(dú)立 Memory 框架的位置。
四、苦澀的教訓(xùn)
上一節(jié)是從產(chǎn)業(yè)結(jié)構(gòu)上說 Memory 框架沒位置。再往深一層,從方法論上也有一把刀—— The Bitter Lesson 。
Sutton 2019 年那篇一千多字的博客,講的事很簡(jiǎn)單:過去七十年,AI 領(lǐng)域反復(fù)上演同一個(gè)劇本——研究者把自己對(duì)某個(gè)領(lǐng)域的精心理解編碼進(jìn)系統(tǒng),短期看效果不錯(cuò),長(zhǎng)期必輸給“讓模型自己學(xué)”的通用方法。國(guó)際象棋的評(píng)估函數(shù)輸給搜索,圍棋的棋譜先驗(yàn)輸給自我對(duì)弈,語音識(shí)別的音素建模輸給統(tǒng)計(jì)方法,CV 的 SIFT 輸給深度學(xué)習(xí)。每一次,靠“領(lǐng)域理解”的路線都輸了,贏的是看起來“沒有智慧”、只是能吃算力和數(shù)據(jù)的方法。
這把刀落到 Memory 框架上要小心——它 不打 所有系統(tǒng)抽象。操作系統(tǒng)、數(shù)據(jù)庫(kù)、編譯器都是人類設(shè)計(jì)的抽象,它們沒有被端到端學(xué)習(xí)吃掉,也不會(huì)被吃掉,因?yàn)樗鼈兲峁┑氖强煽康牡讓臃e木,不是替 AI 做決策。Sutton 打的是后者。
Memory 框架的問題在于它 站在后者那一邊 。它硬編碼的那些東西——什么信息值得記、記在哪一層、什么時(shí)候觸發(fā)反思、怎么組合向量和全文——每一項(xiàng)都是“替 Agent 做認(rèn)知決策”的意見,而不是通用積木(向量存儲(chǔ)、全文檢索、事務(wù)、索引這些真正的積木,早就被數(shù)據(jù)庫(kù)提供了)。今天 Agent 需要這些意見,只是因?yàn)槟P瓦€不夠強(qiáng);等模型強(qiáng)到能自己判斷——這件事已經(jīng)在發(fā)生——這些手工認(rèn)知策略會(huì)像 SIFT 遇見 AlexNet 那樣,一夜之間變成廢鐵。
產(chǎn)業(yè)結(jié)構(gòu)上它沒位置,方法論上它也撐不住。兩條線在這里合攏。
五、真正的壁壘
那什么 有 壁壘?
三分天下那張圖里,嚴(yán)格來說只有兩個(gè)位置上的壁壘是確定的,另一塊的壁壘還在成形。
模型那塊 會(huì)打血戰(zhàn)。閉源和開源拉鋸、價(jià)格一年一腰斬、廠商排名每半年洗一次牌。這塊有壁壘,但壁壘屬于少數(shù)幾家頭部模型廠商,且局勢(shì)仍在劇烈變動(dòng)。
Harness 那塊 還沒定型。Claude Code / Codex 現(xiàn)在跑在最前面,但其他的也開始露頭:OpenClaw,Hermes;Letta/MemGPT 那支 Agent Runtime 方向如果真能做成也挺有意思。Harness 這塊今天剛長(zhǎng)出些壁壘,又被 Claude Code 開源給掀翻拉平到一個(gè)水平線。
剩下那塊—— 數(shù)據(jù)庫(kù) ——是全局里 確定性最高 的位置。
確定性來自一個(gè)結(jié)構(gòu)性事實(shí): 數(shù)據(jù)庫(kù)不在 AI 沖擊的范圍內(nèi) 。
什么東西會(huì)被 AI 沖擊??jī)r(jià)值來自“信息加工”的東西——文案、設(shè)計(jì)、初級(jí)編程、法律文書、客服、PPT。它們的本質(zhì)是把信息 A 映射到信息 B,而 LLM 做的就是這件事。LLM 有多強(qiáng),它們被壓縮得有多狠。
那什么不在這個(gè)前線上? 物理世界的持久化層 。數(shù)據(jù)庫(kù)干的事情是在真實(shí)的磁盤上、通過真實(shí)的操作系統(tǒng)和文件系統(tǒng)、對(duì)抗真實(shí)的斷電和崩潰、在多節(jié)點(diǎn)間用真實(shí)的網(wǎng)絡(luò)達(dá)成共識(shí),讓字節(jié)在二十年后還能被準(zhǔn)確讀回來。這件事的本質(zhì)不是信息加工,是 物理世界的可靠性保證 。LLM 再聰明變不出一塊磁盤,保證不了 fsync 的語義,也不會(huì)代替兩階段提交。
Agent 越強(qiáng)大,它越需要一個(gè)可靠的物理世界錨點(diǎn)。Agent 革命不會(huì)削弱數(shù)據(jù)庫(kù)的價(jià)值, 只會(huì)放大它 。
所以三分天下的終局里,模型那塊會(huì)打到流血,Harness 那塊還在摸索, 只有數(shù)據(jù)庫(kù)這塊地基,三十年前就定了,三十年后還會(huì)在 。
六、數(shù)據(jù)庫(kù)的盡頭是 PG
那具體到記憶層,會(huì)是哪個(gè)數(shù)據(jù)庫(kù)?
這里要分階段看。
現(xiàn)階段 ——對(duì)一個(gè)跑在本地的個(gè)人 Agent、或者單機(jī)場(chǎng)景下的輕量 Agent 來說, SQLite 甚至文件系統(tǒng)也完全夠用 。SQLite 零運(yùn)維、文件形態(tài)、本地跑、原生支持 JSON 和向量擴(kuò)展,單體 Agent 的記憶需求它完全扛得住。相當(dāng)多的 Agent 應(yīng)用在本地持久化上就是直接用 SQLite。這個(gè)階段講“記憶層需要 PG”是過度工程。
但往前演化一步——一旦 Agent 需要跨 Agent 協(xié)作、跨設(shè)備持久化、跨組織可遷移、面對(duì)多租戶和并發(fā)——也就是需要“通用可遷移的記憶層”——局勢(shì)就會(huì)收斂 。收斂到哪?
PostgreSQL 。
原因有三層。
第一層,事實(shí)已經(jīng)在發(fā)生 。相當(dāng)一部分認(rèn)真做 Agent 基礎(chǔ)設(shè)施的嚴(yán)肅項(xiàng)目都在向 PG 或 PG 兼容后端靠攏——Letta 官方支持 PG + pgvector,Hindsight 明確只支持 PG + pgvector,Tiger Data 直接把產(chǎn)品線命名為 Agentic Postgres。這不是 PG 生態(tài)自我證明(Supabase、Neon 這種本來就是 PG 家族的不算),是 原本站在其他路線上的項(xiàng)目在往 PG 收斂 。
第二層,線纜協(xié)議(Wire Protocol)是事實(shí)標(biāo)準(zhǔn) 。PG 協(xié)議之于通用記憶層,就像 HTTP 之于應(yīng)用層——夠老、夠穩(wěn)、夠通用、夠開放,沒有哪家廠商能擁有它,也沒有哪家廠商能替換它。模型在訓(xùn)練語料里見過幾百萬次 SQL 和 psql,它天然會(huì)說這門語言,不需要額外訓(xùn)練。私有協(xié)議的數(shù)據(jù)庫(kù)在 AI 時(shí)代已經(jīng)輸了一半,因?yàn)槟P筒皇焖?/p>
第三層,擴(kuò)展生態(tài)已經(jīng)把記憶層需要的所有檢索原語覆蓋了 。向量有 pgvector,全文有 tsvector 加 GIN,圖有 AGE 以及新一代基于 PG 的圖擴(kuò)展,時(shí)序有 TimescaleDB,地理有 PostGIS,水平擴(kuò)展有 Citus。這些都是擴(kuò)展插進(jìn)來的,不是重寫整個(gè)系統(tǒng)——因?yàn)?PG 三十年前就做了個(gè)關(guān)鍵決定:不替上層預(yù)設(shè)語義。這是 PG 真正牛逼的地方,三十年后任何新工作負(fù)載都能插進(jìn)來。
所以這條演化路徑是清楚的—— 在“通用可遷移的記憶層”這件事上,除了 PG 協(xié)議沒別的選 。圖數(shù)據(jù)庫(kù)、對(duì)象存儲(chǔ)、端側(cè) SQLite、專用搜索系統(tǒng)——它們會(huì)在各自的專用場(chǎng)景里繼續(xù)存在,這不沖突。但在“通用 Agent 記憶”這個(gè)場(chǎng)景里,PG 就是那個(gè)終局。
SQLite 和 PG 在架構(gòu)紀(jì)律上是一族人——都是通用持久化層、都不預(yù)設(shè)上層語義、都有幾十年的可靠性積累、都不在 AI 沖擊的前線上、都有靈活的擴(kuò)展極致。SQLite 是端側(cè)和本地場(chǎng)景的 PG,PG 是服務(wù)端和協(xié)作場(chǎng)景的 SQLite。它們是同一條路上的兩個(gè) size。
真正被三分天下分食掉的,是那種“介于數(shù)據(jù)庫(kù)和應(yīng)用之間的中間件”——也就是今天的 Memory 框架。
回到三分天下這張圖。模型層在流動(dòng),Harness 層在成形,記憶層在沉淀。三塊地盤各自為王,沒有哪一塊是今天“Memory 框架”的位置。它們不是某一方的對(duì)手——它們是過渡態(tài)下代管了三方工作的中間商,而真空一旦被填滿,中間商就無處可去。
十年后再回望 2026 年這場(chǎng) Memory 框架喧嘩,會(huì)看到一件很平淡的事——那些號(hào)稱“給 Agent 設(shè)計(jì)認(rèn)知”的框架,最后真正留下來的代碼,是它們最樸素的那一部分: 把數(shù)據(jù)老老實(shí)實(shí)塞進(jìn) PostgreSQL 的那幾行 SQL 。
其他的,都會(huì)被端到端學(xué)習(xí)吃掉。
數(shù)據(jù)庫(kù)老司機(jī)
點(diǎn)一個(gè)關(guān)注 ??,精彩不迷路
對(duì) PostgreSQL, Pigsty,下云,AI 感興趣的朋友
歡迎加入 PGSQL x Pigsty 交流群 QQ 619377403
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.