<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      你的AI Agent越用越蠢?港中大、浙大戳破「記憶」的謊言

      0
      分享至


      新智元報(bào)道


      【新智元導(dǎo)讀】你是否在使用Agent工作或者寫(xiě)代碼時(shí),總感覺(jué)上下文不夠用?或者感覺(jué)反復(fù)使用Agent時(shí)并沒(méi)有變得更聰明?感覺(jué)目前的記憶方案仍然不夠用?今日,香港中文大學(xué)聯(lián)合浙江大學(xué)發(fā)布的一篇論文關(guān)注了這個(gè)問(wèn)題,并引起了學(xué)術(shù)界廣泛討論:你以為Agent在「記憶」,其實(shí)只是在記備忘錄。

      你有沒(méi)有遇到過(guò)這種情況:

      給Agent配了向量數(shù)據(jù)庫(kù),上傳了大量歷史對(duì)話,結(jié)果它下次還是答不上來(lái);或者用Cursor、Claude寫(xiě)了幾十輪代碼,感覺(jué)它對(duì)你項(xiàng)目的理解并沒(méi)有隨著時(shí)間真正加深,每次都像是在重新認(rèn)識(shí)你。


      這不是模型的問(wèn)題,也不是RAG配置的問(wèn)題。

      香港中文大學(xué)與浙江大學(xué)的研究者在一篇新論文中給出了一個(gè)更根本的答案:我們根本就沒(méi)有給Agent真正的記憶。我們只是給了它一個(gè)備忘錄(Memo)。


      論文鏈接:https://arxiv.org/pdf/2604.27707

      論文于2026年4月30日在arXiv發(fā)布預(yù)印本,約10天之內(nèi)便在國(guó)際學(xué)術(shù)社區(qū)引發(fā)大量討論。AI領(lǐng)域知名賬號(hào) @dair_ai 在X(Twitter)的轉(zhuǎn)發(fā)獲得超過(guò)26,100次瀏覽與700余次點(diǎn)贊,多位YouTuber亦自發(fā)制作了介紹視頻,小紅書(shū)上也有多篇轉(zhuǎn)載。

      Agent為什么越用越蠢?

      當(dāng)前主流的Agent記憶方案,大體可以分為四類(lèi):向量存儲(chǔ)、檢索增強(qiáng)生成(RAG)、便簽本(Scratchpad)與上下文窗口管理。

      它們有一個(gè)共同點(diǎn):都是「查找」,而非「記憶」。

      論文作者將這類(lèi)機(jī)制統(tǒng)稱(chēng)為「?jìng)渫洠∕emo)」,而非真正意義上的記憶(True Memory)。

      備忘錄的邏輯是:把信息存起來(lái),用的時(shí)候再檢索出來(lái)。這和人類(lèi)把一件事「記在心里」,是完全不同的兩件事。


      這個(gè)區(qū)別的核心在于泛化機(jī)制的本質(zhì)差異:

      • 基于檢索的記憶:通過(guò)與存儲(chǔ)案例的相似性進(jìn)行泛化。如果你存的案例里沒(méi)有類(lèi)似的情境,Agent就不會(huì)處理。

      • 基于權(quán)重的記憶:將經(jīng)驗(yàn)抽象成規(guī)則,并將規(guī)則應(yīng)用于從未見(jiàn)過(guò)的輸入。

      人類(lèi)在學(xué)習(xí)一門(mén)語(yǔ)言時(shí),不是把每一個(gè)句子都背下來(lái),而是內(nèi)化了語(yǔ)法規(guī)則,然后能造出從沒(méi)說(shuō)過(guò)的新句子。

      目前的Agent「記憶」,更像是基于檢索的記憶。

      三大結(jié)構(gòu)性缺陷

      作者歸納出當(dāng)前上下文代理記憶系統(tǒng)的三個(gè)關(guān)鍵局限,且每一個(gè)都可以在理論層面被證明,而非僅憑直覺(jué)。

      缺陷一:信息量不等于能力

      Agent會(huì)無(wú)限積累筆記,卻無(wú)法發(fā)展出真正的專(zhuān)業(yè)知識(shí)。

      認(rèn)知科學(xué)早已證明(Chi et al., 1981),人類(lèi)專(zhuān)家與新手的根本區(qū)別不在于掌握了更多信息,而在于知識(shí)的組織方式發(fā)生了質(zhì)變:專(zhuān)家的知識(shí)按照深層原則重新結(jié)構(gòu)化,而非簡(jiǎn)單堆積。

      當(dāng)前Agent做不到這一步。每次會(huì)話結(jié)束,模型的權(quán)重完全不變,下一次依然是從同一個(gè)「新手」起點(diǎn)出發(fā),只是多了幾條備忘錄。

      缺陷二:泛化天花板——數(shù)學(xué)分析

      研究者用樣本復(fù)雜度理論,證明了可量化的泛化鴻溝:

      • 檢索式記憶系統(tǒng),要處理組合式新穎任務(wù),需要存儲(chǔ)Ω(k2)個(gè)案例

      • 而參數(shù)化學(xué)習(xí)(權(quán)重記憶),只需O(d)個(gè)示例(d為算子的復(fù)雜度維度)

      更關(guān)鍵的是:增大上下文窗口無(wú)法突破這個(gè)上限。限制不來(lái)自容量,而來(lái)自組合覆蓋度。如果Agent從沒(méi)見(jiàn)過(guò)「A規(guī)則+B規(guī)則同時(shí)適用」的情形,它就無(wú)法處理這種組合,無(wú)論你塞進(jìn)多少備忘錄。

      用一個(gè)直觀的例子:假設(shè)Agent學(xué)會(huì)了「攝氏度轉(zhuǎn)華氏度」和「時(shí)區(qū)換算」兩項(xiàng)技能,如果它只是把案例存在向量庫(kù)里,那遇到「把北京時(shí)間的溫度轉(zhuǎn)換到紐約同等時(shí)刻」這類(lèi)組合問(wèn)題,它很可能就卡殼了。而人類(lèi)學(xué)會(huì)了規(guī)則之后,這種組合是自然而然的。

      缺陷三:記憶投毒——結(jié)構(gòu)性安全漏洞

      持久化記憶存儲(chǔ)在結(jié)構(gòu)上對(duì)記憶投毒攻擊(Memory Poisoning)具有固有脆弱性。論文引用的實(shí)證數(shù)據(jù)觸目驚心:

      • MINJA攻擊:在最小化功能損耗的前提下,注入成功率高達(dá)98.2%

      • PoisonedRAG攻擊:僅用5條對(duì)抗性文本,即可實(shí)現(xiàn)90%的攻擊成功率

      更危險(xiǎn)的是,一旦注入成功,惡意內(nèi)容會(huì)通過(guò)持久記憶在所有后續(xù)會(huì)話中持續(xù)循環(huán),單次攻擊轉(zhuǎn)化為永久性入侵。

      海馬體+新皮層

      缺一不可

      論文的理論基礎(chǔ)來(lái)自神經(jīng)科學(xué)中的互補(bǔ)學(xué)習(xí)系統(tǒng)理論(Complementary Learning Systems, CLS)

      哺乳動(dòng)物大腦通過(guò)兩套系統(tǒng)的協(xié)作解決了記憶問(wèn)題:

      • 海馬體(Hippocampus):快速記錄情景,高保真存儲(chǔ)新經(jīng)驗(yàn)

      • 新皮層(Neocortex):緩慢整合,將情景記憶提煉為抽象規(guī)則,寫(xiě)入權(quán)重

      這兩套系統(tǒng)缺一不可。人類(lèi)睡眠時(shí),大腦會(huì)將白天的情景記憶向新皮層「回放」,完成從「記住這件事」到「學(xué)會(huì)這件事」的轉(zhuǎn)化。

      當(dāng)前AI Agent只實(shí)現(xiàn)了海馬體,即快速寫(xiě)入,相似性召回,沒(méi)有抽象步驟。


      論文作者將當(dāng)前的Agent比作一個(gè)永遠(yuǎn)不睡覺(jué)的人——不斷記筆記,卻從不整理,永遠(yuǎn)無(wú)法將零散的經(jīng)驗(yàn)升華為真正的專(zhuān)業(yè)知識(shí)。

      學(xué)界怎么看?

      X上的真實(shí)討論

      論文發(fā)布后,@dair_ai 的轉(zhuǎn)發(fā)帖迅速引發(fā)國(guó)際學(xué)術(shù)社區(qū)的熱議,以下是部分代表性討論的翻譯:






      雙系統(tǒng)并存

      不是推倒重來(lái)

      論文并非只是「批判」,而是提出了雙系統(tǒng)共存的架構(gòu)路徑。

      核心思路是:在保留現(xiàn)有檢索式情景記憶(海馬體等價(jià)物)的同時(shí),增加一條異步鞏固通道,將情景記憶逐步整合進(jìn)模型權(quán)重(新皮層等價(jià)物)。

      具體技術(shù)早已存在,從LoRA(輕量微調(diào))和MEMIT(記憶編輯),到TTT層(測(cè)試時(shí)訓(xùn)練)和SSR(自我蒸餾)等。

      論文為三類(lèi)受眾發(fā)出具體的行動(dòng)呼吁:

      • 系統(tǒng)構(gòu)建者:實(shí)現(xiàn)從情景存儲(chǔ)到權(quán)重的鞏固通道,而非無(wú)限擴(kuò)大向量庫(kù)

      • 基準(zhǔn)設(shè)計(jì)者(Benchmark):引入「跨時(shí)間組合泛化(CGT)」指標(biāo),真正衡量Agent是否在學(xué)習(xí)

      • 持續(xù)學(xué)習(xí)研究社區(qū):重新關(guān)注Agent場(chǎng)景,它天然提供了連續(xù)經(jīng)驗(yàn)流、獎(jiǎng)勵(lì)信號(hào)與真實(shí)的部署環(huán)境


      總結(jié)

      這篇論文本質(zhì)上是一篇立場(chǎng)論文(Position Paper),沒(méi)有龐大的實(shí)驗(yàn)堆砌,但論證框架清晰,理論證明嚴(yán)格,

      它引發(fā)如此廣泛的討論,或許恰恰說(shuō)明:這個(gè)問(wèn)題,幾乎每一個(gè)認(rèn)真使用過(guò)長(zhǎng)期Agent的工程師和研究者都曾隱約感受到,只是暫時(shí)沒(méi)有人把它說(shuō)清楚。

      如果你正在構(gòu)建長(zhǎng)期運(yùn)行的Agent系統(tǒng),這篇論文提供了一個(gè)重要的概念校準(zhǔn):你存的那些「記憶」,到底是備忘錄,還是真正的學(xué)習(xí)?

      參考資料:

      Xu, B., Dai, X., & Zhang, K. (2026). Contextual Agentic Memory is a Memo, Not True Memory. arXiv:2604.27707v1

      @dair_ai Twitter/X 討論:https://x.com/dair_ai/status/2050694339165335754

      Chi, M. T. H., et al. (1981). Categorization and representation of physics problems by experts and novices. Cognitive Science.

      MINJA & PoisonedRAG 相關(guān)攻擊研究(見(jiàn)論文參考文獻(xiàn))

      編輯:LRST

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      美國(guó)提出五大條件,一分錢(qián)不賠給伊朗,濃縮鈾還要送給美國(guó)

      美國(guó)提出五大條件,一分錢(qián)不賠給伊朗,濃縮鈾還要送給美國(guó)

      藍(lán)星特快
      2026-05-18 10:19:44
      李在明賭贏了!中美會(huì)晤后,韓國(guó)成東亞老二,日本訪華團(tuán)無(wú)人接待

      李在明賭贏了!中美會(huì)晤后,韓國(guó)成東亞老二,日本訪華團(tuán)無(wú)人接待

      鐵錘侃侃而談
      2026-05-18 09:14:35
      阿斯:皇馬為穆帥提供2+1合同,若帶隊(duì)贏得西甲將自動(dòng)續(xù)約1年

      阿斯:皇馬為穆帥提供2+1合同,若帶隊(duì)贏得西甲將自動(dòng)續(xù)約1年

      懂球帝
      2026-05-19 13:22:21
      蘋(píng)果手機(jī)自帶激光雷達(dá),九成用戶從未用過(guò),太可惜了

      蘋(píng)果手機(jī)自帶激光雷達(dá),九成用戶從未用過(guò),太可惜了

      小柱解說(shuō)游戲
      2026-05-18 10:04:40
      世界模型的門(mén)檻,谷歌可能邁過(guò)去了

      世界模型的門(mén)檻,谷歌可能邁過(guò)去了

      鈦媒體APP
      2026-05-18 15:14:36
      格局拉滿!文班亞馬賽后謙遜喊話SGA,用實(shí)力與氣度征服全場(chǎng)!

      格局拉滿!文班亞馬賽后謙遜喊話SGA,用實(shí)力與氣度征服全場(chǎng)!

      田先生籃球
      2026-05-19 13:53:38
      “你的5000美元,已長(zhǎng)成浩瀚綠洲!”

      “你的5000美元,已長(zhǎng)成浩瀚綠洲!”

      新浪財(cái)經(jīng)
      2026-05-19 06:51:47
      歐美發(fā)達(dá)國(guó)家對(duì)印裔的幻想,終于徹底破滅了!

      歐美發(fā)達(dá)國(guó)家對(duì)印裔的幻想,終于徹底破滅了!

      寰球經(jīng)緯所
      2026-05-18 14:54:12
      印網(wǎng)友:我們家家有電視,中國(guó)有嗎?法國(guó)一句話讓14億人集體沉默

      印網(wǎng)友:我們家家有電視,中國(guó)有嗎?法國(guó)一句話讓14億人集體沉默

      一個(gè)有靈魂的作者
      2026-05-19 08:11:59
      訪日前表態(tài):堅(jiān)持一個(gè)中國(guó),不愿卷入任何沖突

      訪日前表態(tài):堅(jiān)持一個(gè)中國(guó),不愿卷入任何沖突

      觀察者網(wǎng)
      2026-05-19 16:14:52
      逆天續(xù)命!39歲瓦爾迪2場(chǎng)2球搶6分,克雷莫內(nèi)塞1分之差末輪決生死

      逆天續(xù)命!39歲瓦爾迪2場(chǎng)2球搶6分,克雷莫內(nèi)塞1分之差末輪決生死

      懂個(gè)球
      2026-05-18 23:59:47
      250斤光頭長(zhǎng)相如催收!這位華裔憑啥坐穩(wěn)白宮核心?

      250斤光頭長(zhǎng)相如催收!這位華裔憑啥坐穩(wěn)白宮核心?

      52赫茲實(shí)驗(yàn)室
      2026-05-17 11:26:16
      超越賈巴爾,文班亞馬成為NBA季后賽歷史最年輕40+20先生

      超越賈巴爾,文班亞馬成為NBA季后賽歷史最年輕40+20先生

      懂球帝
      2026-05-19 12:43:41
      美媒痛批特朗普:最愚蠢的錯(cuò)誤,就是將中國(guó)定義為“同等級(jí)”對(duì)手

      美媒痛批特朗普:最愚蠢的錯(cuò)誤,就是將中國(guó)定義為“同等級(jí)”對(duì)手

      墜入二次元的海洋
      2026-05-18 23:18:23
      俄媒坐不住了:中國(guó)殲-20流水線0工人,造戰(zhàn)機(jī)如復(fù)制粘貼一般

      俄媒坐不住了:中國(guó)殲-20流水線0工人,造戰(zhàn)機(jī)如復(fù)制粘貼一般

      忠誠(chéng)TALK
      2026-05-17 21:20:31
      “黃金腰臀比”魏秋月:運(yùn)動(dòng)員時(shí)因技術(shù)出名,后來(lái)靠身材出圈!

      “黃金腰臀比”魏秋月:運(yùn)動(dòng)員時(shí)因技術(shù)出名,后來(lái)靠身材出圈!

      拳擊時(shí)空
      2026-05-19 06:09:56
      馬刺當(dāng)一回好人!把雷霆米切爾打回原形,湖人續(xù)約里夫斯心里有數(shù)

      馬刺當(dāng)一回好人!把雷霆米切爾打回原形,湖人續(xù)約里夫斯心里有數(shù)

      佳佳說(shuō)奇事故事
      2026-05-19 13:06:37
      去社保局辦退休,記住這3句反問(wèn)!我靠第2句,補(bǔ)回11年工齡

      去社保局辦退休,記住這3句反問(wèn)!我靠第2句,補(bǔ)回11年工齡

      花小貓的美食日常
      2026-05-19 15:10:14
      冠軍來(lái)了!阿森納有望“躺冠”,曼城必須全勝,同分必奪冠

      冠軍來(lái)了!阿森納有望“躺冠”,曼城必須全勝,同分必奪冠

      嗨皮看球
      2026-05-19 11:05:00
      證監(jiān)會(huì):繼續(xù)全力穩(wěn)定和增強(qiáng)資本市場(chǎng)信心

      證監(jiān)會(huì):繼續(xù)全力穩(wěn)定和增強(qiáng)資本市場(chǎng)信心

      環(huán)球網(wǎng)資訊
      2026-05-19 09:19:43
      2026-05-19 17:35:00
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
      15250文章數(shù) 66877關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克敗訴,法院判他起訴OpenAI太晚了

      頭條要聞

      4名男子赴泰國(guó)考察項(xiàng)目已失聯(lián)半月 家屬:人或在緬甸

      頭條要聞

      4名男子赴泰國(guó)考察項(xiàng)目已失聯(lián)半月 家屬:人或在緬甸

      體育要聞

      文班亞馬1比0雷霆:凌駕MVP的史詩(shī)價(jià)值

      娛樂(lè)要聞

      姚晨刪博難平眾怒,為什么她還能蹦噠

      財(cái)經(jīng)要聞

      從賣(mài)流量到賣(mài)Token,運(yùn)營(yíng)商算力生意破局

      汽車(chē)要聞

      德味操控+聰明大腦,與眾07不輸新勢(shì)力

      態(tài)度原創(chuàng)

      時(shí)尚
      本地
      旅游
      家居
      藝術(shù)

      休閑闊腿褲怎么穿才美?看看這些穿搭公式,解鎖不重樣的造型

      本地新聞

      別搜晉江小說(shuō)了,去看真的晉江

      旅游要聞

      洱海邊驚現(xiàn)棒棒糖花海,蒼山為被洱海為席相當(dāng)出片,且完全免費(fèi)!

      家居要聞

      觀山隱秀 心靈沉淀

      藝術(shù)要聞

      三影堂攝影藝術(shù)中心舉辦藝術(shù)家孫瑞祥個(gè)展

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 日韩美女av电影| 亚洲乱码精品乱码精品中文| 中文字幕日韩精品有码视频| 亚洲自拍另类欧美综合| 精品午夜国产福利在线观看| 亚洲黄色一级片在线观看| 欧美顶级metart祼体全部自慰| 国产三级| 久久久中文字幕日本| 在线亚洲视频网站www色| 国产黄在线免费观看| 欧美国产日产一区二区| 影音先锋成人网| www一区二区www免费| 天堂v亚洲国产v一区二区| 久久成人国产精品一区二区| 国产睡熟迷奷系列网站| 国产美女精品一区二区| 亚洲精品国产一区黑色丝袜| 狠狠做五月深爱婷婷天天综合| 国产真实乱在线更新| 无码人妻久久一区二区三区| Y111111国产精品久久久| 4hu44四虎www在线影院麻豆| 制服丝袜在线云霸| 久久国产精品福利一区二区三区| 亚洲中文无码成人片| 国产精品午夜福利视频| 日韩午夜伦| 一二三四在线视频观看社区| 日本色导航| 色色免费视频| 亚洲欧美在线一区中文字幕| 国产亚洲精aa在线观看香蕉| 女人被男人爽到呻吟的视频| 乱人伦无码中文视频在线| cosplay女黄网站| 欧美精品国产一区二区三区| 麻豆精品在线视频| 在线播放国产精品亚洲| 精品三级久久久久电影网|