A Dual-Model Architecture for Cognition
認(rèn)知雙模型架構(gòu)
https://www.preprints.org/frontend/manuscript/5535e01343b831a92c36d3e7a74398ff/download_pub
![]()
![]()
摘要
本文提出了 Ze,一個(gè)基于兩種不同的環(huán)境生成模型并行運(yùn)作的新型認(rèn)知架構(gòu)理論框架:因果(前向)模型 M_A 和反事實(shí)(逆向)模型 M_B。Ze 的核心動力學(xué)源于兩個(gè)獨(dú)立的變分自由能 F_A 和 F_B 的最小化,以及兩者之間沖突的管理,即 ΔF = |F_A - F_B|。這一沖突調(diào)節(jié)著兩種相之間的轉(zhuǎn)換:干涉態(tài)(在此狀態(tài)下模型輸出被建設(shè)性地融合)和局域態(tài)(通過離散投影解決沖突)。我們在形式上建立了 Ze 與量子測量(特別是雙縫實(shí)驗(yàn))之間的深層結(jié)構(gòu)同構(gòu)性,而無需在底層引入量子物理。Ze 被構(gòu)建為一個(gè)完整的、可證偽的理論,它將認(rèn)知中的“坍縮”重新解釋為由優(yōu)化驅(qū)動的相變,生成新的可實(shí)驗(yàn)驗(yàn)證的預(yù)測,并將感知、行動與表征學(xué)習(xí)整合到一個(gè)統(tǒng)一的架構(gòu)中。本預(yù)印本提供了該框架的完整數(shù)學(xué)闡述。
關(guān)鍵詞:認(rèn)知架構(gòu);變分推斷;模型沖突;主動推斷;量子認(rèn)知;相變
1. 引言
尋求一種形式化的、基于計(jì)算理論的認(rèn)知與意識理論,仍然是神經(jīng)科學(xué)與人工智能領(lǐng)域的核心挑戰(zhàn)。主流范式,如預(yù)測處理與自由能原理,認(rèn)為大腦的功能是一個(gè)分層的生成模型,以最小化驚訝或變分自由能(Friston, 2010)。盡管這些框架功能強(qiáng)大,但它們通常描述的是單一的、統(tǒng)一的感知模型。Ze形式體系提出了一個(gè)根本性的擴(kuò)展:智能系統(tǒng)需要維護(hù)同一個(gè)環(huán)境的兩個(gè)不同的、非對稱的生成模型。
這種二元性的動機(jī),源于不僅需要解釋被動感知,還需要解釋反事實(shí)推理、敘事理解以及信念的突然重組。我們引入一個(gè)因果(前向)模型 M_A,它基于時(shí)間動態(tài)預(yù)測感官數(shù)據(jù);以及一個(gè)反事實(shí)(逆向)模型 M_B,它推斷解釋、目標(biāo)和潛在原因。它們的獨(dú)立運(yùn)作以及隨后的相互作用構(gòu)成了Ze架構(gòu)的核心。
該理論嚴(yán)格建立在已確立的變分力學(xué)基礎(chǔ)上,不對大腦的量子過程做任何假設(shè)。然而,它揭示了一個(gè)與量子測量之間的深刻形式類比。這一類比不僅僅是隱喻性的,而且表明,支配不確定性解決方式的數(shù)學(xué)原理可能在不同的物理和計(jì)算基底中是普遍的。Ze為經(jīng)典的認(rèn)知現(xiàn)象——知覺雙穩(wěn)態(tài)、頓悟問題解決以及睡眠-覺醒周期——提供了新的視角,并產(chǎn)生了具體的、可檢驗(yàn)的預(yù)測,從而將其與標(biāo)準(zhǔn)模型區(qū)分開來。
2. 數(shù)學(xué)形式體系
2.1. 核心變量與基本結(jié)構(gòu)
考慮一個(gè)接收觀察流 o_{1:T} 的智能體。Ze假設(shè)存在兩個(gè)獨(dú)立的生成模型:
![]()
2.2. 兩個(gè)變分自由能
每個(gè)模型最小化其自身的變分自由能泛函,這是驚訝的上界(Friston, 2010):
![]()
2.3. 模型沖突:核心量
Ze 中的核心動態(tài)變量是模型沖突或解釋分歧:
![]()
2.4. 干涉作為后驗(yàn)兼容性
干涉被形式化為模型后驗(yàn)的建設(shè)性融合。我們使用 Jensen-Shannon 散度(JSD)來衡量它們的兼容性,這是一種對稱且有界的度量:
![]()
![]()
![]()
![]()
![]()
3. 與量子力學(xué)的形式對應(yīng)
Ze的數(shù)學(xué)結(jié)構(gòu)展現(xiàn)出與量子雙縫實(shí)驗(yàn)嚴(yán)格同構(gòu)的關(guān)系。
![]()
![]()
這種對應(yīng)關(guān)系表明,疊加、干涉、測量和擦除等原理并非量子物理學(xué)所獨(dú)有,而是描述了那些在競爭性內(nèi)部模型之間管理不確定性的系統(tǒng)的一般動力學(xué)(Busemeyer & Bruza, 2012)。在Ze中,“坍縮”不是一個(gè)假設(shè),而是一種涌現(xiàn)的、由優(yōu)化驅(qū)動的相變。
4. 實(shí)驗(yàn)預(yù)測與可證偽性
Ze是一個(gè)嚴(yán)格的理論,而非隱喻,因?yàn)樗⒃跇?biāo)準(zhǔn)變分演算之上,不提出任何量子物理層面的主張,提出了一個(gè)新的架構(gòu)性假設(shè),并產(chǎn)生了可證偽的預(yù)測。
4.1. 關(guān)鍵可檢驗(yàn)預(yù)測
![]()
![]()
![]()
5. 討論與結(jié)論
Ze 形式體系將感知、行動和學(xué)習(xí)整合到一個(gè)統(tǒng)一的、數(shù)學(xué)精確的架構(gòu)中。其核心創(chuàng)新在于生成模型的強(qiáng)制性二元性,這些模型之間的沖突與和解動力學(xué)支配著認(rèn)知。
5.1. 對認(rèn)知科學(xué)的啟示
Ze 為知覺雙穩(wěn)態(tài)(自發(fā)的局域化)、頓悟(突然的沖突解決)以及睡眠的功能(周期性的擦除與整合)等現(xiàn)象提供了有原則的解釋。它將認(rèn)知構(gòu)建為因果性的“是什么”模型與反事實(shí)性的“可能是什么”模型之間的持續(xù)協(xié)商。
5.2. 根本性轉(zhuǎn)變
該理論重新解釋了認(rèn)知“坍縮”的難題——明確的感知如何從模糊的數(shù)據(jù)中涌現(xiàn)——將其視為一種基于優(yōu)化的軟性相變。這為這一過程去神秘化,并使其與更廣泛的自組織物理原則對齊(Tschacher & Haken,2007)。
5.3. 未來方向
未來的工作必須聚焦于 Ze 智能體的形式化計(jì)算實(shí)現(xiàn),以及設(shè)計(jì)第 2 表中概述的關(guān)鍵實(shí)驗(yàn)。此外,與量子力學(xué)的同構(gòu)性 invites 跨學(xué)科對話,表明量子信息理論可能為建模高層認(rèn)知過程提供強(qiáng)大的工具,而無需假設(shè)一個(gè)量子大腦。
結(jié)論
總之,Ze 被提出作為一個(gè)完整的、可證偽的框架,通過在雙模型動力學(xué)的治理下統(tǒng)一變分推斷、主動學(xué)習(xí)和結(jié)構(gòu)性模型修正,推進(jìn)了我們對智能系統(tǒng)的形式化理解。
圖 1. Ze 架構(gòu)示意圖。一個(gè)框圖,展示了兩個(gè)生成模型 M_A 和 M_B,它們接收觀察 o_t 并維護(hù)后驗(yàn)分布 q_A 和 q_B。該圖說明了 F_A、F_B、ΔF 的計(jì)算,以及沖突信號的反饋如何調(diào)節(jié)干涉/局域化開關(guān)和策略選擇(π_A, π_B)。擦除算子 ? 和路徑固定參數(shù) λ 也被顯示為調(diào)節(jié)性輸入。
圖 2. 動力學(xué)狀態(tài)與相變。一個(gè)分岔圖,繪制了系統(tǒng)穩(wěn)定性度量隨模型沖突 ΔF 的變化。圖中顯示,當(dāng) ΔF < θ 時(shí)存在一個(gè)穩(wěn)定的“干涉”吸引子,該吸引子在閾值 θ 處失去穩(wěn)定性。當(dāng) ΔF > θ 時(shí),出現(xiàn)兩個(gè)穩(wěn)定的“局域化”吸引子,對應(yīng)于偏向 M_A 或 M_B 的兩種解決方式。箭頭指示了在局域化事件期間系統(tǒng)的軌跡。
原文鏈接:https://www.preprints.org/frontend/manuscript/5535e01343b831a92c36d3e7a74398ff/download_pub
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.