認(rèn)知雙模型架構(gòu)

2026-04-07 20:47:31　來源: CreateAMind

上海舉報(bào)

分享至

A Dual-Model Architecture for Cognition

認(rèn)知雙模型架構(gòu)

https://www.preprints.org/frontend/manuscript/5535e01343b831a92c36d3e7a74398ff/download_pub

摘要
本文提出了 Ze，一個(gè)基于兩種不同的環(huán)境生成模型并行運(yùn)作的新型認(rèn)知架構(gòu)理論框架：因果（前向）模型 M_A 和反事實(shí)（逆向）模型 M_B。Ze 的核心動力學(xué)源于兩個(gè)獨(dú)立的變分自由能 F_A 和 F_B 的最小化，以及兩者之間沖突的管理，即 ΔF = |F_A - F_B|。這一沖突調(diào)節(jié)著兩種相之間的轉(zhuǎn)換：干涉態(tài)（在此狀態(tài)下模型輸出被建設(shè)性地融合）和局域態(tài)（通過離散投影解決沖突）。我們在形式上建立了 Ze 與量子測量（特別是雙縫實(shí)驗(yàn)）之間的深層結(jié)構(gòu)同構(gòu)性，而無需在底層引入量子物理。Ze 被構(gòu)建為一個(gè)完整的、可證偽的理論，它將認(rèn)知中的“坍縮”重新解釋為由優(yōu)化驅(qū)動的相變，生成新的可實(shí)驗(yàn)驗(yàn)證的預(yù)測，并將感知、行動與表征學(xué)習(xí)整合到一個(gè)統(tǒng)一的架構(gòu)中。本預(yù)印本提供了該框架的完整數(shù)學(xué)闡述。

關(guān)鍵詞：認(rèn)知架構(gòu)；變分推斷；模型沖突；主動推斷；量子認(rèn)知；相變

1. 引言

尋求一種形式化的、基于計(jì)算理論的認(rèn)知與意識理論，仍然是神經(jīng)科學(xué)與人工智能領(lǐng)域的核心挑戰(zhàn)。主流范式，如預(yù)測處理與自由能原理，認(rèn)為大腦的功能是一個(gè)分層的生成模型，以最小化驚訝或變分自由能（Friston, 2010）。盡管這些框架功能強(qiáng)大，但它們通常描述的是單一的、統(tǒng)一的感知模型。Ze形式體系提出了一個(gè)根本性的擴(kuò)展：智能系統(tǒng)需要維護(hù)同一個(gè)環(huán)境的兩個(gè)不同的、非對稱的生成模型。

這種二元性的動機(jī)，源于不僅需要解釋被動感知，還需要解釋反事實(shí)推理、敘事理解以及信念的突然重組。我們引入一個(gè)因果（前向）模型 M_A，它基于時(shí)間動態(tài)預(yù)測感官數(shù)據(jù)；以及一個(gè)反事實(shí)（逆向）模型 M_B，它推斷解釋、目標(biāo)和潛在原因。它們的獨(dú)立運(yùn)作以及隨后的相互作用構(gòu)成了Ze架構(gòu)的核心。

該理論嚴(yán)格建立在已確立的變分力學(xué)基礎(chǔ)上，不對大腦的量子過程做任何假設(shè)。然而，它揭示了一個(gè)與量子測量之間的深刻形式類比。這一類比不僅僅是隱喻性的，而且表明，支配不確定性解決方式的數(shù)學(xué)原理可能在不同的物理和計(jì)算基底中是普遍的。Ze為經(jīng)典的認(rèn)知現(xiàn)象——知覺雙穩(wěn)態(tài)、頓悟問題解決以及睡眠-覺醒周期——提供了新的視角，并產(chǎn)生了具體的、可檢驗(yàn)的預(yù)測，從而將其與標(biāo)準(zhǔn)模型區(qū)分開來。

2. 數(shù)學(xué)形式體系

2.1. 核心變量與基本結(jié)構(gòu)

考慮一個(gè)接收觀察流 o_{1:T} 的智能體。Ze假設(shè)存在兩個(gè)獨(dú)立的生成模型：

2.2. 兩個(gè)變分自由能

每個(gè)模型最小化其自身的變分自由能泛函，這是驚訝的上界（Friston, 2010）：

2.3. 模型沖突：核心量

Ze 中的核心動態(tài)變量是模型沖突或解釋分歧：

2.4. 干涉作為后驗(yàn)兼容性

干涉被形式化為模型后驗(yàn)的建設(shè)性融合。我們使用 Jensen-Shannon 散度（JSD）來衡量它們的兼容性，這是一種對稱且有界的度量：

3. 與量子力學(xué)的形式對應(yīng)

Ze的數(shù)學(xué)結(jié)構(gòu)展現(xiàn)出與量子雙縫實(shí)驗(yàn)嚴(yán)格同構(gòu)的關(guān)系。

這種對應(yīng)關(guān)系表明，疊加、干涉、測量和擦除等原理并非量子物理學(xué)所獨(dú)有，而是描述了那些在競爭性內(nèi)部模型之間管理不確定性的系統(tǒng)的一般動力學(xué)（Busemeyer & Bruza, 2012）。在Ze中，“坍縮”不是一個(gè)假設(shè)，而是一種涌現(xiàn)的、由優(yōu)化驅(qū)動的相變。

4. 實(shí)驗(yàn)預(yù)測與可證偽性

Ze是一個(gè)嚴(yán)格的理論，而非隱喻，因?yàn)樗⒃跇?biāo)準(zhǔn)變分演算之上，不提出任何量子物理層面的主張，提出了一個(gè)新的架構(gòu)性假設(shè)，并產(chǎn)生了可證偽的預(yù)測。

4.1. 關(guān)鍵可檢驗(yàn)預(yù)測

5. 討論與結(jié)論

Ze 形式體系將感知、行動和學(xué)習(xí)整合到一個(gè)統(tǒng)一的、數(shù)學(xué)精確的架構(gòu)中。其核心創(chuàng)新在于生成模型的強(qiáng)制性二元性，這些模型之間的沖突與和解動力學(xué)支配著認(rèn)知。

5.1. 對認(rèn)知科學(xué)的啟示

Ze 為知覺雙穩(wěn)態(tài)（自發(fā)的局域化）、頓悟（突然的沖突解決）以及睡眠的功能（周期性的擦除與整合）等現(xiàn)象提供了有原則的解釋。它將認(rèn)知構(gòu)建為因果性的“是什么”模型與反事實(shí)性的“可能是什么”模型之間的持續(xù)協(xié)商。

5.2. 根本性轉(zhuǎn)變

該理論重新解釋了認(rèn)知“坍縮”的難題——明確的感知如何從模糊的數(shù)據(jù)中涌現(xiàn)——將其視為一種基于優(yōu)化的軟性相變。這為這一過程去神秘化，并使其與更廣泛的自組織物理原則對齊（Tschacher & Haken，2007）。

5.3. 未來方向

未來的工作必須聚焦于 Ze 智能體的形式化計(jì)算實(shí)現(xiàn)，以及設(shè)計(jì)第 2 表中概述的關(guān)鍵實(shí)驗(yàn)。此外，與量子力學(xué)的同構(gòu)性 invites 跨學(xué)科對話，表明量子信息理論可能為建模高層認(rèn)知過程提供強(qiáng)大的工具，而無需假設(shè)一個(gè)量子大腦。

結(jié)論

總之，Ze 被提出作為一個(gè)完整的、可證偽的框架，通過在雙模型動力學(xué)的治理下統(tǒng)一變分推斷、主動學(xué)習(xí)和結(jié)構(gòu)性模型修正，推進(jìn)了我們對智能系統(tǒng)的形式化理解。

圖 1. Ze 架構(gòu)示意圖。一個(gè)框圖，展示了兩個(gè)生成模型 M_A 和 M_B，它們接收觀察 o_t 并維護(hù)后驗(yàn)分布 q_A 和 q_B。該圖說明了 F_A、F_B、ΔF 的計(jì)算，以及沖突信號的反饋如何調(diào)節(jié)干涉/局域化開關(guān)和策略選擇（π_A, π_B）。擦除算子 ? 和路徑固定參數(shù) λ 也被顯示為調(diào)節(jié)性輸入。

圖 2. 動力學(xué)狀態(tài)與相變。一個(gè)分岔圖，繪制了系統(tǒng)穩(wěn)定性度量隨模型沖突 ΔF 的變化。圖中顯示，當(dāng) ΔF < θ 時(shí)存在一個(gè)穩(wěn)定的“干涉”吸引子，該吸引子在閾值 θ 處失去穩(wěn)定性。當(dāng) ΔF > θ 時(shí)，出現(xiàn)兩個(gè)穩(wěn)定的“局域化”吸引子，對應(yīng)于偏向 M_A 或 M_B 的兩種解決方式。箭頭指示了在局域化事件期間系統(tǒng)的軌跡。

原文鏈接：https://www.preprints.org/frontend/manuscript/5535e01343b831a92c36d3e7a74398ff/download_pub

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.