重構(gòu)期望自由能：四種公式及其統(tǒng)一

2026-04-27 13:46:18　來源: CreateAMind

上海舉報

分享至

Reframing the Expected Free Energy: Four Formulations and a Unification Unavailable

重構(gòu)期望自由能：四種公式及其統(tǒng)一

https://direct.mit.edu/neco/article-abstract/38/3/439/135158/Reframing-the-Expected-Free-Energy-Four?redirectedFrom=fulltext

概述

一、研究背景與核心問題 本文聚焦于主動推理（Active Inference）框架中的核心目標(biāo)函數(shù)——期望自由能（Expected Free Energy, EFE）。當(dāng)前文獻(xiàn)中存在多種直觀上合理但形式各異的EFE公式（如“風(fēng)險+模糊性”、“信息增益/語用價值”等），但這些公式多依賴直覺合理性，缺乏從單一數(shù)學(xué)根源統(tǒng)一推導(dǎo)的嚴(yán)謹(jǐn)基礎(chǔ)。本文正式提出并試圖解決這一“統(tǒng)一問題”（the unification problem），即如何從一個嚴(yán)格的EFE根定義出發(fā)，邏輯一致地還原所有現(xiàn)有公式。

二、兩種定義路徑的深度剖析 文章系統(tǒng)對比了定義EFE的兩條主流路徑，揭示了各自的優(yōu)勢與理論邊界：

基于觀測風(fēng)險的路徑（Risk over observations + Ambiguity）
- 特點：該設(shè)定目前缺乏嚴(yán)格的數(shù)學(xué)證明，但具有極強的公式覆蓋能力。若假設(shè)“目標(biāo)分布的似然 T ( o ∣ s ) 等于生成模型的似然 P ( o ∣ s ) ”，則可從中推導(dǎo)出所有已知EFE公式。
- 局限：在更一般的**部分可觀測馬爾可夫決策過程（POMDPs）**中，這一似然約束實際上嚴(yán)格限制了有效先驗偏好的集合。只有在似然映射“無損”的特殊條件下，觀測先驗偏好才能任意定義；一般情況下，僅有極少數(shù)先驗偏好能與生成模型的似然映射兼容。
基于狀態(tài)風(fēng)險的路徑（Risk over states + Ambiguity）
- 特點：該路徑具備嚴(yán)格的數(shù)學(xué)根定義證明，理論根基扎實。
- 局限：表達(dá)能力受限，僅能推導(dǎo)出兩種公式（狀態(tài)風(fēng)險+模糊性、熵+期望能量），無法涵蓋“信息增益”等更廣泛的直觀解釋，犧牲了公式的多樣性以換取數(shù)學(xué)嚴(yán)謹(jǐn)性。

三、核心結(jié)論與理論意義

揭示核心權(quán)衡：本文明確指出EFE構(gòu)建中存在**“數(shù)學(xué)嚴(yán)謹(jǐn)性”與“公式覆蓋度”之間的內(nèi)在權(quán)衡**。兩條路徑無法同時滿足嚴(yán)格證明與全面推導(dǎo)，研究者在不同應(yīng)用場景下需根據(jù)任務(wù)需求進(jìn)行選擇。
統(tǒng)一條件：文章最終探討了文獻(xiàn)中實現(xiàn)EFE公式統(tǒng)一的潛在條件，指出只有在無隨機波動的系統(tǒng)語境下，結(jié)合自由能原理的特定假設(shè)，才可能真正實現(xiàn)多公式的理論統(tǒng)一。
領(lǐng)域貢獻(xiàn)：本研究為主動推理領(lǐng)域的理論基石提供了清晰的數(shù)學(xué)邊界與概念澄清，有助于消除現(xiàn)有文獻(xiàn)中的表述模糊性，指導(dǎo)研究者在強化學(xué)習(xí)、計算神經(jīng)科學(xué)及機器人控制等場景中合理選擇EFE公式，并推動未來更嚴(yán)謹(jǐn)、更通用的主動推理算法設(shè)計。

摘要

主動推理是一種關(guān)于感知、學(xué)習(xí)和決策的過程理論，應(yīng)用于神經(jīng)科學(xué)、機器人學(xué)、心理學(xué)和機器學(xué)習(xí)等多個研究領(lǐng)域。主動推理依賴于一個稱為期望自由能的目標(biāo)函數(shù)，該函數(shù)因其公式化表達(dá)（例如，風(fēng)險加模糊性，以及信息增益/實用價值公式）在直覺上的合理性而被證明是合理的。本文旨在形式化地闡述從單一根期望自由能定義推導(dǎo)出這些公式化表達(dá)的問題——即統(tǒng)一問題。然后，我們分析了定義期望自由能的兩種方法。更準(zhǔn)確地說，期望自由能要么被定義為（1）觀測風(fēng)險加模糊性，要么被定義為（2）狀態(tài)風(fēng)險加模糊性。在第一種設(shè)定下，迄今為止尚未提出對期望自由能的嚴(yán)格數(shù)學(xué)證明，但通過假設(shè)目標(biāo)分布 T ( o ∣ s ) 就是生成模型的似然 P ( o ∣ s ) ，可以從中恢復(fù)出所有的公式化表達(dá)。重要的是，在此似然約束下，如果似然是無損的，則對觀測的偏好先驗可以任意定義。然而，在更一般的部分可觀察馬爾可夫決策過程（POMDP）情形下，我們證明似然約束實際上限制了有效觀測偏好先驗的集合。實際上，只有有限的一類觀測偏好先驗與生成模型的似然映射兼容。在第二種設(shè)定下，存在對根期望自由能定義的證明，但該設(shè)定僅包含兩種公式化表達(dá)：狀態(tài)風(fēng)險加模糊性，以及熵加期望能量的公式。最后，我們討論了在文獻(xiàn)中，通過在無隨機波動系統(tǒng)的特定背景下訴諸自由能原理，已經(jīng)提出了期望自由能公式化表達(dá)統(tǒng)一的條件。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.