A Domain-Theoretic Foundation for Imprecise Probability and
Credal Sets
不精確概率與信度集的域理論基礎(chǔ)
https://arxiv.org/pdf/2604.09272
![]()
摘要
我們建立了一個域理論框架,用于在具有可數(shù)基的連續(xù)開集格的一般拓?fù)淇臻g上進(jìn)行不精確概率的推理與推斷。本文研究兩種不同形式的不確定性:部分或不完整的事件描述,以及以信度集形式表示的概率分布集合——以及二者的結(jié)合。在該框架下,我們構(gòu)建了條件概率理論,并推導(dǎo)出新的推理規(guī)則,用于在存在這兩種互補(bǔ)的不精確類型的情形下執(zhí)行貝葉斯更新。我們將這些結(jié)果進(jìn)一步推廣至不精確概率事件的條件獨(dú)立性理論。我們還為條件概率、貝葉斯更新與條件獨(dú)立性形式化了邏輯謂詞,并獲得了相應(yīng)的可靠性與完備性結(jié)果。本文的一項(xiàng)核心貢獻(xiàn)是構(gòu)造了從任意信度集到區(qū)間域的Scott連續(xù)映射,從而為容量理論與Choquet積分中的經(jīng)典結(jié)果提供了域理論層面的實(shí)現(xiàn)。最后,我們引入并研究了一類由帶不精確概率權(quán)重的迭代函數(shù)系統(tǒng)所生成的新型信度集,拓展了計(jì)算上可處理的不精確概率模型的適用范圍。由此構(gòu)建的可計(jì)算框架統(tǒng)一了關(guān)于不確定性的邏輯、拓?fù)渑c測度論視角,為在部分信息與集值信息條件下進(jìn)行魯棒的概率推斷提供了支持。
關(guān)鍵詞: 域理論;條件概率;信度集;條件獨(dú)立性
1 引言
當(dāng)信息是部分的、模糊的或集值的時候,不精確概率為不確定性下的推理提供了一個魯棒的框架。它通過允許分布集(信度集)和區(qū)間值概率,推廣了經(jīng)典概率論,從而在安全關(guān)鍵應(yīng)用中能夠?qū)崿F(xiàn)更謹(jǐn)慎的推斷。
我們考慮第二可數(shù)局部緊致Sober拓?fù)淇臻g。我們將這樣的空間稱為基本拓?fù)淇臻g。在這些空間中,開集格是一個可數(shù)基連續(xù)格 [GHK?03],代表著一個具有可數(shù)基的空間locale。這些基本空間包括可分局部緊致度量空間以及可數(shù)基連續(xù)域。此外,任何波蘭空間都是其形式球連續(xù)域的最大元素空間 [EH98]。這意味著基本拓?fù)淇臻g涵蓋了概率論中使用的所有標(biāo)準(zhǔn)空間。
此外,在此類空間上的任何連續(xù)概率賦值都可以擴(kuò)展為博雷爾測度 [AMESD00, KL05]。對于豪斯多夫空間,由所得博雷爾測度的外正則性,這種擴(kuò)展是唯一的。
![]()
![]()
![]()
在接下來的章節(jié)中,我們在這種不精確設(shè)定下,為條件概率、貝葉斯更新和條件獨(dú)立性建立了域理論基礎(chǔ)。一個關(guān)鍵結(jié)果是從信度集到區(qū)間概率的 Scott 連續(xù)包絡(luò)映射,它將容量理論思想和 Choquet 積分提升到了域框架中 [Cho54, Gra16, ACdCT14, GL13]。我們還引入了一類由帶不精確權(quán)重的迭代函數(shù)系統(tǒng)產(chǎn)生的新型信度集。
雖然區(qū)間算術(shù)已在工程背景下應(yīng)用于貝葉斯法則 [FKG?03],且魯棒貝葉斯分析考慮了先驗(yàn)集 [Ber85],但據(jù)我們所知,精確端點(diǎn)公式的基于單調(diào)性的推導(dǎo)此前尚未發(fā)表。我們證明(引理 6.1)經(jīng)典的貝葉斯更新
![]()
由于基本空間的開集格是可數(shù)基且連續(xù)的,它可以被賦予一個有效結(jié)構(gòu),使得格上的可計(jì)算開集和可計(jì)算函數(shù)可以被枚舉;參見 [Plo81, Smy77]。這導(dǎo)致了一個針對不精確概率和信度集的可計(jì)算框架。
記號約定
對于任何基本空間,無論是豪斯多夫空間還是域,我們都用 D D 表示。當(dāng)我們專門僅處理豪斯多夫基本空間時,我們用 X X 而不是 D D 來標(biāo)記它。
2 域理論基礎(chǔ)
![]()
2.1 可逼近關(guān)系
遵循不精確概率的既定框架和傳統(tǒng),正如經(jīng)典開創(chuàng)性工作 [Wal91] 中詳盡描述的那樣,我們將為基本的域理論構(gòu)造形式化謂詞。這可以通過域理論中豐富的可逼近映射、locale 和 Stone 對偶性理論來實(shí)現(xiàn) [Sco70, Smy77, AJ95, Abr91, Vic89]。
實(shí)際上,我們將形式化一個謂詞 G G,它可以用于 (i) 為基本空間 D D 定義 P ( D ) 的 Scott 開子集的一組基,以及 (ii) 刻畫 O ( D ) 上給定的連續(xù)賦值。我們考慮基本空間 D D 的開子集格的一個可數(shù)基 ,它在有限并和有限交下封閉。
我們通過如下給出的集合來定義連續(xù)賦值空間上的開集基:
![]()
3 基本空間的事件域
給定一個基本空間 D ,我們將它的開集視為可觀測或半可判定謂詞 [Abr91, Smy77]。由于在概率論和統(tǒng)計(jì)學(xué)中取事件的補(bǔ)集是一個基本工具,且由于開集的補(bǔ)集未必是開集,我們通過不相交開集來逼近開集的外部。這引導(dǎo)我們得出 D 的事件域 E ( D ) ,即按子集包含關(guān)系按分量排序的不相交開集對的偏序:
![]()
![]()
4 信度集
用于指代概率分布凸集的現(xiàn)代術(shù)語 credal set(信度集)是在后來的論述 [ACdCT14] 中標(biāo)準(zhǔn)化的,盡管其基礎(chǔ)理論是由 Walley [Wal91] 在“概率測度集”(sets of probability measures)這一名稱下發(fā)展的。
![]()
![]()
![]()
![]()
5 事件的條件概率
![]()
![]()
5.1 條件概率謂詞
由于 Scott 連續(xù)映射 C 是由輸入連續(xù)賦值 σ 在輸入開集或其交集上的一對有理函數(shù)給出的,原則上,人們可以通過對給定運(yùn)算進(jìn)行復(fù)合來獲得表示 C 的可逼近映射。然而,這種方法會導(dǎo)致相當(dāng)復(fù)雜的表達(dá)式。一種更自然且直接的技術(shù)是為 C 的下端和上端形式化兩個關(guān)鍵謂詞,并將它們與表示 σ 的謂詞 G 聯(lián)系起來。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
信度集方法產(chǎn)生一個區(qū)間,用以捕捉多個先驗(yàn)下的不確定性,而經(jīng)典方法則產(chǎn)生一個依賴于先驗(yàn)任意選擇的單一數(shù)值(此處為平均值)。在安全關(guān)鍵應(yīng)用中,區(qū)間的下界提供了一個魯棒的、風(fēng)險(xiǎn)厭惡的估計(jì),而經(jīng)典點(diǎn)估計(jì)可能會誤判真實(shí)的不確定性。進(jìn)一步的比較見表3。
6 事件的貝葉斯更新
![]()
![]()
![]()
6.1 貝葉斯推理規(guī)則
我們現(xiàn)在像在第 5.1 節(jié)針對區(qū)間條件概率所做的那樣,為區(qū)間貝葉斯方法形式化兩個謂詞。這兩個新謂詞分別是
![]()
![]()
例 6.5. 考慮一種針對某種疾病的醫(yī)學(xué)檢測。設(shè):
- H H:患者患有該疾病的假設(shè)。
- E E:檢測結(jié)果呈陽性的證據(jù)。
我們擁有不精確信息:
- 先驗(yàn)患病率:根據(jù)流行病學(xué)研究,該疾病的患病率估計(jì)在 1% 到 5% 之間,但確切數(shù)值不確定。
- 檢測靈敏度:在患病條件下檢測呈陽性的概率在 85% 到 95% 之間。
- 檢測特異度:在未患病條件下檢測呈陰性的概率在 90% 到 99% 之間。
在經(jīng)典貝葉斯分析中,通常選擇點(diǎn)估計(jì):
![]()
![]()
6.2 信度集的貝葉斯更新
![]()
![]()
![]()
經(jīng)典點(diǎn)估計(jì)位于該區(qū)間內(nèi)部,但未能捕捉到全部的不確定性。0.6617 的區(qū)間寬度反映了對參數(shù) a 和 b 的顯著敏感性。在安全關(guān)鍵應(yīng)用中,這揭示了后驗(yàn)概率可能低至 28.6% 或高達(dá) 94.7%,而當(dāng)任意選擇單一精確參數(shù)集時,這些信息就會丟失。
7 擴(kuò)展到多維情形
![]()
8 條件獨(dú)立性
![]()
![]()
![]()
![]()
8.1 強(qiáng)條件獨(dú)立性
在本節(jié)前文中,我們看到,當(dāng)兩個獨(dú)立事件 U U 和 V V 以 W W 為條件時,經(jīng)典條件獨(dú)立性意味著下條件支撐是可分解的。在此域論設(shè)定下,我們還擁有由上條件支撐所提供的額外信息。
![]()
![]()
強(qiáng)條件獨(dú)立性中關(guān)于右端點(diǎn)的額外假設(shè)具有局限性,在許多應(yīng)用中不太可能成立。然而,它帶來了計(jì)算上的高效性,因?yàn)闂l件概率的兩個端點(diǎn)可以通過對應(yīng)端點(diǎn)的乘積來獲得。可以將強(qiáng)條件獨(dú)立性視為在圖模型中提供的一種樂觀規(guī)則,用于計(jì)算條件概率的右端點(diǎn)。
對于強(qiáng)條件獨(dú)立性,我們有兩條額外的規(guī)則來替換 (CI7) 和 (CI8):
![]()
![]()
![]()
關(guān)于各種方法的比較,見表 5。主要區(qū)別如下:
- 經(jīng)典方法:點(diǎn)估計(jì) (0.56) 假設(shè)具備精確知識和完美分解。
- 弗雷歇 (Fréchet) 方法:保守區(qū)間 [0.42, 0.80] 保證了包含性,但區(qū)間較寬(寬度為 0.38)。
- 強(qiáng)獨(dú)立性方法:區(qū)間更窄 [0.42, 0.72](寬度 0.30),但需要強(qiáng)分解假設(shè)。
關(guān)于實(shí)際意義,我們有:
- 診斷:如果我們需要大于 0.7 的概率來進(jìn)行診斷:
- 經(jīng)典方法:否 (0.56 < 0.7)
- 弗雷歇方法:可能 (0.42-0.80 包含 > 0.7)
- 強(qiáng)獨(dú)立性方法:可能 (0.42-0.72 包含 > 0.7)
- 安全性:弗雷歇方法更安全(總是包含真實(shí)概率)。
- 效率:強(qiáng)獨(dú)立性更高效(區(qū)間更窄)。
最后,關(guān)于何時使用每種方法:
- 弗雷歇規(guī)則:適用于安全關(guān)鍵應(yīng)用、依賴關(guān)系未知以及保守風(fēng)險(xiǎn)評估的情況。
- 強(qiáng)獨(dú)立性:適用于負(fù)面證據(jù)的獨(dú)立性合理且效率為優(yōu)先考量的情況。
- 經(jīng)典方法:適用于參數(shù)精確已知且獨(dú)立性假設(shè)經(jīng)過充分驗(yàn)證的情況。
9 帶有不精確概率的迭代函數(shù)系統(tǒng)
在本節(jié)中,我們通過考慮與基本空間的事件域?qū)ε嫉挠颍^續(xù)架起經(jīng)典容量理論 [Cho54, Wal91] 與域理論之間的橋梁。該對偶域采用基本空間的覆蓋閉子集對,并按反向包含排序。利用這個對偶域,我們將一類新的信度集形式化為帶有概率的迭代函數(shù)系統(tǒng) (IFS) 的不變測度。
迭代函數(shù)系統(tǒng) (IFS) 及其不變測度已在分形幾何和動力系統(tǒng)中得到廣泛研究,其應(yīng)用范圍涵蓋從計(jì)算機(jī)圖形學(xué)和圖像壓縮到自然現(xiàn)象建模、信號處理、生物結(jié)構(gòu)分析和金融時間序列 [IFS22]。我們在本節(jié)的結(jié)果為將這些經(jīng)典應(yīng)用擴(kuò)展到概率不確定或部分指定的場景提供了數(shù)學(xué)上嚴(yán)謹(jǐn)?shù)幕A(chǔ)。
![]()
![]()
![]()
在下文中,我們將考慮 IFS 的信度集。具有以區(qū)間形式給出的不精確輸入的馬爾可夫鏈的情況將在附錄 B 中給出。
9.1 帶有概率的 IFS 的信度集
在本小節(jié)中,我們引入一類新的信度集,即那些由帶有概率的迭代函數(shù)系統(tǒng) (IFS) 的不變測度組成的信度集。IFS 理論一直是多個學(xué)科中一個活躍的研究領(lǐng)域。
![]()
![]()
![]()
對應(yīng)于該不變測度的連續(xù)概率賦值可從域論角度獲得,具體為:若 X X 是緊致空間,則其為 X X 的上空間之概率冪域上 Hutchinson 算子的最小不動點(diǎn);或?yàn)橥陚涠攘靠臻g之形式球域的概率冪域上 Hutchinson 算子的最小不動點(diǎn)。
并且,我們獲得了該不動點(diǎn)算子到容許集上的擴(kuò)展:
![]()
9.1.1 具有不精確轉(zhuǎn)移矩陣的馬爾可夫鏈
在本節(jié)中,我們介紹并分析了帶有不精確概率權(quán)重的迭代函數(shù)系統(tǒng)。類似地,據(jù)我們所知,附錄 B 針對轉(zhuǎn)移概率以不精確值指定的有限狀態(tài)馬爾可夫鏈,提供了一種新穎的論述。
結(jié)論
我們已經(jīng)為不精確概率與信度集建立了一個綜合的域理論基礎(chǔ),提供了一個統(tǒng)一的計(jì)算框架,該框架既能處理部分事件描述(在事件域 E ( D ) 中表示為不相交開集對),又能處理由上空間 U ( P ( X ) 中的緊致信度集所捕捉的分布不確定性。我們的主要貢獻(xiàn)包括:在事件域上構(gòu)造了 Scott 連續(xù)區(qū)間概率映射;推導(dǎo)出了貝葉斯更新的基于單調(diào)性的精確區(qū)間擴(kuò)展,并附帶了可靠且完備的推理規(guī)則;建立了針對不精確事件的條件獨(dú)立性理論,包含保守(弗雷歇)與強(qiáng)分解規(guī)則;以及引入了一類由帶有不精確概率權(quán)重的迭代函數(shù)系統(tǒng)生成的新型信度集,并證明了相關(guān)不動點(diǎn)映射的連續(xù)性。我們?yōu)橄嚓P(guān)概念形式化了邏輯謂詞,并獲得了可靠性與完備性結(jié)果。所有運(yùn)算均 Scott 連續(xù)地?cái)U(kuò)展至信度集空間,從而確保了有限逼近的收斂性。
這項(xiàng)工作為信度網(wǎng)絡(luò)與不精確貝葉斯網(wǎng)絡(luò)的域論處理奠定了必要的數(shù)學(xué)基礎(chǔ)。該框架保證了使用不精確參數(shù)和部分指定觀測值進(jìn)行的推斷具有堅(jiān)實(shí)的計(jì)算基礎(chǔ),并得到域論逼近性質(zhì)以及通過可逼近映射提供的邏輯基礎(chǔ)的支持。未來的工作將集中于構(gòu)建明確的域論信度網(wǎng)絡(luò),開發(fā)利用此處所提出的連續(xù)性與逼近結(jié)構(gòu)的精確與近似推斷算法,并將該方法推廣至不精確條件下的序列決策問題。
原文鏈接:https://arxiv.org/pdf/2604.09272
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.