Weighted Bayesian Conformal Prediction
加權(quán)貝葉斯共形預(yù)測
https://arxiv.org/pdf/2604.06464
![]()
摘要
![]()
1 引言
共形預(yù)測(CP)[Vovk et al., 2005] 提供了具有有限樣本覆蓋率保證的無分布預(yù)測區(qū)間:對于任何模型和未覆蓋率(miscoverage level) α ,構(gòu)建的預(yù)測集包含真實結(jié)果的概率至少為 1 ? α 。這一優(yōu)雅的保證使 CP 成為現(xiàn)代不確定性量化的基石 [Lei et al., 2018, Romano et al., 2019]。
![]()
![]()
加權(quán)共形預(yù)測。 當(dāng)測試分布和校準分布不同(協(xié)變量偏移)時,Tibshirani 等人 [2019] 引入了加權(quán)可交換性(weighted exchangeability)的概念,并證明了通過似然比對校準分數(shù)進行重加權(quán)可以保持有效的覆蓋率保證。這一基礎(chǔ)性結(jié)果已被應(yīng)用于空間設(shè)置 [Lou et al., 2025]、域適應(yīng)(domain adaptation)和公平感知預(yù)測。但是,加權(quán) CP 仍然是純粹頻率學(xué)派的:它用加權(quán)分位數(shù) 替換了均勻分位數(shù),這仍然是每個權(quán)重剖面下的單一確定性閾值。它解決了協(xié)變量偏移問題,但完全沒有解決元不確定性問題。
差距。 現(xiàn)有方法均未同時提供 (i) BQ-CP 關(guān)于閾值的貝葉斯后驗和數(shù)據(jù)條件保證,以及 (ii) 加權(quán) CP 的分布偏移魯棒性。這一差距不僅僅是理論上的:例如,在空間預(yù)測中,基于 200 個附近可比銷售數(shù)據(jù)的預(yù)測區(qū)間,與基于 5 個遙遠銷售數(shù)據(jù)的區(qū)間,其可靠性有著根本的不同——然而,無論是 BQ-CP(完全忽略了空間結(jié)構(gòu))還是加權(quán) CP(不提供元不確定性)都無法區(qū)分這些情況。
我們的貢獻:加權(quán)貝葉斯共形預(yù)測(WBCP)。 我們通過將 BQ-CP 推廣到任意的重要性加權(quán)設(shè)置來彌合這一差距。我們的關(guān)鍵見解是,那些為加權(quán) CP 提供覆蓋率保證的重要性權(quán)重 [Tibshirani et al., 2019],通過加權(quán)貝葉斯自助法(weighted Bayesian bootstrap)[Newton and Raftery, 1994] 自然地映射到狄利克雷集中參數(shù),其中 Kish 有效樣本量 充當(dāng)集中縮放因子。至關(guān)重要的是,WBCP 沒有引入新的假設(shè):它繼承了加權(quán) CP 的加權(quán)可交換性假設(shè),并用完整的后驗分布豐富了由此產(chǎn)生的點估計閾值。具體而言,我們做出了以下貢獻:
![]()
2 背景
2.1 分裂共形預(yù)測
![]()
2.2 加權(quán)共形預(yù)測
標準 CP 要求訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)具有可交換性,這在分布偏移(distribution shift)下會失效。Tibshirani 等人 [2019] 通過引入加權(quán)可交換性(weighted notion of exchangeability)概念,將 CP 擴展到了可交換性之外,并證明了適當(dāng)重加權(quán)的共形過程能夠保留覆蓋率保證。
![]()
該框架涵蓋了協(xié)變量偏移校正、空間加權(quán)(GeoCP, Lou et al., 2025)以及局部共形預(yù)測(localized CP)[Guan, 2023]。在所有情況下,輸出都是每個權(quán)重剖面下的單一確定性閾值——加權(quán)分位數(shù)沒有提供關(guān)于其自身可靠性的任何信息。
2.3 作為貝葉斯求積的共形預(yù)測(BQ-CP)
Snell 和 Griffiths [2025] 表明,共形閾值選擇可以被視為針對期望損失的貝葉斯求積。期望損失的隨機上界為:
![]()
![]()
3 加權(quán)貝葉斯共形預(yù)測
3.1 通用框架
![]()
![]()
![]()
![]()
3.2 有效樣本量作為集中參數(shù)
![]()
3.3 通過蒙特卡洛采樣獲取 HPD 閾值
算法 1 總結(jié)了 WBCP 過程。關(guān)于閾值的后驗分布是通過狄利克雷采樣獲得的,而 HPD 閾值提供了數(shù)據(jù)條件保證。
![]()
![]()
3.4 形式化元不確定性
WBCP 的輸出形式化了 §1 中引入的兩個不確定性層級之間的區(qū)別。我們現(xiàn)在使這一區(qū)別在數(shù)學(xué)上精確化。
![]()
![]()
![]()
表 1 總結(jié)了每種方法提供的不確定性輸出。WBCP 是唯一一種同時處理非均勻權(quán)重并提供關(guān)于閾值的后驗分布的方法。
![]()
4 理論結(jié)果
![]()
4.1 校準一致性
![]()
![]()
4.2 后驗集中速率
![]()
4.3 加權(quán)隨機占優(yōu)
![]()
![]()
4.4 條件覆蓋率界限
![]()
5 應(yīng)用:地理貝葉斯共形預(yù)測
我們將 WBCP 實例化用于空間預(yù)測,其中重要性權(quán)重源于地理核函數(shù)。這一實例化與 Tibshirani 等人 [2019] 的局部條件覆蓋率(local conditional coverage)框架有著自然的理論聯(lián)系。
![]()
![]()
6 實驗
我們評估了五種變體:標準 CP、加權(quán) CP (GeoCP)、WBCP (GeoBCP)、自適應(yīng)加權(quán) CP (AdaGeoCP) 以及自適應(yīng) WBCP (AdaGeoBCP)。所有方法均使用 α = 0.1 , β = 0.9 ,以及 M = 1000 個 MC 樣本。
6.1 合成空間數(shù)據(jù)
![]()
![]()
![]()
6.2 現(xiàn)實世界空間數(shù)據(jù)
![]()
![]()
![]()
7 相關(guān)工作
共形預(yù)測。 CP [Vovk et al., 2005] 及其分裂變體 [Papadopoulos et al., 2002, Lei et al., 2018] 提供了無分布覆蓋率。擴展包括共形分位數(shù)回歸 [Romano et al., 2019]、共形風(fēng)險控制 [Angelopoulos et al., 2024, Bates et al., 2021] 以及分布共形 CP [Chernozhukov et al., 2021]。
加權(quán)和局部 CP。 Tibshirani 等人 [2019] 引入了加權(quán)可交換性,并證明了重加權(quán)共形過程在協(xié)變量偏移下能保持覆蓋率,確立了 WBCP 所構(gòu)建的理論基礎(chǔ)。Guan [2023] 提出了基于核的局部化方法。Lou 等人 [2025] 將空間加權(quán)應(yīng)用于地理預(yù)測。所有這些方法仍然屬于頻率學(xué)派,僅提供點估計閾值,而不包含元不確定性。
CP 的貝葉斯方法。 Fong 和 Holmes [2021] 探索了共形貝葉斯計算。Snell 和 Griffiths [2025] 建立了在獨立同分布(i.i.d.)數(shù)據(jù)下具有數(shù)據(jù)條件保證的 BQ-CP。我們的工作直接將 BQ-CP 擴展到了加權(quán)設(shè)置。
空間 UQ(不確定性量化)。 克里金法(Kriging)[Fotheringham et al., 2002] 在高斯假設(shè)下提供空間預(yù)測方差。GeoCP [Lou et al., 2025] 是無分布的,但屬于頻率學(xué)派。WBCP 結(jié)合了兩者的優(yōu)勢。
8 討論與結(jié)論
![]()
原文鏈接:https://arxiv.org/pdf/2604.06464
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.