物理學報告：復雜系統(tǒng)的可預測性

2026-04-14 14:36:02　來源: 集智俱樂部

北京舉報

分享至

導語

復雜系統(tǒng)作為現(xiàn)代科學的核心研究對象，其本質(zhì)特征體現(xiàn)在自組織、涌現(xiàn)性、非線性、適應性和開放性等方面。與簡單機械系統(tǒng)或完全隨機系統(tǒng)不同，復雜系統(tǒng)處于完全規(guī)則與完全隨機之間的平衡狀態(tài)。本文系統(tǒng)綜述了復雜系統(tǒng)可預測性研究的理論框架與方法體系，為理解系統(tǒng)演化的內(nèi)在規(guī)律提供了重要視角。

研究復雜系統(tǒng)可預測性具有重要科學意義。首先，可預測性本身可作為描述系統(tǒng)復雜性的關(guān)鍵特征；其次，準確估計可預測性為預測算法研究提供了基準，幫助識別當前預測精度與理論極限之間的差距；更重要的是，可預測性研究往往需要開發(fā)新的理論和方法，進而激發(fā)更有效算法的設(shè)計。

關(guān)鍵詞：復雜系統(tǒng) (Complex Systems)，可預測性 (Predictability)，時間序列 (Time Series)，復雜網(wǎng)絡(luò) (Complex Networks)，動力學系統(tǒng) (Dynamical Systems)，極限 (Limits)

任筱芃丨作者

趙思怡丨審校

論文題目：Predictability of complex systems 論文鏈接：https://doi.org/10.1016/j.physrep.2026.01.001 發(fā)表時間：2026年1月21日論文來源：Physics Reports

楔子：拉普拉斯妖會夢見蝴蝶嗎？

1814年，皮埃爾-西蒙·拉普拉斯（Pierre-Simon Laplace）構(gòu)想出了被我們稱為物理學四大神獸之一的拉普拉斯妖。在它眼中，宇宙物似一座精密咬合的機械鐘表。因此，只要知曉某一時刻宇宙中所有原子的位置和動量，無論是過去最遙遠的沖動，還是未來最幽微的瞬間，都將如親臨般清晰可見。這種對機械唯物論的終極信仰，曾是科學界關(guān)于可預測性最完美的幻夢。

半個世紀前，愛德華·洛倫茲（Edward Lorenz）在計算機模擬的軌跡中發(fā)現(xiàn)了一只“蝴蝶”。這只“蝴蝶”在南美洲扇動幾下翅膀，也許能在兩周后的德克薩斯州掀起一場龍卷風。這一發(fā)現(xiàn)如同劈開了一道裂痕，擊碎決定論的虛假穹頂，將我們吸回了非線性與復雜相互作用構(gòu)成的真實世界里。微小的初始擾動足以在時間的長河中被指數(shù)級放大，讓確定性的邊界消散在混沌的迷霧中。

但復雜系統(tǒng)顯然并非完全不可捉摸的隨機游走，也非刻板僵硬的機械重復。它們在秩序與混沌的邊緣起舞，既有宏觀涌現(xiàn)的統(tǒng)計規(guī)律，又有微觀演化的內(nèi)生不確定性。在拉普拉斯妖的全知幻象與蝴蝶效應的混沌現(xiàn)實之間，認知的邊界究竟在何處？我們能否用一把數(shù)學的標尺，去丈量不可知域？

這就是復雜系統(tǒng)可預測性研究試圖回答的。

時間序列的可預測性：信息論視角

信息論方法的理論基礎(chǔ)

時間序列可預測性的研究最早可以追溯到信息論方法的應用，其核心在于建立熵與預測精度之間的定量關(guān)系。對于符號時間序列，研究者通過Fano不等式等形式化工具，將序列的熵與預測精度聯(lián)系起來，為預測精度的理論上界提供了信息論解釋。

圖1：熵S與可預測性Π之間的關(guān)系示意圖。曲線展示了Fano函數(shù)SF(p)在不同候選集大C下的變化趨勢。該函數(shù)具有單調(diào)遞減和凹函數(shù)的性質(zhì)，直觀地表明了熵（不確定性）越低，系統(tǒng)潛在的可預測性上限越高，且兩者之間呈現(xiàn)非線性關(guān)系。

Song等人提出的Fano縮放方法是該領(lǐng)域的重要里程碑。其核心創(chuàng)新在于通過結(jié)構(gòu)簡化真實狀態(tài)分布，構(gòu)建可解析處理的Fano函數(shù)，從而直接從序列熵估計預測精度的上界。

圖2：人類移動軌跡的熵分布與可預測性極限。 (a) 展示了45,000名用戶的實際熵S（橙色）、非相關(guān)熵Sunc（綠色）和隨機熵Srand（藍色）的分布；(b) 對應的可預測性分布，其中實際移動軌跡的最大可預測性Πmax（橙色）峰值約為0.93，顯著高于隨機基準；(c) 最大可預測性Πmax與用戶回轉(zhuǎn)半徑rg的關(guān)系，顯示當活動范圍超過10km后，可預測性穩(wěn)定在93%左右，表明無論活動范圍大小，人類行為均具有高度規(guī)律性；(d) 用戶在其 Top-? 最常訪問位置所花費的時間的一小部分——，用作上界Πmax的近似值。當 c=2 時，約為 0.6;隨著 c 的增加，近似以對數(shù)方式增長。

他們做了一個數(shù)學簡化，假設(shè)除了那個最可能發(fā)生的狀態(tài)之外，其余所有可能發(fā)生的狀態(tài)概率都是均等的。降低分布復雜度后，構(gòu)建出的可供計算的Fano函數(shù)讓我們能直接根據(jù)一段歷史數(shù)據(jù)的熵，并算出預測精度的上限。這種方法在人類移動性研究中取得了顯著成果，實證分析表明人類移動的可預測性可高達93%。

基于這一基礎(chǔ)框架，后續(xù)研究從多個方向進行了擴展。研究者們開發(fā)了基于可達性的候選集估計方法、考慮Top-?概率結(jié)構(gòu)的整合方法，以及符號序列與數(shù)值序列的統(tǒng)一處理框架。這些優(yōu)化方法有效收緊了可預測性上界，并提高了對實際數(shù)據(jù)的適用性。

圖3：在不同空間量化尺度與變化的時間采樣間隔下，總不同位置數(shù)與可達位置數(shù)的比較，展示了拓撲約束造成的差距。

在人類移動性預測中，傳統(tǒng)方法直接用歷史訪問過的不同位置數(shù)估計候選狀態(tài)空間C，但這會高估實際的可能狀態(tài)數(shù)，因為往往地理空間存在物理障礙、道路網(wǎng)絡(luò)具有拓撲約束。例如，重慶市的導航路線規(guī)劃就會常常出現(xiàn)相鄰兩點的實際路線距離可能有數(shù)公里。這種案例中往往體現(xiàn)了物理障礙和拓撲約束。因此，用可達位置數(shù)替代總不同位置數(shù)作為候選集大小C能顯著降低熵估計中的狀態(tài)空間維度，使可預測性估計Π更貼近真實理論極限

圖4：推薦系統(tǒng)中不同縮放形式對可預測性的影響。 (a) 用戶偏好項目的真實概率分布; (b) 經(jīng)典方法計算的 Top-? 可預測性; (c) 參考文獻中提出的縮放形式。

真實世界中用戶偏好物品的概率分布，是相對平滑地下降的。由圖4可見，經(jīng)典方法計算的簡化方式，把后面的概率均等分布，會導致預測上限被高估。而優(yōu)化后的縮放形式，精確保留了前幾個核心候選者的概率階梯，從而得出更貼近真實的預測上限。

早期的Fano縮放框架主要關(guān)注單一個體在孤立狀態(tài)下的歷史數(shù)據(jù)。然而，在真實的復雜系統(tǒng)中，個體的行為往往嵌入在社交網(wǎng)絡(luò)與復雜的外部環(huán)境之中。為了更精準地刻畫這些因素，研究者們將經(jīng)典熵模型進行了三種關(guān)鍵維度的拓展。

如果我們完全沒有某人的歷史數(shù)據(jù)，僅憑他朋友的行為，能預測他的未來嗎？研究者利用交叉熵量化了信息在社交網(wǎng)絡(luò)中的流動。基于Twitter數(shù)據(jù)的研究發(fā)現(xiàn)，僅依靠一個人最常互動的8-9個朋友的歷史發(fā)帖，就能恢復其高達95%的預測能力。后續(xù)研究進一步對比了“社交好友”與“無互動的時空伴隨者（同在某地的人）”，發(fā)現(xiàn)雖然社交關(guān)系攜帶的預測信息最強，但當大量非社交伴隨者的數(shù)據(jù)被聚合時，同樣能提供驚人的預測能力。這一發(fā)現(xiàn)不僅揭示了現(xiàn)代社交網(wǎng)絡(luò)中群體行為的高度耦合，也為數(shù)據(jù)匿名化和隱私保護敲響了警鐘。

圖5：社交關(guān)系與非社交共位者在交叉熵和可預測性方面的比較。(a) Weeplaces數(shù)據(jù)集中條件交叉熵的分布：Top-1社交關(guān)系（中位數(shù)8.17比特）、Top-1非社交共位者（中位數(shù)8.46比特）和Top-3非社交共位者（中位數(shù)8.02比特）；(b) 相應的可預測性分布：Top-1社交關(guān)系（中位數(shù)17.43%）、Top-1非社交共位者（中位數(shù)12.35%）和Top-3非社交共位者（中位數(shù)19.60%）；(c) 每個點代表一個自我中心用戶（ego），x軸表示Top-1好友的交叉熵，y軸表示Top-3共位者的累積交叉熵；黑色實線y = x表示相等；(d) 與(c)類似，但坐標軸顯示；(e) 在累積包含Top-10 alter后，交叉熵隨alter數(shù)量的變化，比較社交關(guān)系與非社交共位者。圓形表示包含自我歷史，三角形表示排除；(f) 相應的可預測性變化，水平線表示自我中心用戶的平均熵（5.80比特）和可預測性（47.05%）。誤差線表示均值±95%置信區(qū)間。

人類的行為不僅僅是時間的序列，更受到此在的約束。研究者提出了上下文熵的概念，將時間段（如早晨/傍晚）和地點類別（如住宅/辦公區(qū)）等外部情境信息作為約束條件引入熵的計算中。以紐約和東京的簽到數(shù)據(jù)為例，當引入情境條件后，行為序列的不確定性被大幅壓縮，使得推導出的整體熵值降低且分布更加集中。情境轉(zhuǎn)移下的可預測性顯著高于其他兩種方法，且表現(xiàn)出更強的集中性。這表明情境因素能夠大幅降低行為不確定性并提升可預測性。該趨勢在紐約和東京保持一致，證明了該方法在不同城市環(huán)境中具有通用性和魯棒性。

圖6：紐約市（NYC）和東京（TKY）用戶熵與可預測性分布的比較。(a)(c) 表兩種城市用戶在不同計算方法下的熵分布，包括SShannon（綠色虛線）、SReal（紅色實線）和（藍色點劃線）；(b)(d) 表相應的可預測性分布，包括 ∏Shannon、∏Real和。藍色、紅色和綠色曲線分別表示情境感知轉(zhuǎn)移、真實轉(zhuǎn)移和香農(nóng)熵假設(shè)下的概率密度函數(shù)。

傳統(tǒng)的基于壓縮算法的熵估計（如Lempel-Ziv）雖然有效，但缺乏直觀的物理解釋。為了打開這個黑盒，研究者引入了條件熵，并通過平穩(wěn)性（短時間內(nèi)停留在同一地點的連貫性）和規(guī)律性（長期訪問少數(shù)幾個偏好地點的集中度）這兩個直觀的特征來拆解個體的行為結(jié)構(gòu)。這種方法將純粹的數(shù)學上限轉(zhuǎn)化為可以被具體的行為習慣所解釋的指標，不僅讓預測模型的特征構(gòu)建更加透明，也理清了不同環(huán)境因素如何具體調(diào)節(jié)系統(tǒng)的不確定性。

基于復雜度的度量方法

前文提到的基于Fano縮放的信息論方法，主要針對狀態(tài)有限且可枚舉的“符號序列”（例如人類移動的有限個地點）。然而在真實世界中，許多復雜系統(tǒng)產(chǎn)生的數(shù)據(jù)是連續(xù)的數(shù)值序列（如降水量、股票價格、腦電波信號等）。對于這類數(shù)據(jù)，潛在的狀態(tài)空間是無限的，如果強行進行離散化處理，不可避免地會造成信息丟失。

那么，如何在不關(guān)心具體數(shù)值大小的情況下，僅憑“漲跌模式”就能判斷一個序列的可預測性？

排列熵巧妙地避開了具體數(shù)值的絕對大小，轉(zhuǎn)而關(guān)注局部數(shù)據(jù)點順序的重復性。數(shù)學上的簡化就是忽略數(shù)據(jù)的絕對數(shù)值，只保留相鄰數(shù)據(jù)點的相對大小關(guān)系。具體而言，對于一個由連續(xù)數(shù)值構(gòu)成的時間序列，排列熵首先將序列劃分為若干長度為m的滑動窗口；在每個窗口內(nèi)，只關(guān)心第一個點是否比第二個點大。如果一個序列的局部漲跌模式不斷重復出現(xiàn)，說明其規(guī)律性強、隨機性低，預測潛力就大；反之，如果各種排列模式出現(xiàn)的概率都差不多，序列就更接近隨機過程，難以預測。研究者將標準化排列熵的補數(shù)（1?Sperm）直接作為可預測性的量化指標。例如，在對美國多個州數(shù)十年的傳染病（如麻疹、流感等）數(shù)據(jù)進行分析時，研究人員使用排列熵挖掘了一個動態(tài)規(guī)律。疾病的可預測性并不是固定不變的，而是在爆發(fā)早期極高，隨后迅速衰減并趨于穩(wěn)定。在相同的時間點（16周）上，不同疾病的可預測性存在顯著差異——麻疹（Measles）的中位數(shù)明顯高于流感（Influenza），這表明疾病的內(nèi)在傳播特性深刻影響其預測潛力。進一步研究發(fā)現(xiàn)，這種可預測性衰減的速度，主要是由疾病的“基本傳染數(shù)（R0）”驅(qū)動的。R0現(xiàn)在已經(jīng)成為被廣泛接受的重要流行病學指標，為疫情早期預警提供理論依據(jù)。

圖7：美國各州九種傳染病的可預測性分析。(a) 平均可預測性(1-Sperm)隨時間序列長度的變化，曲線表示均值，陰影區(qū)域表示跨州和跨起始時間的四分位距。黑色實線代表SIR模型的中位排列熵。深棕色虛線標記(b)圖所選的16周時間點。(b) 4個月（16周）時不同疾病的可預測性分布。箱線圖表示中位數(shù)、四分位距和全距。結(jié)果表明，盡管各疾病隨時間的可預測性趨勢一致，但在同一時間點上存在顯著水平差異。

κ指數(shù)（κ-index）的核心思路源于另一個思路——如果一個序列真的蘊含可預測的規(guī)律，那么打亂它的順序，預測難度應該會顯著增加。想象把一首維瓦爾第的《冬》音符順序完全打亂，控制同一位小提琴家演奏，你肯定能聽出區(qū)別，因為原曲的旋律結(jié)構(gòu)被破壞了。但如果是一段白噪音，打亂與否毫無影響，因為它本就沒有可復用的結(jié)構(gòu)。是用原始真實序列與被完全隨機打亂順序的序列作為對照，檢驗同一預測算法對它們的可預測性差異。具體做法是對原始序列做一步預測，得到預測誤差序列 e1；再把序列元素順序完全打亂，用同樣的方法預測并得到誤差序列 er。隨后比較兩者的誤差強度（以平方誤差和度量），并定義。

直觀上，如果原始序列確實蘊含穩(wěn)定結(jié)構(gòu)、高度可預測，那么在原始序列上的誤差會顯著小于被打亂序列上的誤差，于是，誤差會遠小于隨機打亂后的誤差，此時κ值趨近于1；相反，如果原始序列本身接近隨機噪聲，打亂與否對預測難度幾乎沒有影響，誤差相近，此時κ值趨近于0。早期的 κ 指數(shù)會受到序列長度影響。序列越長，誤差平方和的尺度效應越明顯。為降低這一干擾，后續(xù)工作引入滑動窗口，在局部窗口內(nèi)計算 κ 并取平均；同時在定義中采用平方根修正（上式中的 1/2 次冪），以改善數(shù)值尺度與區(qū)分度。

在金融市場的測試中，改進后的 κ 表現(xiàn)出較強的分辨力：它能把理論上近乎完全確定的動力學序列（κ 接近 1）與純隨機游走（約 0.140）清晰區(qū)分開；而真實股票價格序列通常落在兩者之間，例如通用電氣約為 0.415，反映出其部分可預測、部分隨機的混合特征。

與貝葉斯錯誤率的等價性

傳統(tǒng)的基于熵的可預測性估計方法雖然經(jīng)典，但往往暗含馬爾可夫假設(shè)，難以捕捉序列中的長距離依賴，且對短序列數(shù)據(jù)非常敏感，容易產(chǎn)生明顯的估算偏差。為了克服這些局限，研究人員將時間序列的預測問題，巧妙地轉(zhuǎn)化為一個多分類問題。

具體而言，我們可以把系統(tǒng)“過去的歷史狀態(tài)”看作分類任務中的輸入特征，把“下一個即將出現(xiàn)的狀態(tài)”看作需要預測的分類標簽。在分類理論中，貝葉斯錯誤率（Bayes Error Rate，簡稱 BER，記為RB）代表了在現(xiàn)有信息下最完美的理想分類器的最低錯誤率極限。時間序列可預測性與貝葉斯錯誤率之間存在嚴格等價關(guān)系，Π=1?RB，這一發(fā)現(xiàn)豐富了理論框架，也為算法設(shè)計提供了新的指導原則。這種等價性表明，可預測性極限可以理解為分類任務的最優(yōu)可達性能，為通過非參數(shù)估計近似可預測性極限提供了替代路徑。

圖8：基于熵的方法與 BER 啟發(fā)式方法在三種序列生成器下的可預測性估計比較。(a, c) 分別為第一和第二個生成器下，基于熵的方法隨序列長度 n 變化的結(jié)果。(b, d) 在相同生成器下，基于熵的方法與 BER 啟發(fā)式方法的性能比較，其中和表示下界和上界，代表估計值，陰影區(qū)域表示BER方法優(yōu)于基于熵的方法的區(qū)域。(e) 第三個生成器在N = 20固定時，改變參數(shù)r的結(jié)果。(f) 第三個生成器在r = 3固定時，改變C的結(jié)果。所有結(jié)果在n = 215時經(jīng)過10次獨立運行平均，陰影區(qū)域表示標準誤。

如上圖所示，通過三個具有解析真實值的合成生成器（用于測試序列長度影響的一步馬爾可夫鏈、用于測試狀態(tài)空間大小的兩步依賴空間、以及用于測試復雜依賴的多步記憶+隨機擾動），新方法展現(xiàn)出了顯著的優(yōu)勢。即便是在面對具有復雜長短期依賴關(guān)系的第三種生成器時（圖8e、f），BER 方法依然保持了極高的準確性和魯棒性。

然而，上述方法——無論是基于熵的信息論框架，還是基于分類錯誤的BER方法——都隱含了一個關(guān)鍵假設(shè)：觀測對象是孤立的時間序列。但在真實世界中，個體的行為往往嵌入在復雜的關(guān)系網(wǎng)絡(luò)之中。一個人的移動模式受社交關(guān)系影響，一個物種的種群動態(tài)受食物鏈位置約束，一個金融變量的波動受市場關(guān)聯(lián)結(jié)構(gòu)驅(qū)動。當我們把視角從單點時間演化擴展到“多點相互作用結(jié)構(gòu)”時，可預測性的分析框架也需要相應升級。這就引出了復雜網(wǎng)絡(luò)可預測性研究的核心問題，即網(wǎng)絡(luò)的結(jié)構(gòu)本身，能否告訴我們它未來演化的可預測程度？

復雜網(wǎng)絡(luò)的可預測性：結(jié)構(gòu)分析與譜方法

復雜網(wǎng)絡(luò)的基礎(chǔ)概念

復雜網(wǎng)絡(luò)由節(jié)點和邊組成，用于表示多體相互作用系統(tǒng)。復雜網(wǎng)絡(luò)研究關(guān)注網(wǎng)絡(luò)結(jié)構(gòu)、動力學過程以及結(jié)構(gòu)與功能的關(guān)系。復雜網(wǎng)絡(luò)理論為理解復雜系統(tǒng)提供了重要工具。鏈路預測是復雜網(wǎng)絡(luò)研究中的一個重要問題，旨在預測網(wǎng)絡(luò)中可能存在的連邊，基于網(wǎng)絡(luò)結(jié)構(gòu)、節(jié)點屬性和已存在的連邊信息進行推斷。鏈路預測在社會網(wǎng)絡(luò)、生物網(wǎng)絡(luò)和通信網(wǎng)絡(luò)等領(lǐng)域有廣泛應用。

圖9：與網(wǎng)絡(luò)可預測性相關(guān)的研究概述。每個方框代表一項具有代表性的工作。

如何量化一個網(wǎng)絡(luò)的可預測性？研究者們從譜方法、信息論和結(jié)構(gòu)分析三個視角，發(fā)展出了七類代表性方法：

結(jié)構(gòu)一致性（Structural Consistency）通過微擾網(wǎng)絡(luò)結(jié)構(gòu)觀察特征向量穩(wěn)定性量化網(wǎng)絡(luò)對結(jié)構(gòu)變化的魯棒性、
網(wǎng)絡(luò)譜（Network Spectrum）利用譜隙和子圖中心性刻畫網(wǎng)絡(luò)模塊化程度、
網(wǎng)絡(luò)能量（Network Energy）通過特征值絕對值之和度量網(wǎng)絡(luò)整體活性與穩(wěn)定性、
壓縮長度（Compressed Length）基于無損壓縮算法評估網(wǎng)絡(luò)結(jié)構(gòu)的可壓縮性、
熵率（Entropy Rate）度量網(wǎng)絡(luò)演化序列的漸近不確定性、
結(jié)構(gòu)規(guī)律性（Structural Regularity）統(tǒng)計局部重復子圖模式以反映網(wǎng)絡(luò)組織的規(guī)則性、
結(jié)構(gòu)可控性（Structural Controllability）從控制理論角度分析通過少量節(jié)點驅(qū)動網(wǎng)絡(luò)的能力。

這些方法分別從譜方法、信息論和結(jié)構(gòu)方法視角量化了網(wǎng)絡(luò)的內(nèi)在規(guī)律性。

譜方法與網(wǎng)絡(luò)結(jié)構(gòu)分析

譜方法通過分析網(wǎng)絡(luò)鄰接矩陣或拉普拉斯矩陣的特征值和特征向量，揭示了網(wǎng)絡(luò)結(jié)構(gòu)的內(nèi)在模態(tài)特性。結(jié)構(gòu)一致性（Structural Consistency）分析通過比較不同時間步或不同條件下的網(wǎng)絡(luò)譜特征，來評估網(wǎng)絡(luò)結(jié)構(gòu)的穩(wěn)定性和可預測性。

圖10：計算網(wǎng)絡(luò)結(jié)構(gòu)一致性的過程示意圖。 (a) 為給定網(wǎng)絡(luò)，藍色虛線鏈路構(gòu)成擾動集 ?E = {(5, 8), (6, 9)}（對應?A），實線鏈路構(gòu)成集合 ER（對應AR）；(b) 為給定網(wǎng)絡(luò)的鄰接矩陣A，每個方格中的數(shù)字為相應矩陣元素的值。黑色和藍色方格分別代表 ER 和 ?E 中的鏈路。為計算一致性，我們用 ?A 對 AR 進行擾動。擾動后的矩陣 ? 如(c)所示，由此導出擾動網(wǎng)絡(luò)；(d)，其中紅色虛線為按照 ? 中對應值降序排列后從 U ? ER 中選出的結(jié)果鏈路。由于 ?E 中有兩條鏈路，故 L = 2，集合 EL = {(3, 8), (6, 9)}。在此例中，兩條藍色鏈路僅有一條通過擾動被恢復，因此 σc = 0.5。

如上圖所示，如果網(wǎng)絡(luò)結(jié)構(gòu)具有內(nèi)在規(guī)律性，那么對網(wǎng)絡(luò)進行微小擾動后，其拓撲特征應保持相對穩(wěn)定。σc = 0.5表示50%的擾動邊能被正確恢復，反映了該網(wǎng)絡(luò)具有中等程度的結(jié)構(gòu)一致性和可預測性。

然而，一致性只能告訴我們網(wǎng)絡(luò)對擾動的敏感度，無法揭示敏感的內(nèi)在來源。是整體拓撲的規(guī)則性，還是局部模體的重復？這就需要我們從更全局的視角審視網(wǎng)絡(luò)結(jié)構(gòu)。

網(wǎng)絡(luò)譜（Network Spectrum）可以理解為網(wǎng)絡(luò)的結(jié)構(gòu)指紋，包含了網(wǎng)絡(luò)整體連接強度與全局耦合模式，為預測提供了理論依據(jù)。譜信息里特征值之間的間隔（譜隙）往往蘊含了網(wǎng)絡(luò)的模態(tài)分布與拓撲穩(wěn)定性等深層線索，因此可以被用來把網(wǎng)絡(luò)是否足夠的魯棒性轉(zhuǎn)化為可計算的指標，從而間接衡量潛在鏈路的可預測性。

以蛋白質(zhì)相互作用網(wǎng)絡(luò)為例。當譜隙較大時，網(wǎng)絡(luò)存在清晰分離的模塊結(jié)構(gòu)，蛋白質(zhì)之間的相互作用集中在若干功能簇內(nèi)，跨簇的連邊較少且更可預測；當譜隙接近零時，網(wǎng)絡(luò)呈現(xiàn)連續(xù)譜特征，模塊邊界模糊，連邊出現(xiàn)的隨機性更強，可預測性更低。因此，譜隙可以被用來把網(wǎng)絡(luò)的模塊化程度轉(zhuǎn)化為可計算的指標，從而間接衡量潛在鏈路的可預測性。

圖11：模型網(wǎng)絡(luò)在不同網(wǎng)絡(luò)規(guī)模 N 下的可預測性 σs 隨參數(shù) α 的變化關(guān)系。

研究者進一步基于譜隙構(gòu)造可預測性指標 σs∈[0,1]。即當網(wǎng)絡(luò)的譜結(jié)構(gòu)更接近理想化的一致的情形時，偏離量趨近于 0，σs 就趨近于 1，表示鏈路更可預測；反之則更不可預測。該指標在廣義 BA 模型上用參數(shù) α 控制結(jié)構(gòu)規(guī)則性（α 越大網(wǎng)絡(luò)越規(guī)則）。顯示隨著 α 增大，σs 整體上升，說明譜方法能夠有效捕捉網(wǎng)絡(luò)演化過程中規(guī)則性與可預測性的正相關(guān)性。

譜隙為我們提供了全局模塊化程度的度量，但它是一維投影。所以，當網(wǎng)絡(luò)演化涉及復雜的局部重構(gòu)時，單一標量可能掩蓋關(guān)鍵細節(jié)。能否找到一個同時反映全局強度和局部穩(wěn)定性的綜合指標？

網(wǎng)絡(luò)能量（Network Energy）把網(wǎng)絡(luò)的譜信息壓縮成一個全局標量。對無向無權(quán)圖G，其值等于鄰接矩陣所有特征值絕對值之和，，用于量化網(wǎng)絡(luò)的整體強度和分布特征。其變化趨勢可反映網(wǎng)絡(luò)演化的動態(tài)過程。但原始的 E(G) 不僅受拓撲形態(tài)影響，還會隨節(jié)點數(shù) N、邊數(shù) M 的規(guī)模變化而顯著漂移，因此不適合跨網(wǎng)絡(luò)直接比較。

圖12：不同網(wǎng)絡(luò)規(guī)模下的原始網(wǎng)絡(luò)能量與歸一化網(wǎng)絡(luò)能量。(a) 不同規(guī)模的 ER 網(wǎng)絡(luò)的網(wǎng)絡(luò)能量 E(G)；(b) 不同規(guī)模的無標度網(wǎng)絡(luò)的網(wǎng)絡(luò)能量 E(G)；(c) 不同規(guī)模的 ER 網(wǎng)絡(luò)的歸一化能量；(d) 不同規(guī)模的無標度網(wǎng)絡(luò)的歸一化能量。

能量指標的優(yōu)勢在于全局簡潔，但簡潔的代價是信息損失——兩個能量相同的網(wǎng)絡(luò)，可能具有完全不同的預測特性。為消除這些外在規(guī)模因素，Chai等人引入了歸一化能量，其中 Emax(G) 是在相同 N,M 約束下可達到的最大能量上界。這樣一來，如圖12所示，網(wǎng)絡(luò)越規(guī)則，越小；越隨機，越大。

基于這一單調(diào)關(guān)系，作者進一步轉(zhuǎn)寫，并提出融合版指標，將“全局譜強度”（能量）與“局部擾動穩(wěn)定性”（結(jié)構(gòu)一致性 σc）結(jié)合，以獲得更豐富的預測證據(jù)。

圖13：真實網(wǎng)絡(luò)與模型網(wǎng)絡(luò)中，三種可預測性指標與預測效果之間的關(guān)系。縱軸為鏈路修正預測算法（LCPA）的 Precision（該算法基于隨機擾動與結(jié)構(gòu)一致性，具體流程見文獻 [260]），橫軸為網(wǎng)絡(luò)可預測性指標。 (a)–(c) 分別展示在真實網(wǎng)絡(luò)上的表現(xiàn)；(d)–(f) 分別展示在 ER 網(wǎng)絡(luò)上的表現(xiàn)。每個點為 10 次獨立實驗結(jié)果的平均值，黑色實線為散點圖的線性擬合曲線。

對應到上圖，橫軸取等可預測性指標，無論在真實網(wǎng)絡(luò)還是 ER 模型網(wǎng)絡(luò)中，這些指標與可達到的預測精度都呈現(xiàn)出清晰的正相關(guān)并線性擬合，說明“網(wǎng)絡(luò)能量→歸一化→反比映射”的路線不僅是定義上的方便，更能在實驗上對網(wǎng)絡(luò)的結(jié)構(gòu)可預測性提供有效刻畫。

信息論視角的網(wǎng)絡(luò)可預測性

如果譜方法是從"數(shù)學結(jié)構(gòu)"提取指紋，壓縮長度（Compressed length）則是從"信息冗余"角度評估規(guī)律性。其核心思路是把網(wǎng)絡(luò)結(jié)構(gòu)當作一段可以被重編碼的數(shù)據(jù)，試圖在不丟失信息的前提下壓縮它。越有規(guī)律的結(jié)構(gòu)越可壓縮；有重復的局部模式、穩(wěn)定的組織方式會帶來更高的壓縮效率。例如先將網(wǎng)絡(luò)拓撲按既定規(guī)則編碼為二進制字符串，再用無損壓縮算法得到其最短壓縮長度，作為網(wǎng)絡(luò)的結(jié)構(gòu)復雜度表征。壓縮長度方法壓縮效率越高，說明網(wǎng)絡(luò)結(jié)構(gòu)越具有規(guī)律性，越容易被預測。網(wǎng)絡(luò)結(jié)構(gòu)的壓縮長度反映了其規(guī)律性和復雜性，為評估網(wǎng)絡(luò)可預測性提供了信息論視角。

圖14：拓撲編碼（topological encoding）的一個示例。令 v 為第 t 步中被選中進行編碼的節(jié)點，Pt 為第 t 步之后其余節(jié)點集合的劃分。在編碼開始時，我們先任意選擇一個節(jié)點。例如，如右側(cè)表格所示，選擇節(jié)點 a 作為起點。首先將其鄰居數(shù)用二進制表示：由于 ka=2，且節(jié)點 a 所屬集合 P0-{a} 的元素個數(shù)為 |U|=7，因此需要位二進制數(shù)來表示，得到二進制串 “010”。隨后，根據(jù)其余節(jié)點是否為 a 的鄰居，把它們分成兩組：{b,c} 與 {d,e,f,h,g}，至此完成對節(jié)點 a 的編碼。接著，從 a 的鄰居中選擇新節(jié)點繼續(xù)編碼，例如選擇節(jié)點 b。同樣地，我們把兩個數(shù)字寫成二進制：分別是 b 在前述兩組中的鄰居數(shù)量。由于 b 在集合 {b,c} 中有 1 個鄰居、在集合 {d,e,f,h,g} 中有 2 個鄰居，對應編碼分別為 “1” 和 “010”。然后，再依據(jù)節(jié)點是否同時與 a 和 b 相鄰，把剩余節(jié)點進一步劃分為（去掉空集后）4 個組，從而完成對節(jié)點 b 的編碼。按照同樣流程，依次對網(wǎng)絡(luò)中的每個節(jié)點進行編碼，直到所有節(jié)點都處理完畢。編碼過程中，長度超過 1 bit 的編碼項（即 1\n"},"displayMode":"inline","viewType":"inline"}}">|U|>1）被追加到序列 B1，長度恰為 1 bit 的編碼項，即 |U|=1，被追加到序列 B2。經(jīng)過 8 步后，B1 與 B2 分別為 01001001001000 與 111111。

這一指標背后是符合工程直覺的，越有規(guī)律的結(jié)構(gòu)越可壓縮。有重復的局部模式、穩(wěn)定的組織方式會帶來更高的壓縮效率，從而使壓縮長度更短；越隨機的網(wǎng)絡(luò)越接近不可壓縮，其壓縮長度更長。

圖15：網(wǎng)絡(luò)壓縮（network compression）的過程。 (a) 打亂（shuffled）網(wǎng)絡(luò)的最短壓縮長度。這里的打亂操作是：從原始網(wǎng)絡(luò)中隨機挑選一定比例（Randomness fraction）的連邊并將其隨機重連。隨著 Randomness 增大，壓縮長度單調(diào)上升；當 Randomness = 1 時，網(wǎng)絡(luò)在性質(zhì)上與對應的 ER 網(wǎng)絡(luò)相同。 (b) 代謝網(wǎng)絡(luò)（Metabolic network）中 ri 的分布。這里使用 RA 指標（RA index）進行預測，每個柱子的寬度等于網(wǎng)絡(luò)規(guī)模 N。 (c) BPAA 的性能熵 SBPAA 與連邊打亂比例 Randomness 的關(guān)系。可以看到三種網(wǎng)絡(luò)都呈現(xiàn)與 (a) 相似的單調(diào)趨勢。每條曲線為 50 次仿真的平均值，陰影區(qū)域表示標準差。與代謝網(wǎng)絡(luò)具有相同節(jié)點數(shù)與連邊數(shù)的 ER 網(wǎng)絡(luò)中 ri 的分布。

通過隨機重連逐步打亂網(wǎng)絡(luò)來驗證。隨著打亂比例上升，網(wǎng)絡(luò)的壓縮長度單調(diào)增加。當將所有的連邊隨機重連時，網(wǎng)絡(luò)在性質(zhì)上趨近同規(guī)模的 ER 隨機網(wǎng)絡(luò)。壓縮長度不僅能區(qū)分“有序—隨機”的結(jié)構(gòu)連續(xù)譜，還能與預測任務的可達性能對齊。F隨著結(jié)構(gòu)被打亂，基于 BPAA 的性能熵 SBPAA 也呈現(xiàn)與壓縮長度相似的單調(diào)退化趨勢。

壓縮效率高的網(wǎng)絡(luò)確實更可預測，但壓縮行為本身不告訴我們哪些局部模式最值得復用。對于時序演化的網(wǎng)絡(luò)，我們需要更動態(tài)的視角。

網(wǎng)絡(luò)的熵率（Entropy Rate）量化了網(wǎng)絡(luò)結(jié)構(gòu)的不確定性和復雜性。熵率越低，說明網(wǎng)絡(luò)的時空演化中存在更多可復用的規(guī)律與重復模式，未來狀態(tài)對過去更可推斷。熵率越高，則網(wǎng)絡(luò)更接近隨機過程，結(jié)構(gòu)變化更難預測。基于這一點，熵率不僅能作為復雜性的度量，還能進一步用于推導時序網(wǎng)絡(luò)預測準確率的理論上限，從而同時回答能否預測和預測精度這兩個問題

圖16：量化時序網(wǎng)絡(luò)（Temporal network）可預測性的過程。(a) 展示了一個包含四個節(jié)點的時序網(wǎng)絡(luò)隨時間的演化過程；(b-c) 通過二維矩陣記錄每一對潛在連邊在不同時間快照中的狀態(tài)，并過濾掉極少出現(xiàn)的連邊以保留核心演化結(jié)構(gòu)；(d) 利用信息論中的壓縮算法原理，在時空矩陣中尋找局部模式的重復規(guī)律，以此來計算熵率并推導出該時序網(wǎng)絡(luò)預測準確率的理論上限。

結(jié)構(gòu)方法與網(wǎng)絡(luò)可控性

結(jié)構(gòu)規(guī)律性（Structural Regularity）通過量化網(wǎng)絡(luò)中存在的模式、周期性和其他結(jié)構(gòu)特征來評估其可預測性。規(guī)律性越高的網(wǎng)絡(luò)結(jié)構(gòu)，其可預測性通常也越高。復雜網(wǎng)絡(luò)的拓撲結(jié)構(gòu)中，往往普遍存在著局部重復的子圖模式。一個直觀的驗證方式是合成時序網(wǎng)絡(luò)實驗。

圖17：(a) 合成時序網(wǎng)絡(luò)（synthetic temporal networks）。為研究網(wǎng)絡(luò)拓撲對可預測性的影響，采用一個演化小世界網(wǎng)絡(luò)模型：第一個快照為環(huán)形網(wǎng)絡(luò)；之后每一步的網(wǎng)絡(luò)拓撲，都由對前一快照中一定比例 p 的連邊進行隨機重連得到。 (b) 合成時序網(wǎng)絡(luò)的可預測性。展示演化小世界網(wǎng)絡(luò)的可預測性隨重連概率變化的結(jié)果。網(wǎng)絡(luò)由 (a) 所示模型生成，節(jié)點數(shù)為 50，平均度為 2。結(jié)構(gòu)一致性（Structural consistency）是一種已有的可預測性度量，我們在“結(jié)構(gòu)一致性（Structural Consistency）”小節(jié)中已作介紹。

從環(huán)形網(wǎng)絡(luò)出發(fā)，每一步對上一時刻的一部分連邊以概率 p 進行隨機重連。此時 p 就相當于“打亂通路”——p 越大，結(jié)構(gòu)越隨機、可復用模式越少；因此網(wǎng)絡(luò)可預測性會隨 p 增大而下降。

在真實復雜網(wǎng)絡(luò)中，這種可復用模式往往表現(xiàn)為大量局部重復的子圖結(jié)構(gòu)（例如相似的三角閉合等）。Xian等人提出了一種基于“低秩稀疏表示”的方法來刻畫這種局部模式的重復性。簡單來說，這種方法試圖找出一個包含少數(shù)幾個核心子圖的包，看看整個網(wǎng)絡(luò)能否由這些核心子圖通過線性組合來還原。如果一個網(wǎng)絡(luò)能夠被少數(shù)幾塊子圖高效地表示，說明它的結(jié)構(gòu)規(guī)律性極強、冗余度高，其未來連邊的演化就會表現(xiàn)出高度的可預測性。實驗證明，這種結(jié)構(gòu)規(guī)律性指標與鏈路預測算法的準確率之間存在顯著的線性關(guān)系，它不僅能衡量網(wǎng)絡(luò)的可預測性上限，還能順便幫我們找出網(wǎng)絡(luò)演化過程中最具代表性的“預制板”。

結(jié)構(gòu)可控性（Structural Controllability）從控制論角度研究網(wǎng)絡(luò)結(jié)構(gòu)，探討通過控制少量節(jié)點來完全驅(qū)動網(wǎng)絡(luò)狀態(tài)的能力。如何通過向最少數(shù)量的驅(qū)動節(jié)點輸入外部信號，來實現(xiàn)對整個網(wǎng)絡(luò)狀態(tài)的完全控制。在這個框架下，網(wǎng)絡(luò)中的連邊被分為兩類。一類是關(guān)鍵連邊（一旦移除就會導致所需的驅(qū)動節(jié)點數(shù)量增加），另一類是普通連邊。 Jing等人巧妙地將可控性與可預測性聯(lián)系了起來，并得出了一個略顯反直覺的深刻結(jié)論。盡管關(guān)鍵連邊對于維持網(wǎng)絡(luò)的全局控制至關(guān)重要，但它們的預測難度往往顯著高于普通連邊。這種現(xiàn)象揭示了網(wǎng)絡(luò)在結(jié)構(gòu)控制能力與演化路徑可預測性之間存在著一種負向調(diào)節(jié)的耦合關(guān)系（通過結(jié)構(gòu)互惠指數(shù)SRI來量化）。這告訴我們，網(wǎng)絡(luò)中承擔核心信息傳輸和結(jié)構(gòu)支撐的骨干要素，往往也是最難被常規(guī)算法預測到的部分。

圖18：八個真實網(wǎng)絡(luò)與 ER 網(wǎng)絡(luò)的基本拓撲統(tǒng)計量。其中，N 與 M 分別表示節(jié)點數(shù)與連邊數(shù)，M(·) 中的 (·) 表示關(guān)鍵連邊（critical links）的數(shù)量。為數(shù)據(jù)稀疏度（data sparsity）。〈k〉為平均度。C 為聚類系數(shù)。〈d〉為弱連通網(wǎng)絡(luò)中所有節(jié)點對的平均距離；符號 “–” 表示該網(wǎng)絡(luò)不連通。r 為同配系數(shù)（assortativity coefficient）。SRI 為結(jié)構(gòu)互惠指數(shù)（structural reciprocity index）的取值。

借由這些工具，我們由此得知一個網(wǎng)絡(luò)的算法復雜度、可壓縮性。但復雜系統(tǒng)的本質(zhì)特征在于其演化動態(tài)。網(wǎng)絡(luò)結(jié)構(gòu)會隨時間變化，連邊會生成與消失，節(jié)點會敲入與敲出。當我們追問結(jié)構(gòu)將如何隨時間變化時，就觸及了一個更深層的問題，即支配系統(tǒng)演化的動力學規(guī)則本身，具有多大的可預測性？這要求我們適應靜態(tài)結(jié)構(gòu)分析與動態(tài)過程建模并行不悖的研究方式。

動力學的可預測性：從經(jīng)典理論到AI方法

時間序列告訴我們“系統(tǒng)有多不確定？”，網(wǎng)絡(luò)理論告訴我們關(guān)系結(jié)構(gòu)有多規(guī)則。“但如果我們要追問"誤差會如何隨時間放大？”、“預測窗口為何有限？”，就需要第三種視角——動力學系統(tǒng)的相空間。

經(jīng)典動力學可預測性方法

動力學可預測性關(guān)注的是在已知系統(tǒng)當前狀態(tài)的條件下，我們能在多長時間尺度內(nèi)、以多高精度預測其未來演化。需要強調(diào)的是，即使系統(tǒng)的演化規(guī)則是確定性的，非線性耦合與對初始條件的敏感性也可能導致誤差快速放大，從而顯著壓縮預測提前期并降低長期預測精度。這一類研究的核心動機包括：為任意預測算法提供理論上界、將可預測性作為系統(tǒng)復雜度的關(guān)鍵表征、以及在可預測性顯著變化時捕捉潛在的狀態(tài)轉(zhuǎn)折信號。與此同時，在實際預測任務中，模型誤差、觀測噪聲與系統(tǒng)高維性會進一步放大預測難度，使得如何精確界定并有效提升可預測性成為復雜系統(tǒng)研究的核心挑戰(zhàn)之一。

經(jīng)典研究通常圍繞三類理論框架展開：信息論方法（Information-theoretic approaches）、動力學系統(tǒng)理論（Dynamical systems theory）與統(tǒng)計分析方法（Statistical analysis）。

信息論方法將系統(tǒng)演化視為信息產(chǎn)生與傳遞過程，利用熵、熵率等指標量化不確定性及其增長速度。

動力學系統(tǒng)理論從相空間結(jié)構(gòu)與穩(wěn)定性出發(fā)，通過軌道發(fā)散、吸引子幾何等性質(zhì)理解預測誤差的演化規(guī)律。

統(tǒng)計分析方法將系統(tǒng)觀測視為隨機過程的實現(xiàn)，借助統(tǒng)計特征與相關(guān)結(jié)構(gòu)評估可預測性并構(gòu)造可用的預測量。

信息論方法

熵和互信息提供了不確定性的量級，但不告訴我們?yōu)槭裁措y預測。熵值高可能源于混沌，也可能源于噪聲；互信息低可能源于非線性耦合，也可能源于觀測不足。要打開這個黑盒，理解誤差增長的內(nèi)在機制，我們需要進入相空間，從幾何結(jié)構(gòu)出發(fā)分析系統(tǒng)的穩(wěn)定性與發(fā)散特性。

信息論視角將動力學系統(tǒng)的演化理解為信息的產(chǎn)生、壓縮與傳遞。即系統(tǒng)狀態(tài)隨時間推進，不確定性會被放大或被約束，而這種變化本身就對應可預測性的上限與衰減速度。因而，信息論方法通常圍繞不確定性邊界、增長速率、信源三個問題來刻畫可預測性。

在這一框架下，香農(nóng)熵（Shannon entropy）用來度量系統(tǒng)狀態(tài)本身的不確定性，熵率（entropy rate）則刻畫單位時間產(chǎn)生的新信息量。二者共同指向序列的復雜度與長期預測的困難程度。對確定性系統(tǒng)而言，科爾莫戈羅夫-西奈熵（Kolmogorov–Sinai entropy，KS熵）可以被理解為信息產(chǎn)生率，即KS熵越大，預測誤差累積越快，并且其量級與最大可預測時間尺度近似呈反比關(guān)系，這使得它成為連接動力學混沌與預測上限的一把信息論標尺。在更貼近預測任務的表述中，條件熵強調(diào)當下新增且無法由過去預測的信息，而信息存儲則對應當下仍可由過去解釋的那部分信息，后者往往更直接指向系統(tǒng)的可預測結(jié)構(gòu)（但也更容易受長程相關(guān)影響）。

當研究從單變量走向多變量或耦合系統(tǒng)時，信息來源及其流動方向會變成可預測性的關(guān)鍵。互信息（Mutual Information，MI）通過比較聯(lián)合分布與邊緣分布乘積來刻畫變量之間的非線性依賴，但由于它是對稱量，無法區(qū)分因果方向。時間延遲互信息（Time-Delayed Mutual Information，TDMI）通過引入時間滯后，把依賴結(jié)構(gòu)投影到時間軸上。其衰減速率常被用來衡量系統(tǒng)的有效記憶長度與可用的預測提前期，因此在多領(lǐng)域時間序列分析中被頻繁使用。進一步地，傳遞熵（Transfer Entropy，TE）建立在條件互信息之上，度量的是“已知另一個變量的過去”能在多大程度上減少對目標變量未來的不確定性，從而同時刻畫信息流的強度與方向，并幫助識別系統(tǒng)中的信息源與驅(qū)動關(guān)系。它關(guān)注的是變量 A 的歷史是否真正改善了對變量 B 未來的預測，因此更適合用于復雜系統(tǒng)中的因果依賴探索。

需要注意的是，信息論量的價值往往與可估計性緊密綁定。因此在高維變量、樣本稀疏或噪聲較強等情形下，傳統(tǒng) TE 估計器（如直方圖、核密度、kNN）容易出現(xiàn)不穩(wěn)定和顯著偏差，限制了其在動力學建模與預測中的適用范圍。為緩解這一問題，原文提到一種基于P-F轉(zhuǎn)移算子（Perron–Frobenius transfer operator）的估計思路。不直接去擬合高維聯(lián)合分布，利用系統(tǒng)動力學誘導的狀態(tài)轉(zhuǎn)移結(jié)構(gòu)來間接獲得吸引子上的不變測度，并據(jù)此計算熵與傳遞熵。同時，數(shù)據(jù)預處理在熵類指標估計中并非錦上添花。去趨勢、標準化等操作可以顯著降低非平穩(wěn)性對估計的干擾，提高結(jié)果的可比性與可信度。

圖19：不同條件下熵度量及其推薦估計器。在此表中，Xt 表示系統(tǒng)當前時刻的狀態(tài)變量，X＜t 表示其過去狀態(tài)的集合，p(x) 是系統(tǒng)狀態(tài)的概率分布函數(shù)，S(·) 表示熵，S(X|Y）表示給定 Y 條件下 X 的條件熵，I(X;Y）表示變量 X 與 Y 之間的互信息。

該表系統(tǒng)比較了三種熵類指標——熵 S(X）、條件熵 C(X）、信息存儲 M(X）——的定義、數(shù)學表達式、推薦估計器及其對非平穩(wěn)性和長程依賴的敏感性。熵度量系統(tǒng)當前狀態(tài)的總信息量，穩(wěn)定性高，適合刻畫整體不確定性；條件熵 C(X)=S(Xt, X＜t)-S(X＜t) 反映當前無法由過去預測的新信息，對非平穩(wěn)性（尤其是趨勢和尖峰）高度敏感；信息存儲 M(X)=S(Xt)-S(Xt|X＜t) 表示當前狀態(tài)中可由過去預測的部分，最能反映系統(tǒng)的可預測性，但受長程依賴影響顯著（正相關(guān)增強、負相關(guān)削弱）。選擇合適的估計器（線性、最近鄰、核方法）配合適當?shù)臄?shù)據(jù)預處理（去趨勢、標準化），對于準確刻畫復雜系統(tǒng)的信息結(jié)構(gòu)至關(guān)重要。

動力學系統(tǒng)理論

動力學系統(tǒng)理論從相空間幾何結(jié)構(gòu)與穩(wěn)定性出發(fā)，直接研究擾動如何隨時間演化，因此更強調(diào)可預測性的機制解釋：系統(tǒng)為何可預測、誤差為何增長、預測窗口為何有限。其核心思路是把預測問題轉(zhuǎn)化為對軌道結(jié)構(gòu)與擾動放大規(guī)律的分析。

穩(wěn)定性與誤差增長：Lyapunov指數(shù)刻畫相鄰軌道的平均發(fā)散/匯聚速率。最大 Lyapunov指數(shù)為正通常意味著對初值敏感，誤差會指數(shù)增長，從而形成有限的預測時窗；相反，若系統(tǒng)呈現(xiàn)更強的收斂或弱敏感性，預測窗口往往更長。

相空間結(jié)構(gòu)與復雜度：吸引子、分岔與混沌等結(jié)構(gòu)決定了系統(tǒng)軌道的組織方式；分形維數(shù)等幾何量用于描述吸引子的“有效自由度”，維數(shù)越高、結(jié)構(gòu)越復雜，通常意味著更高的建模難度與更短的可預測時間尺度。

圖20：Lorenz系統(tǒng)中的強混沌（紅色，ρ <ρp≈180.72）、部分可預測混沌（綠色，ρp<ρ<ρc≈180.96）與層流（藍色，ρ> ρC）的區(qū)分。從上到下：(a) Poincaré截面上的zn值；(b) 最大Lyapunov指數(shù)λm；(c) 交叉距離標度指數(shù)ν；(d) 有限時間交叉相關(guān)C12(t=200)。PD1和PD2標記倍周期分岔點，SSB表示系統(tǒng)對稱性(x,y,z)?(-x,-y,z)自發(fā)破缺對應的分岔。與傳統(tǒng)最大Lyapunov指數(shù)相比，該方法對識別"部分可預測混沌"表現(xiàn)出更優(yōu)越的區(qū)分能力，并強調(diào)了吸引子拓撲結(jié)構(gòu)對長期可預測性的關(guān)鍵影響。

非平穩(wěn)與多尺度情形的擴展：在實際系統(tǒng)中，可預測性往往具有顯著的時變性、尺度依賴性與空間傳播特征。為此，研究中會引入有限時間/有限幅度等“Lyapunov 變體”來刻畫不同時間窗口、不同擾動幅度下的可預測性差異，并更貼近真實預測任務中的誤差來源。

可預測性作為機制信號：當系統(tǒng)跨越分岔點或進入新的動力學機制時，穩(wěn)定性結(jié)構(gòu)會改變，常表現(xiàn)為可預測性指標的突變或趨勢性變化，因此動力學視角也常被用于解釋“為何出現(xiàn)轉(zhuǎn)折”以及“轉(zhuǎn)折前是否存在可識別的征兆”。

動力學系統(tǒng)理論的優(yōu)勢是解釋力強、能夠把“可預測性”與系統(tǒng)機制直接對應；但在高維系統(tǒng)、強噪聲觀測或存在模型誤差時，嚴格的動力學量（如 Lyapunov指數(shù)）的估計與解釋會更具挑戰(zhàn)，往往需要與統(tǒng)計/信息論工具聯(lián)用來提高穩(wěn)健性。

圖21：SINDy（稀疏識別非線性動力學）算法應用于Lorenz系統(tǒng)的示意圖。首先收集系統(tǒng)的時間序列數(shù)據(jù)，包括狀態(tài) X 及其導數(shù) ；然后構(gòu)建狀態(tài)的非線性函數(shù)庫 Θ(X)，包含多項式、三角函數(shù)等候選項；應用稀疏回歸（如LASSO或序貫閾值最小二乘）識別滿足的最小項集 ∑。解向量 ∑ 中少數(shù)非零元素指示動力學方程右端的關(guān)鍵項。參數(shù)設(shè)置為 σ = 10、β = 8/3、ρ = 28，初始條件 (x0, y0, z0)T = (-8, 7, 27)T。

洛倫茲吸引子上的軌跡按所需自適應時間步著色，紅色表示較小步長。非線性動力學稀疏辨識（Sparse Identification of Nonlinear Dynamics，SINDy）的核心假設(shè)是許多自然系統(tǒng)的演化由少數(shù)關(guān)鍵動力學項主導。通過在高維候選函數(shù)庫中構(gòu)建稀疏表示，該方法能夠從數(shù)據(jù)中自動發(fā)現(xiàn)簡潔、可解釋且具有強預測性能的動力學模型，在物理和工程系統(tǒng)的廣泛應用表明，數(shù)據(jù)驅(qū)動建模不僅能揭示系統(tǒng)的結(jié)構(gòu)本質(zhì)，也為高維復雜系統(tǒng)的可預測性分析提供了新途徑。

圖22：計算過程示意圖，在Lorenz-63系統(tǒng)相空間中演示。該圖展示了計算參考狀態(tài) 在預測時程 η 下的時間滯后遞歸指數(shù) 的所有步驟。第二行面板提供了定義的相空間區(qū)域的放大視圖。遞歸、前向遞歸和前向參考狀態(tài)遞歸分別用藍色實心點、藍色空心點和橙色點表示。半徑為的藍色圓圈表示用于定義參考狀態(tài)鄰域的超球面，半徑為的橙色圓圈對應前向參考狀態(tài)。

TLR指數(shù)通過比較當前遞歸鄰域經(jīng)時間滯后 η 演化后的集合與目標鄰域的重疊程度，定量刻畫當前狀態(tài)的局部可預測性：

越接近1，可預測性越高。該方法完全基于相空間幾何，無需顯式模型，特別適用于高維時空系統(tǒng)。更重要的是，可解釋為條件概率，即給定當前狀態(tài)位于鄰域內(nèi)，其未來狀態(tài)仍落入未來鄰域的概率，從而將可預測性與香農(nóng)熵直接關(guān)聯(lián)。研究表明，相比經(jīng)典指標如非線性局部Lyapunov指數(shù)，時間依賴局部率（Time-dependent Localized Rate）在非線性區(qū)域表現(xiàn)更優(yōu)。非線性局部Lyapunov指數(shù)（Nonlinear Local Lyapunov Exponent）假設(shè)誤差指數(shù)增長，而時間依賴局部率通過遞歸點的實際演化直接捕獲非線性效應，并能揭示可預測性的非單調(diào)衰減——在某些時間窗口內(nèi)，由于吸引子結(jié)構(gòu)，系統(tǒng)可能表現(xiàn)出暫時的可預測性回升。

圖23：數(shù)據(jù)同化與預測方案示意圖。(a) 一種將數(shù)值模擬與實驗觀測同步的方法示意。在兩個信號 x1(t) 和 x2(t) 實現(xiàn)同步后，在 t = 0 時刻關(guān)閉開關(guān)，讓數(shù)值模擬獨立演化。(b) 開關(guān)關(guān)閉前后實驗與模擬時間序列的對比，顯示兩個波形的發(fā)散過程。(c) 絕對差值 |x1 - x2| 的半對數(shù)圖，揭示開關(guān)關(guān)閉后的指數(shù)發(fā)散。絕對差值經(jīng)25 ns移動平均平滑以提供可靠的斜率估計。虛線曲線是將實驗數(shù)據(jù)替換為數(shù)值模擬時間序列的結(jié)果，顯示更接近的初始同步。

在初始同步階段，通過分析模型軌跡相對于實驗軌跡的發(fā)散速率，可以估計局部Lyapunov指數(shù)及其倒數(shù)——即該狀態(tài)下的預測時程。該方法的關(guān)鍵在于融合實驗數(shù)據(jù)與數(shù)值動力學模型，展示了同步現(xiàn)象用于混沌系統(tǒng)預測的實用可行性，為混沌通信、傳感器網(wǎng)絡(luò)和生物醫(yī)學等領(lǐng)域的預測問題提供了新思路。

統(tǒng)計分析方法

Lyapunov指數(shù)和吸引子維數(shù)提供了機制解釋。它們揭示了誤差來源和預測的局限程度。但這些指標的估計往往需要已知動力學方程或足夠長的干凈數(shù)據(jù)。當我們面對的是短序列、強噪聲、未知方程的真實數(shù)據(jù)時，需要更魯棒的操作性工具，即那些不依賴精確模型、直接從統(tǒng)計結(jié)構(gòu)中提取可預測性信息的方法。

統(tǒng)計分析方法更貼近操作性預測，將動力學觀測序列視為隨機過程的實現(xiàn)，通過統(tǒng)計結(jié)構(gòu)（相關(guān)性、譜結(jié)構(gòu)、協(xié)方差與條件分布等）來度量可預測性，并構(gòu)造可用的預測模型或評估指標。與前兩類方法相比，它更強調(diào)可計算性與可評估性。

相關(guān)結(jié)構(gòu)與預測時窗：自相關(guān)函數(shù)、偏自相關(guān)與相關(guān)時間（decorrelation time）用于判斷系統(tǒng)“記憶消失”的速度；相關(guān)時間更長通常意味著可利用的預測信息更持久。

圖24：(上) 自相關(guān)函數(shù)；(下) 對應于阻尼振蕩函數(shù)的功率譜。

頻域刻畫：功率譜用于識別主導周期與尺度能量分布；周期峰或低頻占優(yōu)往往對應更強的可預測結(jié)構(gòu)，而寬譜與能量向高頻擴散常對應更快的誤差增長。

協(xié)方差結(jié)構(gòu)與降維預測：主成分分析/經(jīng)驗正交函數(shù)（Principal Component Analysis/Empirical Orthogonal Function，PCA/EOF）等方法用于提取主導模態(tài)，減少維數(shù)并聚焦于更可預測的低維子空間；典型相關(guān)分析（Canonical Correlation Analysis，CCA）等相關(guān)分析方法可用于在多變量之間構(gòu)造更有效的預測子集或檢驗預測關(guān)系。

預測性能的統(tǒng)計度量：在模型或數(shù)據(jù)驅(qū)動預測中，常用均方根誤差（Root Mean Square Error，RMSE）、相關(guān)系數(shù)、概率得分（如 CRPS、對數(shù)得分等）來評估不同時間提前期的技能衰減，從而把“可預測性”落實到可比較、可復現(xiàn)的指標體系上。

圖25：?-對數(shù)得分隨軌跡長度 T 的變化。藍色實線表示基于 105 條軌跡計算的平均得分，陰影區(qū)域代表95%置信區(qū)間。紅色虛線表示定理4.1定義的可預測性極限，藍色虛線表示理論近似。彩色線條展示三條獨立隨機軌跡的得分演化。結(jié)果表明，該方法在短時程內(nèi)即可達到穩(wěn)定收斂，理論與實證結(jié)果吻合良好，展示了強魯棒性和實用價值。?-對數(shù)得分規(guī)則的核心創(chuàng)新在于：通過評估觀測值 ? 鄰域內(nèi)的概率質(zhì)量（而非點概率），在保持理論嚴格性的同時提高了對觀測誤差和模型偏差的容忍度。其定義為：

定理4.1進一步給出系統(tǒng)在給定容差 ? 下的最優(yōu)可預測性：

其中第一項 dx log(2?) 代表“允許誤差范圍”關(guān)聯(lián)的信息容量，第二項是真分布與最優(yōu)模糊預測分布之間的KL散度，反映模型相對于真實系統(tǒng)動力學的擬合誤差。這一理論結(jié)果清晰界定了“預測精度”與“誤差容差”之間的權(quán)衡，為系統(tǒng)可預測性上限提供了嚴格的定量基礎(chǔ)。

統(tǒng)計方法的優(yōu)勢在于適配真實數(shù)據(jù)與工程評估流程，易與預測任務直接對接；但其結(jié)果往往更依賴“平穩(wěn)性、線性近似或分布假設(shè)”等前提，對極端事件、強非線性機制轉(zhuǎn)變等情形的刻畫通常需要與動力學/信息論視角結(jié)合，才能同時兼顧可解釋性與穩(wěn)健性。

AI方法與動力學預測

上述三類經(jīng)典方法——信息論、動力學系統(tǒng)、統(tǒng)計分析——有一個共同前提，即我們需要理解系統(tǒng)的結(jié)構(gòu)（熵、Lyapunov指數(shù)、相關(guān)函數(shù)等），才能界定其可預測性。但如果我們愿意放棄理解，只追求預測，會發(fā)生什么？

機器學習和深度學習方法正是沿著這條路徑，在動力學可預測性研究中取得了顯著進展。神經(jīng)網(wǎng)絡(luò)、支持向量機、隨機森林等方法被用于學習和預測動力學系統(tǒng)的演化規(guī)律。特別是深度學習方法如RNN、LSTM、Transformer等，能夠有效捕捉動力學系統(tǒng)的長期依賴和復雜模式。

圖26：DSDL（動力系統(tǒng)深度學習）模型對三種不同混沌動力系統(tǒng)的預測結(jié)果。(a) 洛倫茲系統(tǒng)的預測序列。淺灰色線表示數(shù)值解（真實狀態(tài)），藍色線表示訓練集，紅色線表示有效預測，深灰色線表示測試集中的無效預測。垂直黑色虛線指示有效預測時間（Effective Prediction Time，EPT）。訓練集使用104個時間點，此面板僅顯示最后103個點。(b) 洛倫茲吸引子的預測軌跡。(c) 與(a)相同，應用于超混沌洛倫茲系統(tǒng)。(d) 與(a)相同，應用于一個概念性的海洋-大氣耦合洛倫茲系統(tǒng)。

有效預測時間（Effective Prediction Time，EPT）作為該框架的核心創(chuàng)新指標，其定義為模型預測誤差首次超過預設(shè)閾值的時間。這與傳統(tǒng)的平均可預測時間（Average Predictability Time，APT）相比，反映了具體深度學習模型的實際性能，捕捉相空間局部結(jié)構(gòu)對預測失效的影響，并揭示預測能力衰減背后的時空不均勻性或者說躍變性。

信息瓶頸理論為理解AI方法在動力學預測中的性能邊界提供了理論框架。通過分析AI模型在處理信息時的瓶頸和損失，可以評估其預測能力的極限，并指導模型設(shè)計優(yōu)化。

圖27：應用于彈簧-質(zhì)量系統(tǒng)的“過去-未來信息瓶頸（Past-Future Information Bottleneck，PFIB）”曲線示意圖。橫軸代表模型保留的歷史壓縮信息，縱軸代表對未來狀態(tài)的預測信息。黑色實線為理論上的最優(yōu)信息瓶頸曲線（即在特定數(shù)據(jù)壓縮程度下能達到的最高預測能力極限）。灰色的方塊及下方的子曲線展示了不同維度的模型逼近這一理論極限的過程，直觀揭示了動力學預測中“信息壓縮”與“預測能力”之間的權(quán)衡關(guān)系。

然而，AI在動力學可預測性研究中仍面臨可解釋性、泛化能力和計算效率等理論挑戰(zhàn)。研究者正在探索新的理論框架，如信息瓶頸與深度學習的結(jié)合、因果推斷與深度學習的融合等，以解決這些挑戰(zhàn)。

極端事件的可預測性

如果說常規(guī)預測是在問"明天最可能發(fā)生什么？"，極端事件預測則是在問"最不可能發(fā)生的事情，能否被提前察覺？"極端事件——極端天氣、卒中發(fā)作、電網(wǎng)崩潰——雖然發(fā)生概率低，但影響巨大。它們往往在系統(tǒng)相空間的角落中孕育，在常規(guī)預測模型的盲區(qū)中爆發(fā)。降階建模和前兆檢測方法，正是為捕捉這些黑天鵝事件而設(shè)計的特殊工具。

降階建模通過簡化動力學系統(tǒng)，保留主導模式，提高了對極端事件的預測能力。前兆檢測方法則通過識別系統(tǒng)狀態(tài)空間中的異常模式，預警極端事件的發(fā)生。

圖28：ε = 0.1 及不同預測閾值下的ROC特征曲線：(a) μ = 5，(b) μ = 6。實線為完整動力學結(jié)果，虛線為降階動力學結(jié)果，對比展示了降階模型在預測極端事件方面的有效性。

該方法采用基于前兆狀態(tài)距離的預測框架：通過匯編歷史極端事件前的狀態(tài)分布，識別前兆中心 x*，定義歐氏距離度量。當 D < δ（δ 為閾值參數(shù)）時，預測極端事件發(fā)生。ROC曲線用于比較命中率和虛警率，不依賴事件頻率分布。結(jié)果表明，對于完整模型和降階模型，預測技能均顯著優(yōu)于隨機猜測；且事件越極端，預測越容易。這表明在多尺度耦合下，適當設(shè)計的降階模型能夠捕獲關(guān)鍵前兆結(jié)構(gòu)，為由真實觀測數(shù)據(jù)驅(qū)動的預警方法提供了理論支撐。

最優(yōu)時間依賴模式（Optimal Time-Dependent modes，OTD模式）分析方法通過識別與極端事件最相關(guān)的時空模式，優(yōu)化了對極端事件的預測。可以把OTD模式想象成追蹤暴風雨前最不穩(wěn)定的大氣擾動方向。它實時監(jiān)測系統(tǒng)中那些最容易觸發(fā)極端事件的"不穩(wěn)定種子"。這些模式通常反映了系統(tǒng)失穩(wěn)前的臨界行為。

圖29：最優(yōu)時間依賴模式（Optimal Time-Dependent modes，OTD模式）捕捉極端事件前兆示意圖。該圖展示了在非平穩(wěn)的動力學系統(tǒng)中，OTD模式如何在隨時間演化的過程中始終保持正交性。這種方法能夠?qū)崟r追蹤系統(tǒng)相空間中最容易發(fā)生指數(shù)級增長的擾動方向，從而為高維系統(tǒng)（如流體湍流）中極端事件的爆發(fā)提供早期預警和可預測性分析的基礎(chǔ)。

變分優(yōu)化方法和極端軌跡識別為極端事件預測提供了系統(tǒng)性的優(yōu)化框架。這些方法將極端事件預測轉(zhuǎn)化為適當?shù)淖兎謫栴}，通過優(yōu)化過程識別最可能導致極端事件的狀態(tài)軌跡。

圖30：極端事件預測。(a) 垂直虛線標記極端事件閾值 Dm≈ 0.194。水平虛線標記 λ = 0.4。四個象限分別對應：I，正確拒絕；II，假陽性；III，命中；IV，假陰性。(b) 對應極端事件閾值 De = 0.19 的極端事件概率 Pee。變分優(yōu)化框架的核心思想是將極端事件的發(fā)生刻畫為有限時間優(yōu)化問題：在物理約束下，尋找使相關(guān)可觀測量（如能量耗散率）快速增長的初始擾動。形式化表達為：

其中 Φ(t; u0) 表示從初始狀態(tài) u0 出發(fā)的軌跡，I(·) 是刻畫極端事件的可觀測量，允許集確保擾動保持在系統(tǒng)吸引子附近且具有非零發(fā)生概率。應用于二維Kolmogorov流，該框架揭示了極端耗散事件由特定的三波相互作用 (0, kf)、(1, 0)、(1, kf) 觸發(fā)。模式 (1, 0) 在極端事件發(fā)生前即刻將能量傳遞給主導模式 (0, kf)，誘導能量輸入和耗散同時激增。基于此機制，模式幅度 l(t) = |a(1, 0, t)| 被提出作為極端事件的前兆指標。統(tǒng)計分析表明該指標與未來極端耗散事件的條件概率之間存在顯著非線性關(guān)系：當 l(t) < 0.3 時，系統(tǒng)幾乎確定會在短期內(nèi)經(jīng)歷極端耗散事件；而當 0.5"},"displayMode":"inline","viewType":"inline"}}">l(t) > 0.5 時，未來發(fā)生極端事件的概率接近零。由此導出的預測指標通常具有明確的物理意義和高特異性，適用于結(jié)構(gòu)已知且模型準確的系統(tǒng)，為高維湍流系統(tǒng)中極端事件的預測提供了可解釋的預測指標。

跨學科視角：

尋找復雜系統(tǒng)預測極限的普適規(guī)律

上述三類方法論——信息論方法、網(wǎng)絡(luò)理論、動力學系統(tǒng)分析——構(gòu)成了可預測性研究的三根支柱。它們分別從"不確定性量化"、"結(jié)構(gòu)規(guī)則性"和"演化機制"三個角度，為我們提供了界定預測極限的工具。但當我們把這些工具帶入真實世界的具體領(lǐng)域時，一個有趣的問題浮現(xiàn)：氣候系統(tǒng)、生態(tài)系統(tǒng)、神經(jīng)系統(tǒng)、經(jīng)濟系統(tǒng)——這些看似迥異的復雜系統(tǒng)，是否共享相同的預測極限規(guī)律？

無論是天氣的陰晴圓缺，還是物種的繁衍興衰，亦或是大腦神經(jīng)的閃爍，不同領(lǐng)域的復雜系統(tǒng)在預測極限上展現(xiàn)出了驚人的跨學科共性。研究者們發(fā)現(xiàn)，非線性演化規(guī)律、結(jié)構(gòu)約束、外部擾動以及觀測不確定性，共同鎖死了各類系統(tǒng)預測能力的“天花板”。而在這些共性之下，不同系統(tǒng)又演化出了各自獨特的預測特征。

氣候不僅受內(nèi)部循環(huán)（如洋流、大氣）影響，還受到強烈的外部強迫（如溫室氣體排放）。研究發(fā)現(xiàn)，全球變暖趨勢實際上正在削弱諸如降水、海表溫度等關(guān)鍵氣候變量的動力學可預測性。為了應對這種復雜的非平穩(wěn)狀態(tài)，科學家提出了“總氣候可預測性”的概念，將系統(tǒng)“初始狀態(tài)帶來的可預測性”與“外部環(huán)境強迫帶來的可預測性”統(tǒng)一起來，為理解極端氣候演變提供了全局工具。

然而，外部強迫并非總是削弱可預測性。在某些生態(tài)系統(tǒng)中，它反而能抑制混沌，帶來意想不到的秩序。

在熱帶雨林的演替或碳循環(huán)等生態(tài)過程中，系統(tǒng)狀態(tài)空間的高維性往往讓生態(tài)系統(tǒng)未來軌跡看起來極度不確定。然而，生態(tài)學中存在一種奇妙的“混沌抑制”（Chaos suppression）現(xiàn)象：當引入某種規(guī)律性的外部環(huán)境強迫時，系統(tǒng)內(nèi)部原本混亂無序的波動反而會被壓制，使得長期的演化軌跡變得更加高度可預測。這表明，外部擾動有時并非預測的敵人，反而可能是建立秩序的推手。

在傳染病學中，研究者利用排列熵等工具量化了疾病傳播的“動力學熵壁壘”，證明了社交網(wǎng)絡(luò)的異質(zhì)性對傳染病預測上限存在深刻的物理約束。而在微觀的神經(jīng)科學領(lǐng)域，研究者通過捕捉腦電圖信號的多尺度復雜性特征，試圖預測個體的神經(jīng)和精神狀態(tài)，揭示了動力學特征與臨床表現(xiàn)之間的潛在映射。

凡此種種，跨學科的視角給我們帶來了一個重要啟示，即在真實世界中，不存在一把萬能預測標尺。系統(tǒng)是趨于穩(wěn)定、陷入混沌，還是存在滯后響應，都需要我們擺脫單一指標的依賴，將動力學系統(tǒng)理論、信息論度量與機器學習深度融合，為不同領(lǐng)域的復雜系統(tǒng)量身定制預測極限的分析框架。

應用領(lǐng)域：從理論到實踐

理論方法的真正價值，最終要在真實世界中檢驗。熵縮放、網(wǎng)絡(luò)譜、Lyapunov指數(shù)——這些抽象的數(shù)學工具，能否幫助我們預測一支冷氣團明天會去哪里、一場疫情會在何時達到峰值？應用領(lǐng)域的案例代表了可預測性研究從實驗室走向社會的棘手領(lǐng)域。

通信網(wǎng)絡(luò)與推薦系統(tǒng)

在通信網(wǎng)絡(luò)中，可預測性研究用于流量預測、擁塞控制和資源分配。通信網(wǎng)絡(luò)流量的可預測性對于網(wǎng)絡(luò)管理和優(yōu)化至關(guān)重要。研究表明，網(wǎng)絡(luò)流量具有一定的規(guī)律性和自相似性，這使得流量預測成為可能。

推薦系統(tǒng)的核心是預測用戶對未見過項目的偏好。這種預測的準確性直接影響了推薦系統(tǒng)的有效性。可預測性研究可以幫助理解用戶行為模式的規(guī)律性和復雜性，從而設(shè)計更有效的推薦算法。

金融與經(jīng)濟預測

在金融市場建模中，可預測性研究用于股價預測和風險評估。股價預測是金融領(lǐng)域的經(jīng)典問題。研究表明，短期股價變化具有一定的可預測性，但長期預測受到市場隨機性和外部沖擊的嚴重制約。

在經(jīng)濟學建模中，可預測性研究用于GDP增長預測、商業(yè)周期預測和政策效果評估。經(jīng)濟系統(tǒng)的可預測性受到多種因素的影響，包括政策變化、技術(shù)創(chuàng)新和突發(fā)事件等。

圖31：經(jīng)濟復雜性中異質(zhì)動力學的四種演化模式。 (a) 適應度（代表國家生產(chǎn)能力）與人均收入平面上的宏觀動力學分析，揭示了兩個典型區(qū)域：一個是“層流區(qū)”（laminar regime，如圖中綠色新興經(jīng)濟體和藍色發(fā)達經(jīng)濟體），這些國家的演化軌跡高度穩(wěn)定且可預測；另一個是“混沌區(qū)”（chaotic regime，如圖中紅色和紫色區(qū)域），軌跡分散、不規(guī)則且可預測性極低。(b) 動力學流場圖進一步凸顯了不同經(jīng)濟體在發(fā)展軌跡可預測性上的巨大差異。

傳播過程與地球系統(tǒng)

在傳播過程建模中，可預測性研究用于信息擴散、疾病傳播和社交網(wǎng)絡(luò)影響分析。傳播過程的可預測性對于理解和管理傳播過程至關(guān)重要。研究表明，傳播過程通常遵循特定的模式和規(guī)律，這些模式和規(guī)律可以被用于預測傳播的動態(tài)行為。

圖32：不同網(wǎng)絡(luò)結(jié)構(gòu)下流行病傳播規(guī)模的不確定性隨時間的演化。圖中展示了從大世界網(wǎng)絡(luò)(a)、小世界網(wǎng)絡(luò)(b)到不同參數(shù)的無標度網(wǎng)絡(luò)(d, e, f)下，流行病最終感染規(guī)模的標準差（縱軸，代表不確定性）隨時間的變化。隨著疾病的擴散，標準差逐漸增加，意味著未來結(jié)果的可預測性在迅速衰減。這說明物理網(wǎng)絡(luò)的拓撲結(jié)構(gòu)和疾病傳播率共同決定了流行病可預測性窗口的長短。

在地球科學中，可預測性研究用于氣候預測、地震預測和極端天氣事件預警。地球系統(tǒng)預測是可預測性研究最具挑戰(zhàn)性的應用領(lǐng)域之一。氣候系統(tǒng)的可預測性時間尺度受到大氣動力學混沌和邊界條件變化的限制，目前氣候模式能夠較好地預測未來一周到一個月的氣候變化。

政治科學領(lǐng)域

在政治科學中，可預測性研究用于選舉結(jié)果預測、政策效果評估和沖突風險分析。政治系統(tǒng)的可預測性受到多種因素的影響，包括選民行為、政策決策和外部事件等。

圖33：美國最高法院判決結(jié)果的平均可預測性分析。 (a-c) 代表假設(shè)法官完全獨立投票的“理想法院”場景；(d-f) 代表真實的法院場景。紫色曲線是基于復雜網(wǎng)絡(luò)（隨機塊模型）的預測結(jié)果，橙色曲線是簡單的多數(shù)決預測。

一項研究結(jié)果表明，在真實的爭議性案件（特別是圖33.f）中，復雜網(wǎng)絡(luò)模型的預測準確率遠超簡單多數(shù)決，證明了看似高度獨立的司法決策背后，依然存在著穩(wěn)定且高度可預測的隱性陣營結(jié)構(gòu)。

以上僅列舉了若干具有代表性的應用場景，類似的可預測性分析方法還廣泛應用于政治科學、教育、學術(shù)建模、音樂建模等眾多復雜系統(tǒng)中，此處不再一一展開。

未來展望：挑戰(zhàn)與機遇

復雜系統(tǒng)可預測性研究正面臨前所未有的發(fā)展機遇。數(shù)據(jù)科學的快速進展為理解復雜系統(tǒng)提供了豐富的數(shù)據(jù)驅(qū)動方法，計算能力的指數(shù)級增長使得處理大規(guī)模、高維系統(tǒng)成為可能。同時，人工智能技術(shù)的突破為開發(fā)新型預測算法開辟了廣闊前景。

然而，研究也面臨諸多挑戰(zhàn)。理論框架的統(tǒng)一性問題尚未解決，不同類型系統(tǒng)（時間序列、網(wǎng)絡(luò)、動力學）的可預測性理論需要更深層次的整合。高維系統(tǒng)的維度災難（curse of dimensionality）問題限制了直接應用傳統(tǒng)方法，需要開發(fā)更具適應性的新理論工具。

可預測性研究的未來發(fā)展越來越依賴于跨學科融合。與信息論、統(tǒng)計學、物理學和控制論等學科的結(jié)合已經(jīng)產(chǎn)生了豐富的理論成果，而與計算機科學、神經(jīng)科學和經(jīng)濟學的交叉融合正在開辟新的研究前沿。

特別值得關(guān)注的是，可預測性理論與人工智能的深度融合正在催生新的理論范式。一方面，可預測性理論為理解AI系統(tǒng)的性能邊界提供了理論基礎(chǔ)；另一方面，AI技術(shù)也為分析復雜系統(tǒng)可預測性提供了強大工具，這種雙向互動預示著理論發(fā)展的新機遇。

未來研究有幾個關(guān)鍵方向值得特別關(guān)注。多模態(tài)可預測性理論能夠同時處理時間、網(wǎng)絡(luò)和幾何結(jié)構(gòu)等多種數(shù)據(jù)類型；層級化可預測性研究理解從微觀到宏觀不同尺度系統(tǒng)的可預測性關(guān)系；實時自適應預測框架能夠根據(jù)系統(tǒng)狀態(tài)動態(tài)調(diào)整預測策略；理論結(jié)果的可計算性問題的研究開發(fā)高效近似算法；罕見事件和系統(tǒng)性風險的預測不僅需要理論創(chuàng)新，也需要更精細的數(shù)據(jù)和更強大的計算資源。

復雜系統(tǒng)可預測性研究作為復雜性科學的核心領(lǐng)域，已經(jīng)建立了豐富的理論框架和方法體系，從時間序列、網(wǎng)絡(luò)結(jié)構(gòu)到動力學過程，多個層面的理論成果為理解和預測復雜系統(tǒng)行為提供了堅實基礎(chǔ)。隨著數(shù)據(jù)科學和人工智能技術(shù)的持續(xù)發(fā)展，可預測性理論必將在解釋和預測復雜系統(tǒng)行為方面發(fā)揮更加重要的作用，為科學決策和智能時代提供更加堅實的理論支撐。

因果涌現(xiàn)第七季——從理論到應用

在神經(jīng)系統(tǒng)中意識的生成、城市交通的擁堵演化、全球產(chǎn)業(yè)系統(tǒng)的協(xié)同與失穩(wěn)之中，始終潛藏著一條貫穿微觀與宏觀的因果脈絡(luò)：個體行為本身或許簡單，卻能在尺度躍遷中孕育出高度組織化、難以還原的整體結(jié)構(gòu)。復雜現(xiàn)象并非微觀規(guī)則的線性疊加，而是源于多尺度動力學作用下逐步形成的因果組織。正是在這一背景下，因果涌現(xiàn)理論被提出，并在因果涌現(xiàn) 2.0、工程化涌現(xiàn)以及多尺度因果抽象等工作中推進，逐漸發(fā)展出一套融合動力學分析、信息論度量以及譜方法與人工智能工具的研究框架，從而將研究重心從“復雜性本身”轉(zhuǎn)向“因果結(jié)構(gòu)如何出現(xiàn)、如何被度量并在現(xiàn)實系統(tǒng)中發(fā)揮作用”。

為系統(tǒng)梳理因果涌現(xiàn)領(lǐng)域的最新進展，北京師范大學系統(tǒng)科學學院教授、集智俱樂部創(chuàng)始人張江老師領(lǐng)銜發(fā)起，組織對該主題感興趣的研究者與探索者共同研讀前沿文獻、交流研究思路。讀書會將于2026年2月22日起每周日上午（創(chuàng)建讀書會暫定時間為10:00-22:00）線上開展，持續(xù)約10周，包含主講分享與討論交流，并提供會后視頻回放，誠邀相關(guān)領(lǐng)域研究者及跨學科興趣者參與。

詳情請見：

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.