一場千萬網(wǎng)友的賽博涂鴉，藏著預測系統(tǒng)崩潰的密碼

2026-04-11 11:01:59　來源: 中科院物理所

北京舉報

分享至

金融市場暴跌，生態(tài)系統(tǒng)失衡……如果一個系統(tǒng)即將崩潰，它會提前“露出馬腳”嗎？在混亂的數(shù)據(jù)中，我們能否提前捕捉到那些細微但關鍵的信號？近期，研究人員通過網(wǎng)絡論壇的一項在線“畫圖游戲”，引入可解釋的機器學習框架，試圖預測何時“風險降至”，并且希望解釋機器學習背后的“黑箱”。

撰文|郭瑞東

一個愚人節(jié)游戲成為大型社會實驗

要論愚人節(jié)互聯(lián)網(wǎng)公司玩出的花活， Reddit 搞的 r/place 值得一說。他們給出一塊100萬像素的空白巨大畫布，每個用戶每5分鐘會得到一個機會，可以在上面更改一個像素的顏色（圖1）。由于有時間限制，即使是畫出一個10*10像素的圖畫，也需要500分鐘，可這8個多小時中，說不定會有別的搗蛋者修改你圖畫中的像素——要想在r/place中畫出圖案，唯一的辦法是團隊合作。

從2017年的第一次活動，到2022年，畫布規(guī)模已擴展到400萬像素，顏色也增加到32種。在2022年活動開始的三天半的時間里，有 1040萬參與者共同完成了約 1.6億次像素修改。網(wǎng)友們自發(fā)組織，在畫布創(chuàng)作了約 10,900 個作品。從游戲角色到國家旗幟，從動漫人物到藝術(shù)二創(chuàng)，每個作品背后都是一個有組織的在線社區(qū)。

圖1 圖像產(chǎn)生過程丨圖源：參考文獻[3]

這項千萬人參與的社會實驗，為人類集體行為的研究提供了素材。當社區(qū) A精心繪制的《星球大戰(zhàn)》海報突然被社區(qū) B用純色塊覆蓋時，一個臨界轉(zhuǎn)變（critical transition）就發(fā)生了（圖 2C ），而研究者想要研究的就是這樣的臨界轉(zhuǎn)變點。在經(jīng)濟學中，臨界轉(zhuǎn)變可能表現(xiàn)為市場突然崩盤，在電力系統(tǒng)中則可能體現(xiàn)為局部故障迅速級聯(lián)擴展，最終導致大范圍停電。如能成功地檢測臨界轉(zhuǎn)變的早期跡象，可以使相關人員做好準備，減輕甚至避免此類轉(zhuǎn)變。

圖2 畫布的演化及找到的臨界轉(zhuǎn)變點丨圖源：參考文獻[1]

r/place 游戲意外地為科學家提供了一個前所未有的機會：同時觀察由具有反身性的個體組成的數(shù)千個子系統(tǒng)（每個作品）的臨界轉(zhuǎn)變。在現(xiàn)實中，我們幾乎無法同時觀察數(shù)千個市場，看它們何時突然崩盤，但在r/place中，數(shù)據(jù) 結(jié)果是公開、精確且高分辨率的。r/place的實驗記錄相當于給研究者提供了 “ 上帝視角 ” 的實時數(shù)據(jù)庫，構(gòu)圖的更新迭代就是微型社會的集體行為縮影，為研究人類社會的臨界轉(zhuǎn)變提供可控的實驗場景。

用可解釋機器學習預測人類行為

傳統(tǒng)上對臨界轉(zhuǎn)變的研究，多聚焦在地質(zhì) 、氣候及生態(tài)等不包含人與人群相互影響的系統(tǒng)中。這些系統(tǒng)在臨界轉(zhuǎn)變發(fā)生之前，描述系統(tǒng)狀態(tài)統(tǒng)計量的方差和自相關性會顯著增加。這種被稱為臨界慢化（critical slowing down）的現(xiàn)象，曾被視為臨界轉(zhuǎn)變的普適性前兆信號，當系統(tǒng)面對外界擾動的恢復速率顯著降低時，系統(tǒng)的波動和耦合增加，預示著臨界點即將到來。

但人類社會中，這套預測方法失效了。就拿r/place來說，有組織攻擊是“突發(fā)沖擊”，不是逐步累積的；另一方面，轉(zhuǎn)變可能是因為防御方主動撤退，并非系統(tǒng)失穩(wěn)。

既然人類行為的復雜性超出了單一理論的解釋范圍，那預測的時候，就需要直接從數(shù)據(jù)中挖掘模式。2026年1月2 日，普林斯頓大學的一個團隊在《美國科學院院刊》（ PNAS ）上發(fā)表了這項社會實驗的研究[1] 。研究者開發(fā)了一套基于可解釋機器學習的預警系統(tǒng) ，試圖從r/place所反映的真實環(huán)境學習臨界轉(zhuǎn)變的數(shù)據(jù)模式，最終該模型實現(xiàn)了以極高成功率完成對2023年 r/place 臨界轉(zhuǎn)變的預測。

研究者首先定義了何時能視作畫面出現(xiàn)臨界轉(zhuǎn)變（圖 3 A）：先用過去3小時內(nèi)，每個像素出現(xiàn)時間最長的顏色作為圖像穩(wěn)定狀態(tài)（稱為參考圖像）；若當前圖像與參考圖像的像素差異比例超過35%（體現(xiàn) 實質(zhì)性改變，而非小修小補），且是過去3小時平均值的6倍以上（體現(xiàn) 突然性），則將該圖像視作發(fā)生了臨界轉(zhuǎn)變。

然后，他們從r/place像素變換的時間序列數(shù)據(jù)中，手動構(gòu)建出19個特征，涵蓋圖像動態(tài)（偏離度、熵）、用戶行為（修改次數(shù)、新用戶比例）、攻防博弈（攻擊強度、恢復率）、歷史記憶（過去7小時加權(quán)平均），這些特征相當于機器學習算法的數(shù)字感官（圖3 B）。

圖 3 該研究的數(shù)據(jù)處理流程包括定義臨界轉(zhuǎn)變，篩選輸入數(shù)據(jù)，訓練決策樹模型，預測臨界轉(zhuǎn)變及使用SHAP為預測給出解釋。丨圖源：參考文獻[1]

接下來，研究人員開始構(gòu)建機器學習模型，其預測目標并非簡單判斷是否將要發(fā)生臨界轉(zhuǎn)變，而是預測距離下一次臨界轉(zhuǎn)變還剩多少時間（圖 3D），這種設計將使預測準確性（即預測值和真實值的差異）更容易評估。

最后研究者通過可解釋機器學習，對模型納入的特征按照其對預測結(jié)果的重要性進行打分，以找出哪些因素能夠預測臨界轉(zhuǎn)變的發(fā)生（圖 3E ）。

模型訓練好后，預測結(jié)果顯示：距離臨界點越近，其預測準確性越高。在 20分鐘預警窗口下，誤報率僅3.6%，而該模型最遠可以提前6小時給出預測，這是傳統(tǒng)方法難以實現(xiàn) 的（圖 4 ）。研究者使用2022年數(shù)據(jù)訓練的模型，直接用于2023年實驗，模型性能僅輕微下降，這一結(jié)果證明該模型捕捉到人類協(xié)作的通用規(guī)律。

圖 4 ：模型的預測準確性對比丨圖源：參考文獻[1]

促成臨界轉(zhuǎn)變的6種特征模式

本研究最大的特點是達成了模型“可解釋”。機器學習常被詬病為“黑箱”。但該研究中，每次預測中哪些特征的貢獻最大，可通過SHAP進行評估。SHAP值來源于博弈論，通過考察如果加入這個特征，預測準確性會增加多少，以評估新加入特征對預測的重要性。通過SHAP值，能夠?qū)⒊橄蟮臋C器學習預測“翻譯”成了人類可讀的定性預警規(guī)則或“行為模式”。

r/place上大部分圖案的臨界轉(zhuǎn)變，對應的都是社區(qū) 之間的攻防戰(zhàn) —— 防守方試圖在畫面上維持某個圖案，而攻擊方想讓圖案消失。研究者通過對預測過程中關鍵變量（SHAP值大）的變化趨勢進行分析，結(jié)合自身對r/place這個游戲的了解，將轉(zhuǎn)變前發(fā)生的變化分為6類。這6類模式可以對應現(xiàn)實人類社群的行為模式，可能會在金融市場、生態(tài)系統(tǒng)等具有現(xiàn)實影響的環(huán)境中呈現(xiàn)。因此，這項研究可以為現(xiàn)實情況的臨界轉(zhuǎn)變提供預警參考。

圖 5 ：6類成功預測臨界轉(zhuǎn)變對應的特征丨圖源：參考文獻[1]

第一類是傳統(tǒng)上的強烈臨界慢化（圖 5A）。該場景下，決定預測準確性的關鍵特征是瞬時圖像與上一時刻的差異比例。當該特征值（即圖像瞬時變化劇烈程度）處于極高百分位（>95%）時，此時它成為最強的預警信號。在轉(zhuǎn)變前極短時間（20分鐘內(nèi)），作品圖像的內(nèi)部波動性達到頂峰，像素顏色在極短時間內(nèi)頻繁、大幅變化，原本維持圖標的社群開始無法維持穩(wěn)定圖像。這表明防御方已完全喪失對圖像的控制力，攻擊方的每一次修改都有效，系統(tǒng)處于崩潰邊緣。該結(jié)果符合經(jīng)典理論中的臨界慢化，如同湖泊在富營養(yǎng)化臨界點前，浮游植物生物量出現(xiàn)極端劇烈的日波動；或金融市場在崩盤前出現(xiàn)極端高頻的交易波動。

第二類機器學習提取出的行為模式稱為攻擊力主導（圖 5B ），其關鍵特征是圖像被攻擊性修改的比例，即改成非參考色的比例。這一特征的異常升高，意味著臨界轉(zhuǎn)變前夕，對該圖像的修改絕大多數(shù)是“攻擊”（改變顏色），而非“防御”（恢復原色），攻擊方形成了壓倒性的力量優(yōu)勢。而防御社區(qū)要么因用戶數(shù)不足或意愿低下無心干預，要么反擊無效。這種模式在現(xiàn)實中也存在，比如外來入侵物種的繁殖速率遠高于本地物種的恢復速率，導致系統(tǒng)結(jié)構(gòu)被快速重塑。

第三類模式是溫和的臨界加速（圖 5C ），其特征是上一時刻被攻擊像素在本時刻恢復的比例。當這一比例處于中等偏高值時，其對預測臨界轉(zhuǎn)變重要性最高，而比例過低和過高時，該指標的重要性下降。這是一個有趣的發(fā)現(xiàn)，對應的情景是在攻擊初期，防御社區(qū)反應迅速、動員充分（被修改的像素很快恢復）。從表面看這是趨于穩(wěn)定的跡象，但模型將其識別為預警信號，可能是因為這種“高強度防御”恰恰是攻擊已形成一定規(guī)模，迫使防御方進入總動員的標志，是沖突升級的體現(xiàn)。類似的情形也出現(xiàn)在電力系統(tǒng)中。當局部線路負荷過高時，調(diào)度系統(tǒng)可以通過快速重分配負荷或頻繁啟用備用線路來維持整體穩(wěn)定。雖然系統(tǒng)仍保持正常運行，但這種高強度調(diào)度往往意味著系統(tǒng)已經(jīng)處于緊張狀態(tài)，一旦新的擾動出現(xiàn)，更容易觸發(fā)級聯(lián)故障。

第四類臨界轉(zhuǎn)變特征模式是“ 創(chuàng)新真空 ” （ Lack of in-group innovation ，圖 5D ），對應的特征是當前處于非參考顏色（即被攻擊狀態(tài)）的像素，自被攻擊以來平均已經(jīng)過去了多長時間。當該值非常高時，即像素長時間處于被攻擊狀態(tài)而未被恢復，其對應的平均SHAP值急劇升高，成為強烈的預警信號。這意味著，被攻擊的像素“賴著不走”的時間越長，機器學習模型就越確信一個致命的轉(zhuǎn)變即將發(fā)生。

創(chuàng)新真空模式反映的是臨界點出現(xiàn)之前，防御方只會進行最低限度的、機械的“修復”工作——即把被改色的像素填回原來的“參考顏色”。他們沒有意愿或沒有想象力去“創(chuàng)新”。在一個動態(tài)對抗環(huán)境中，靜止就是倒退。當攻擊方不斷嘗試新顏色、新圖案、新戰(zhàn)術(shù)時，一個只會機械回填的防御方必然會被拖垮。攻擊方可以輕易地通過持續(xù)施壓，耗盡防御方的熱情和資源，最終完成圖像的全面替換。對應到商業(yè)世界中，就是一家公司面對市場顛覆（“攻擊”），如果只會機械地維護舊產(chǎn)品線（“回填”），而沒有研發(fā)新產(chǎn)品、新商業(yè)模式（“創(chuàng)新”）。 r/place中的攻擊間距就相當于“市場份額丟失后多久能奪回”，時間越長，破產(chǎn)風險越高。

第五種模式的關鍵指標是冗余修改比例（圖 5E ），即用戶將像素改成本來就有的顏色。冗余修改比例越高，SHAP值越高（越安全）。這意味著低冗余修改才是預警信號。冗余修改率高通常被認為是“噪聲”或“無意義行為”（比如用戶為了掛名而重復修改）。但模型發(fā)現(xiàn)，在穩(wěn)定作品中，這種“無意義”行為反而存在，且其高比例是穩(wěn)定的標志。

對此一個合理的解釋是，在一個組織良好的社區(qū)中，存在大量“儀式性”或“鞏固性”的修改。成員們通過重復修改關鍵像素（如Logo的輪廓）來宣示主權(quán) ，以此強化集體認同，維持存在感。這是一種低成本、高頻率的協(xié)作信號。當這種信號消失時，意味著社區(qū)成員不再進行這種象征性協(xié)作，要么是心灰意冷，要么是組織瓦解，集體行動能力喪失 —— 這是社區(qū)凝聚力崩潰的早期指標。就像一個活躍的在線論壇，不僅要看發(fā)帖量，還要看“灌水”帖、表情包大戰(zhàn)、版聊等“無意義”互動是否頻繁。這些“噪音”的消失，往往是社區(qū)活力衰竭的先兆。

最后一個能預測臨界點的特征，是衡量圖標中顏色分布的隨機性/復雜性的熵變低（圖5 F ），即顏色分布越簡單、越有序、越單調(diào)，預警信號越強。這是由于簡單圖像（如純色塊、幾何圖形、文字）結(jié)構(gòu)冗余度低。特別是對于簡單圖像，一個關鍵像素被攻陷，可能迅速引發(fā)連鎖反應，導致圖像整體結(jié)構(gòu)崩塌。而復雜圖像（如有細節(jié)的繪畫、照片）具有高維度的結(jié)構(gòu)冗余。局部受損不影響整體辨識度，防御方有更多時間和空間進行局部修復而不影響全局。

此外，復雜圖像通常意味著更高的社區(qū)投入和更強的身份認同，其防御意愿和資源投入也更持久。在協(xié)作創(chuàng)作的過程中，用戶之間產(chǎn)生的是 “欽佩” 。這種情感模式驅(qū)動的是良性嫉妒（benign envy）或直接的共情與合作，它激勵人們學習、參與和貢獻，而非退縮或攻擊。復雜性降低在現(xiàn)實中的對應是，物種單一的人工林比物種復雜的天然林更容易遭受病蟲害的毀滅性打擊；產(chǎn)業(yè)結(jié)構(gòu)單一的國家更容易受到外部環(huán)境的影響。

人群行為與物理或生態(tài)系統(tǒng)不同，社會系統(tǒng)的預警信號深深植根于人類行為與組織動力學。上述6種模式揭示了為何只使用傳統(tǒng)的臨界慢化無法預測人類行為。例如前述對冗余修改比例的解讀是典型的社會學洞察，在物理系統(tǒng)中基本沒有意義；而第四類創(chuàng)新真空涉及“創(chuàng)新”這一意向性概念。這些分析意味著對社會系統(tǒng)的預警，必須納入 “社會資本”“集體認同”“組織韌性”等維度。

黑天鵝事件

人類社會的復雜性，決定了不是每一次臨界轉(zhuǎn)變都能提前預警。預測算法的性能高度依賴于每個作品獨特的社區(qū)動態(tài)和歷史，該研究中有27%的臨界轉(zhuǎn)變完全無法預測。

圖 6A 中對應的是近乎完美的預測，該圖原本是一個相對復雜、有辨識度的標志性圖案，像某大學橄欖球隊的隊徽。這樣的圖案背后，可能有一個組織有序、有明確身份認同的社區(qū)在持續(xù)維護，讓畫面最終呈現(xiàn) 這個圖案。到了臨界轉(zhuǎn)變時，圖案被大量單一顏色的像素塊覆蓋，圖像變得混亂，這背后可能是對手球隊社區(qū)試圖“攻擊”，想讓這個圖案在畫布上消失。這個作品可能經(jīng)歷了一個典型的“臨界慢化”過程：在攻擊初期，防御社區(qū)反應迅速，但隨著攻擊持續(xù)，系統(tǒng)恢復力下降。因為這是一個有組織、有穩(wěn)定狀態(tài)的社區(qū)作品，因此算法能夠在相當長的時間內(nèi)準確預測，預測值和實際值相差不多。

圖 6 ：不同圖案的預測準確性

但在圖 6B 中，預測值在時間軸上劇烈振蕩，上下波動極大，完全沒有隨著真實臨界轉(zhuǎn)變的發(fā)生時間臨近而收斂。這表明算法完全無法判斷該作品何時會轉(zhuǎn)變，其預測毫無規(guī)律可循。對此，研究人員猜測“ 圖案1886” 背后的社區(qū)缺少組織，從不同時間點的快照可以看出這個圖案一直在變動，沒有清晰的“被攻擊-防御”模式；或者始終處于一種高頻率、低強度的像素修改狀態(tài)。而真正這個圖案消失的，是一次偶然卻有組織的大規(guī)模外部攻擊，可能是一個大型社區(qū)看上了這塊畫布，想用這塊畫布來創(chuàng)作自己的圖案。該事件在歷史數(shù)據(jù)中沒有可學習的先驗模式，屬于真正的“黑天鵝”事件，因此預測算法失靈了。

圖6C中的圖源于音樂專輯，可能由某個音樂愛好者小圈子維護。發(fā)生臨界轉(zhuǎn)變前，畫面長期保持穩(wěn)定，僅有極微小的修改。這一狀態(tài) 表明該作品長期被忽視，預測模型給出該圖案距離臨界點發(fā)生始終有幾個小時，然而轉(zhuǎn)變可能發(fā)生得非常突然，例如被一個大型社區(qū)用純色塊瞬間覆蓋。該圖的轉(zhuǎn)變可能由外部投機攻擊（opportunistic attack）引發(fā) ：攻擊者發(fā)現(xiàn)了一個無人防守的“空地”，其成功與否并不取決于創(chuàng)作作品的社群本身的“健康指標”，而取決于攻擊者的外部決策和資源投入，這導致模型無法從該作品自身歷史中進行預測。

預測失敗的案例，再次說明社會系統(tǒng)的臨界轉(zhuǎn)變是異質(zhì)的，其預警信號也是多元的，并非所有臨界轉(zhuǎn)變都可預警。任何預警系統(tǒng)都必須正視這種異質(zhì)性。在包含人類行為的系統(tǒng)中，“可預測性”不僅僅取決于模型本身的復雜度，更在于社區(qū)是否形成了可識別的、有規(guī)律的動態(tài)模式。如果社群行為本身是完全隨機，不可預測的，那么從系統(tǒng)數(shù)據(jù)中預測未來將變成本質(zhì)上不可能的任務。預警系統(tǒng)永遠有漏報，管理者必須接受這種不確定性。

小結(jié)

r/place像是一面數(shù)字哈哈鏡，放大了驅(qū)動人類社會走到今天的最原始的動力，例如創(chuàng)造、防御、攻擊、倦怠等，這些因素在現(xiàn)實生活中都有體現(xiàn)。PNAS發(fā)表的這項研究表明，使用可解釋機器學習識別早期預警信號數(shù)據(jù)驅(qū)動方法可以補充或輔助傳統(tǒng)理論框架，也為未來在其他領域的應用探索奠定了方法基礎。

從方法論來看，該文指出機器學習確實能學到了真實、可理解的模式，而非僅僅是數(shù)據(jù)中的虛假相關（過擬合）。SHAP可解釋性揭示的模式與領域?qū)＜遥ㄊ煜/place的社區(qū)動態(tài)）的直覺是吻合的（如簡單圖案易被攻破、社區(qū)無組織則圖案脆弱）。人類研究者通過結(jié)合領域常識，能將機器學習可解釋性分析的結(jié)果轉(zhuǎn)化為科學理解。這項研究不僅論證了“機器學習預測得準”，更進一步回答了“為什么準？背后發(fā)生了什么？”，從而增進了對r/place背后社群動力學的科學理解。

基于r/place的數(shù)據(jù)，對人類行為的研究還有不少，比如文獻 [3]關注畫面創(chuàng)作過程，該研究發(fā)現(xiàn)畫面生成過程中既有自上而下的控制，也存在自下而上的涌現(xiàn)。這項研究告訴讀者，r/place游戲不止是社群之間的攻防戰(zhàn)，還包括了創(chuàng)意，協(xié)作。為什么有的團隊能夠通過協(xié)作，在 r/plac e上繪出圖案，而有的社群卻沒有成功——群體協(xié)作的動力學，或許也可以通過類似的方式進行研究。

參考文獻

[ 1 ] Falmagne, G., Stephenson, A. B., & Levin, S. A. (2026). Interpretable early warnings using machine learning in an online game-experiment. Proceedings of the National Academy of Sciences, 123(1), e2503493122. https://doi.org/10.1073/pnas.2503493122

[ 2 ] DIGITAL MANDALAS: COMMUNICATION AND AUTHENTIC HUMAN INTERACTION IN REDDITS R/PLACE PLATFORM. (2022). Issues In Information Systems. https://doi.org/10.48009/3_iis_2022_102

[ 3 ] van den Hoven, E., & van der Berg, B. (2021). A comparison of happiness and exhilaration: An experience sampling study. Computers in Human Behavior, 121, 106809. https://doi.org/10.1016/j.chb.2021.106809

來源：返樸

編輯：丁香葉子

轉(zhuǎn)載內(nèi)容僅代表作者觀點

不代表中科院物理所立場

如需轉(zhuǎn)載請聯(lián)系原公眾號

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.