網易首頁 > 網易號 > 正文申請入駐

深度Transformer流形中的潛在客體永久性：拓撲相變、自由能原理與重正化群流

2026-04-09 16:07:00　來源: CreateAMind

上海舉報

分享至

Latent Object Permanence: Topological Phase Transitions, Free-Energy Principles, and Renormalization Group Flows in Deep Transformer Manifolds

https://arxiv.org/pdf/2601.19942

摘要

1 引言

針對 Transformer 模型的可解釋性研究 [1] 通常將其潛在空間視為連續的語義場，其中意義以近似線性方向編碼 [2,3]。然而，多步推理需要實際上是離散的操作：否定、量化、變量綁定以及組合控制流。各種瓶頸假設——例如意識先驗[4] 和類似膠囊的分解 [5]——表明，高層認知需要稀疏、可操作的因子，這些因子的行為類似于潛在的“對象”。

我們研究深度 Transformer 是否自發實現了這種離散化，其機制類似于重整化群 [7]：一種粗粒化流，積分掉短程關聯（局部句法），并穩定長程算子（邏輯/語義關系）。與強調淺層特征疊加的論述 [6,8] 不同，我們關注出現推理的深層區，并探究潛在幾何是否表現出相變的特征。

核心論點。在足夠規模下，深度扮演了隱式冷卻計劃的角色：注意力變得更加尖銳，自由能降低，協方差譜出現尖峰與間隙，有效維度發生坍縮。我們將臨界后的區域解釋為“固態”相，在該相中，潛在軌跡集中于支持跨步驟對象持久性的穩定吸引盆（瞬態類對象）附近。

2 預備知識與可觀測變量

3 潛在流形的信息幾何3.1 由輸出分布誘導的 Fisher 度量

3.2 曲率作為層次結構的代理指標

曲率量（例如 Ricci 曲率）度量測地線的匯聚/發散，并可以對表征的層次結構進行編碼。雖然我們不假定常曲率，但我們提出以下內容作為一個診斷性假設：

定義 3.1（雙曲嵌入假設（診斷性））。當有效潛在幾何在相關子空間中表現出負曲率時，深層語義層次結構會得到促進。預期淺層的行為更接近局部歐幾里得幾何（句法），而深層可能誘導出更負曲率的有效幾何（層次化語義）。

4 注意力的熱力學：一個自由能原理4.1 Softmax 作為吉布斯分布

5 隨機矩陣理論基線與尖峰協方差5.1 作為零模型的 Marchenko–Pastur 分布

5.2 低秩信號與尖峰

一個典型的結構化模型是尖峰協方差形式

注 2.在高維漸近理論中，尖峰模型存在一個檢測閾值（BBP 型相變）：當尖峰強度超過某個臨界值時，它會在譜上變得可分離，從而將“隱藏”因子轉變為“可觀測”的特征向量方向 [17]。我們將此作為概念類比：增加模型規模可以將語義因子推過可檢測性閾值，表現為涌現的尖峰和秩坍縮。

6 重整化群視角與嚴格的譜坍縮條件6.1 作為橫向收縮的粗粒化

我們現在給出充分的條件下，某個深度區間必然會產生有效維度坍縮，從而將 RG 思想形式化為不相關方向的收縮。

6.2 邏輯可分性蘊含低秩結構（混合模型）

為了將類似邏輯的離散性與譜聯系起來，而不假設冪律關系，考慮一個簡單但嚴謹的模型：潛在狀態聚集在 k k個原型周圍。

8 方法論8.1 模型套件

我們分析一套參數量跨越一個數量級的模型，以區分容量受限行為與涌現現象 [9,10]：

小規模（10億–30億參數）：Qwen-2.5-1.5B [11], Gemma-2-2B [12]。
中等規模（80億–110億參數）：Llama-3-8B [13]；基于 SOLAR-10.7B 的 110 億參數類模型 [14]。
大規模（300億+ 參數）：MiroThinker-30B（面向推理）。

8.2 激活提取與協方差估計

8.3 潛在對象探測與量化

圖 1 可視化了這一序參量的微觀演化。熱力圖顯示，該相變不僅僅是均值的偏移，更是概率質量的分岔：推理模型發展出一個與低完整性背景分離的獨特的高完整性模式（“固態”帶），而較小的模型仍然保持有效的單峰分布。

10 討論10.1 從疊加到正交性約束

疊加可以在有限維度中編碼許多特征 [8]。然而，類邏輯操作施加了可分性約束：如果一個表征必須在多步鏈中可靠地區分互斥的謂詞，那么穩定的類區域（吸引盆）就變得有利。定理 6.3 表明，即使是一個簡單的類混合模型，也會產生嚴格的低秩加各向同性結構，從而在不假設任何特定冪律的情況下產生譜間隙和有效秩坍縮。

10.2 瞬態類對象作為動力學對象

我們以同時兼容收縮機制和自由能銳化機制的方式來定義 TCO。

10.3 為什么c0.42可能在跨尺度下保持穩定

11 結論

我們提供了一個擴展的、數學上明確的框架，將大型語言模型中的涌現推理能力與潛在幾何中的相變聯系起來。我們的貢獻包括：(i) 對注意力的熱力學變分刻畫（自由能最小化）；(ii) 隨機矩陣理論基線（Marchenko–Pastur 譜 bulk）以及基于尖峰的結構；(iii) 通過橫向收縮實現譜坍縮的充分條件；(iv) 嚴格的混合模型結果，表明離散的類結構蘊含低秩的信號特征值。在此觀點下，瞬態類對象是由類似重整化群的深度流所產生的穩定吸引盆，該深度流在壓縮不相關方向的同時，保留了一個低維的語義骨架。

原文鏈接：https://arxiv.org/pdf/2601.19942

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.