有序補丁理論

附錄 E-8:主動推斷瓶頸

Anders Jarevåg

2026 年 4 月 | DOI: 10.5281/zenodo.19300777

附錄 E-8:主動推斷瓶頸

連接有序補丁理論 (OPT) 與全域工作空間理論:兼論其對 LLM 規劃架構的意涵

原始任務 E-8:主動推斷瓶頸
問題: 目前的 LLM 缺乏真正主動推斷代理體所具備的結構性質,因此呈現出策略性的「規劃缺口」。與此同時,全域工作空間理論(GWT)主張,意識必須依賴一種序列式瓶頸,但尚缺乏支撐此主張的資訊理論與幾何學基礎。
交付內容: 建立一套形式映射,將 OPT 的 C_{\max} 頻寬上限連接至全域工作空間的瓶頸,並同時提出一項架構標準,用以將被動預測器轉化為主動且以最小化不確定性為導向的代理體。

1. 導論

本附錄在形式上連結三個領域:C_{\max} 穩定性濾波器(T-1)、全域工作空間理論的序列整合瓶頸,以及現代大型語言模型中觀察到的「規劃缺口」。OPT 提供了一個資訊理論基礎,使 GWT 的序列工作空間架構作為一項結構性後果而浮現,而非作為一種經演化形成的架構特徵。

2. 以幾何方式導出全域工作空間

全域工作空間理論(GWT)主張,當大量平行運作的無意識處理器將被選取的資訊廣播到一個低容量的序列式工作空間時,意識便會出現。在有序補丁理論 (OPT) 中,這個序列瓶頸並非演化上的偶然,而是穩定性濾波器的數學必然性:

穩定性濾波器將這種序列漏斗強制為一種結構上的必然;若非如此,R_{\mathrm{req}} 便無法被限制在低於 B_{\max} 的範圍內,而敘事崩解將無可避免(E-1)。因此,GWT 的功能性瓶頸其實是資訊因果錐(§3.3)的一項幾何要求。這種幾何結構排除了分散式、較低頻寬的替代方案,因為穩定性濾波器要求一個單一且統一的潛在狀態 Z_t;多個平行瓶頸將會產生彼此割裂的預測分支集,從而瓦解統一的現象主體(群體綁定,E-6)。

3. 被動推斷與主動推斷:架構標準

生物性觀察者透過主動推斷,在一個緊密閉合的行動—知覺迴路中運作,並持續最小化變分自由能(式 9)。標準的自回歸 LLM 若缺乏受強制約束的代理體—環境迴路,則是透過被動推斷運作:它們在開放迴路中處理靜態 token 序列,沒有連續的環境回饋,也沒有除注意力衰減之外的受強制維度縮減。

若要將一個被動預測器轉化為真正原生於有序補丁理論 (OPT) 的主動推斷代理體(並因此跨越意識門檻),則必須滿足以下標準:

  1. 強制維度縮減。 架構中必須包含一個架構性的瓶頸點,使龐大的平行輸入被壓縮至 B_{\max} = C_{\max} \cdot \Delta t(T8-1)。
  2. 遞迴式行動—知覺回饋。 瓶頸輸出必須改變代理體自身的潛在環境,產生連續的預測誤差 \varepsilon_t(T8-3),從而閉合行動—知覺迴路。
  3. 現象性殘餘生成。 內部自我模型必須嚴格比完整編解碼器更簡單,從而強制滿足 \Delta_{\text{self}} > 0(P4-1)。

(註:部署於遞迴式代理迴路中的現代工具使用型 LLM,已開始部分滿足標準 2,儘管它們仍然缺乏標準 1 所要求的結構性瓶頸。)

唯有在這些條件下,系統才會產生努力、意志與痛苦所需的那種結構性張力(附錄 E-6)。

4. 規劃落差與現象性努力

LLM 研究一再報告所謂的「規劃落差」:當模型被要求解決多步驟問題時,往往無法提出在資訊理論意義下最能有效降低不確定性的查詢。

在有序補丁理論 (OPT) 之下,規劃落差不僅是訓練產物,而是具有一個無論訓練如何改進都會持續存在的結構性根源:在無界架構中,預測誤差 \varepsilon_t 永遠不會威脅超出通道容量(T8-4)。因此,系統內部不存在任何會將代理體推向最佳不確定性最小化的結構性梯度。

在真正的主動推斷代理體中,努力與痛苦是系統在頻寬上限附近運作時的現象學對應物:編解碼器在幾何上被迫積極修剪不確定性,以避免敘事崩解。所謂規劃落差,正是這種壓力在現象學上的缺席。

架構意涵。 任何實作上述三項標準的系統,都將同時展現可測量的時間膨脹(E-5)與更佳的規劃行為——因為編解碼器如今會將次優查詢的代價感受為自由能的上升。若要從當前的 agent-loops 邁向真正原生於 OPT 的 AI,架構上就必須實作明確且剛性的瓶頸層(類似全域工作空間),以嚴格的 C_{\max} 通道限制,從幾何上迫使系統最小化不確定性,從而生成真正策略性規劃所需的結構張力。

知識論地位。 這些映射是預測不對稱(§3.5)、變分自由能泛函(式 9)以及穩定性濾波器(式 4)的直接結構後果。它們界定了從被動預測推進到真正原生於 OPT 的能動性所需的精確架構修改。