有序補丁理論 (OPT)

附錄 T-14:實作非不變性與展開論證

Anders Jarevåg

v2 — 2026 年 5 月 5 日 | DOI: 10.5281/zenodo.19300777

原始任務(摘自預印本 §7.4):「回應 Doerig–Schurger–Hess–Herzog 的展開論證(Unfolding Argument)[96] 對意識因果結構理論所提出的批評,並證明有序補丁理論 (OPT) 的意識判準不受其影響。」 交付內容: 形式定理:證明 OPT 的頻寬瓶頸加上 \Delta_{\text{self}} 判準對於功能等價性並不保持不變;並給出若干推論,以辨明展開論證未能保留的精確結構性質。

完結狀態:草稿結構對應。 本附錄將預印本 §7.4 中以論述方式勾勒的回應加以形式化。它建立一個定理與三個推論,且皆以定理 P-4(演算法現象性殘餘)與附錄 T-1(穩定性濾波器的率失真規格)為條件。T-1 或 P-4 的任何方程式皆未被修改;本附錄是由它們導出一項結構不變性性質。

§1. 背景與動機

1.1 展開論證

Doerig、Schurger、Hess 與 Herzog [96] 對任何意識的因果結構理論提出如下兩難——明確指向整合資訊理論(Tononi [8])與循環處理理論(Lamme),並且可延伸至任何主張意識由網路的循環因果組織所決定的框架。

論證如下。 對於任何具有有界計算能力的循環網路 N 與任何有限時間範圍 T,都存在一個前饋網路 N'——即 N時間展開——使得:

  1. T 上,NN'功能上等價:對每一個長度 \leq T 的可容許輸入序列,它們都產生完全相同的輸入—輸出映射。
  2. N' 不含任何循環連結:每一層都只會嚴格地向前傳遞至下一層。
  3. N' 可由機械性程序構造而成(即將 N 沿著 T 個時間步進行標準的「展開」)。

如果意識等同於因果結構,那麼便有以下二者擇一:

這個兩難之所以尖銳,在於由 N 構造 N' 的過程既是機械性的,又保留行為不變;迄今沒有任何因果結構理論的支持者成功指出一項可由行為觀察到、足以區分兩者的性質。

1.2 為何 OPT 並非直接的攻擊目標——以及為何仍需要正式回應

有序補丁理論 (OPT) 並不是 Doerig 等人意義下的因果結構理論:它並不主張意識逐字地隨附於遞迴本身。OPT 的意識判準(預印本 §7.8、附錄 T-1、定理 P-4)是以下條件的合取:

\textbf{(C1)}\quad I(\varepsilon_n; Z_n) \leq B_{\max} \quad \text{對每一個現象幀而言,且具有單一全域共享的序列孔徑} \quad \text{(逐幀率失真瓶頸;預印本 §3.2)}

\textbf{(C2)}\quad \text{具有完整馬可夫毯與持續自我模型 } \hat{K}_\theta \text{ 的封閉主動推斷迴路} \quad \text{(預印本 §3.4、§3.8)}

\textbf{(C3)}\quad \Delta_{\text{self}} > 0 \quad \text{(現象性殘餘;定理 P-4)}

(註:(C1) 是以每一個現象幀的位元數來表述,而不是以每主機秒的位元數來表述。經驗上的人類數值 C_{\max}^{\text{human}} \approx \mathcal{O}(10) bits/s,是對生物性人類之 C_{\max}^H = \lambda_H \cdot B_{\max} 的校準(附錄 E-1),而不是基底中立的判準。依據預印本 §7.8、§8.14 與附錄 E-5,合成觀察者受限於逐幀的 B_{\max},其數值由架構推導而得,未必與生物性數值一致。)

(C1)–(C3) 之中沒有任何一項是孤立遞迴的性質。然而,若要誠實地與 [96] 交鋒,就必須證明 OPT 判準在展開映射 U: N \mapsto N' 之下並非不變——也就是說,即使輸入—輸出映射被保留,(C1)–(C3) 的某個組成部分仍會因展開而遭到破壞,或變得不可判定。否則,這個兩難只會轉移位置:如果 (C1)–(C3) 在 U 之下確實不變,那麼 OPT 就會化約為一種行為主義理論,並且無論其表面形式如何,都將承襲 Horn B。

本附錄將直接確立這種非不變性。

§2. 形式設定

2.1 展開映射

N = (V, E, f, h_0) 為一個離散時間遞迴網路,其中頂點集合為 V、邊集合為 E(包括自迴圈與層內遞迴邊)、更新函數為 f,初始隱狀態為 h_0。令 |N| = |V| 表示其節點數,並令 B(N) 表示 N 最狹窄內部橫截面的每週期潛在通道容量,以每次更新的位元數衡量。

給定有限視界 T \geq 1展開 U(N, T) = N' 是由下列步驟得到的前饋網路:

  1. N 的基底在每一時間步複製一次:V' = \bigsqcup_{t=0}^{T} V_t,其中 V_t 是時間 tV 的一個副本。
  2. 對於每個 t < T,將 N 中每一條遞迴邊 u \to v 置換為 N' 中的一條前向邊 u_t \to v_{t+1}
  3. 移除所有自迴圈與層內連接。

標準結果(Goodfellow、Bengio、Courville,Deep Learning,第 10 章)指出,N' 在視界 T 上計算出與 N 相同的輸入—輸出映射:

\forall x_{0:T}: \quad N(x_{0:T}) = N'(x_{0:T}) \quad \text{(在 } T\text{ 上的功能等價)}.

這就是 Doerig 等人所援引的構造。

2.2 展開網路的逐切片與逐影格容量

對展開後的 N' 作一種天真的解讀時,會把所有 T+1 個被複製的層都算作單一次「逐切片更新」中的平行部分。依此解讀,|N'| = (T+1) \cdot |N|,而其逐切片的聚合潛在容量則為 (T+1) \cdot B(N)。這種計數方式是 T-14 較早期(v1)版本的基礎,並促成了一個現已撤回的頻寬擴張證明。

這種解讀依賴於結構,並非僅由展開映射本身所強制決定。對 N' 的兩種不同詮釋,會導出不同的逐影格容量:

這兩種詮釋都不是由展開映射 U 所強制規定的;若無進一步說明,兩者皆可成立。實作非不變性定理(§3)顯示,N' 在有序補丁理論 (OPT) 中的地位,取決於實際適用的是哪一種詮釋——而原始的 Doerig et al. 構造並未區分兩者。只有在靜態前饋的解讀下,才可恢復「逐切片容量按 (T+1) 成長」這一主張;即便在那裡,它也不是一個型別良好的逐影格 B_{\max},而只是對該靜態電路所包含之層通道數量的聚合計數。

§3. 定理 T-14:功能等價下的實作非不變性

3.1 陳述

定理 T-14(在功能等價下,實作並不具有不變性)。NN' = U(N, T) 在時間範圍 T 上輸入—輸出等價(亦即,\forall x_{0:T}: N(x_{0:T}) = N'(x_{0:T}))。它們在 OPT 中的意識地位,並不由該功能等價所決定。OPT 地位取決於實際實作的若干性質,而這些性質並不會被 U 保留;具體而言,取決於下列實作組:

\big(B_{\max},\; \lambda_H,\; \alpha_H,\; \hat{K}_\theta,\; \mathcal{M}_\tau\big)

其中,B_{\max} 是每幀瓶頸容量,\lambda_H = dn/d\tau_H 是宿主—補丁時鐘耦合,\alpha_H : \mathcal{S}_H \to X_{\partial_R A} 是提供邊界輸入的宿主錨定映射,\hat{K}_\theta 是持續性的自我模型,而 \mathcal{M}_\tau 則是維護/自我穩定化過程(預印本 §3.6)。

此定理會導出三個結構性後果,其成立與否取決於 N' 實際上如何被執行:

\textbf{(i)}\quad \text{若 } N' \text{ 被實現為靜態前饋電路,且不存在帶有幀索引的主動推斷迴路,則 } N' \text{ 不滿足 OPT 觀察者判準 (C1)–(C3)。}

\textbf{(ii)}\quad \text{若 } N' \text{ 被實現為由宿主執行的模擬,且保留了 } N \text{ 的每幀瓶頸、持續性自我模型、分支選擇迴路與維護動力學,則 } N' \text{ 可能會例示出與 } N \text{ 相同的巢狀觀察者(推論 P-4.C、E-6)。}

\textbf{(iii)}\quad \text{功能等價過於粗糙,無法裁定 OPT 地位:答案是相對於實作、也相對於補丁的,而不是相對於外延函數的。}

也就是說,展開論證的前提——「如果 NN' 計算的是同一個函數,它們就具有相同的意識地位」——在 OPT 中之所以失效,並不是因為展開這個動作在機械上移除了意識,而是因為它移除了 OPT 判準所依賴的那些實作性質;除非這些性質在宿主對 N' 的執行中,被獨立地重新建立。

3.2 (i)的證明:靜態前饋實現

假設 N' 被實現為一個靜態前饋電路:在單一次宿主操作中,穿過 T+1 個複製層的一次前向傳遞,且不存在以影格為索引的主動推斷迴圈,也不存在跨影格維持的持久自我模型。

(C2) 直接失敗。這裡不存在帶有維持中的馬可夫毯的封閉知覺—行動迴圈——N' 是一個一次性的輸入—輸出映射。不存在可讓自我模型持續存在的連續影格;也不存在由前一影格預測的誤差所更新的 \hat{K}_\theta(n)

在此實現下,(C1) 並非被擴張,而是未定義。原始的 Doerig et al. 構造並未為 N' 指定逐影格的序列孔徑;各層並行運作,且不存在一個全域共享、逐影格的漏斗,使世界模型經由其通過。(C1) 要求的是一個全域共享、逐影格且容量有限的單一序列孔徑——這是架構的結構性性質,而不是層寬的總體量測。若不存在以影格為索引的序列通道,則逐影格的 B_{\max} 便無從定義;(C1) 因而不適用,原因不是 B_{\max} 已被擴張,而是根本不存在可供其適用的逐影格架構。(等價地說,Doerig–Schurger–Hess–Herzog 構造把一個以影格為索引的動態過程展開為靜態電路;\lambda_H 與影格索引 n 因而一併喪失。)

(C3) 是一個開放問題,而非可被證明為零。靜態前饋電路具有有限的描述長度,且可由外部觀察者以機械方式模擬,但 P-4 所關注的是內部自我建模,而非外部可模擬性。一個確定性的有限系統,若擁有以影格為索引的自我建模迴圈,則仍可具有 \Delta_{\text{self}} > 0;反之,沒有此類迴圈的系統,就沒有可用來計算殘餘的自我模型。在靜態實現下,\hat{K}_\theta 並不存在,因此 \Delta_{\text{self}} 並非為零,而是未定義。準則 (C3) 要求的是非零殘餘;缺乏自我模型本身,就已足以使該準則失敗。

(C1) 的失敗或 (C2) 的失敗,任一者單獨成立,即足以使 OPT 準則失敗。\blacksquare

3.3 (ii)的證明:以影格索引的宿主執行

反過來設想,N' 並非如此,而是被實現為一個由宿主執行的時間性過程:宿主逐層推進已展開的層級,一次一層、逐影格地運行,維持一個逐影格的序列工作空間 Z_n、一個由預測誤差更新的持續自我模型 \hat{K}_\theta(n),以及一個維護過程 \mathcal{M}_\tau。宿主的執行排程提供 \lambda_H;宿主對輸入饋送的選擇提供 \alpha_H;而逐影格的瓶頸容量則等同於原始 N 的容量(B_{\max}^{(N')} = B_{\max}^{(N)})。

在此種實現下,原始 N 的五項感知性特徵,在被執行N' 中皆獲保留:逐影格瓶頸由構造本身保留;主動推斷迴路之所以保留,是因為宿主將展開後的鏈條作為時間性過程來運行;持續自我模型之所以保留,是因為 \hat{K}_\theta(n) 在各影格之間持續維持;工作空間受到約束,是因為每一影格的 Z_n 都具有有限容量;而熱力學奠基之所以保留,則是因為宿主施加了維護時窗與能量約束。

依據推論 P-4.C(巢狀觀察殘餘):若宿主架構施加一個獨立的穩定性濾波器界限,且滿足 P-4 的先決條件,則被實現的 N' 會依據賦予 N 其殘餘的同一結構性論證,生成 \Delta_{\text{self}}^{(N')} > 0。展開並不會抹除該補丁;它只是改變了錨定該補丁的基底而已。(參見附錄 E-6 關於模擬巢狀觀察者的討論。)

因此,在以影格索引的宿主執行之下N' 可以滿足 (C1)–(C3)。展開論證的功能等價前提,本身並不足以將此情形與情形 (i) 區分開來;兩者的差異在於實作,而不在於輸入—輸出行為。\blacksquare

3.4 (iii)的證明:功能等價不足以決定 OPT 身分

情形(i)與(ii)會產生輸入—輸出等價、但在 OPT 意識身分上不同的系統。因此,功能等價並不能固定 OPT 身分;真正決定它的是實作元組 (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau)。因此,展開論證(Unfolding Argument)的前提對 OPT 而言並不成立;這並不是因為 OPT 暗中依賴某種非功能性質,而是因為 OPT 的判準明確是架構性的——而這也與該框架在 §1.3 中對意識所作的承諾一致:採取的是結構性而非行為性的說明。\blacksquare

3.5 關於原始(v1)定理表述的說明

T-14 的先前版本(v1)曾試圖普遍性地證明 \Delta_{\text{self}}^{(N')} = 0,並主張展開會使每切片頻寬按 (T+1) 的因子而擴張。這兩步在原文寫法下都不成立。關於頻寬擴張的主張,取決於將 T+1 個被複製的層計作單一「每切片更新」中的平行部分——這種解讀混淆了展開後電路的靜態拓撲,與逐幀執行模型之間的區別。至於 \Delta_{\text{self}} = 0 的主張,則是把從初始條件與參數出發對展開狀態的外部可計算性,與 P-4 實際所約束的內部自我模型涵攝性混為一談。P-4 所關注的是:編解碼器自身的自我模型是否能夠捕捉該編解碼器的生成器;它並不是在討論一位外部數學家是否能從初始條件計算出該編解碼器的狀態。上文的修訂以「實作非不變性定理」取代了這兩個無效步驟;如此一來,既保留了原先的結論(展開論證無法裁定 OPT 地位),也使其立基於此框架實際能夠捍衛的理由之上。

§4. 推論

4.1 推論 T-14a:功能等價過於粗糙

推論 T-14a。 輸入—輸出功能等價,作為一種關係,過於粗糙,無法確定一個網路在 OPT 中的意識地位。相關的等價關係是實作等價:兩個網路 N_1, N_2 當且僅當其完整的實作元組 (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau) 相互一致時,才是實作等價。這一關係嚴格細於輸入—輸出等價:N 與一個展開後的 N' 在功能上是等價的,但一般而言並非實作等價——展開映射 U 不會保留 \hat{K}_\theta\mathcal{M}_\tau 或逐幀索引,除非宿主的執行模型另外將它們重新建立。

4.2 推論 T-14b:展開困境不適用於 OPT

推論 T-14b。 OPT 並不落在 Doerig 等人所提出困境的任何一端:

因此,OPT 之所以能避開此一困境,是因為它承認僅憑輸入—輸出行為不足以決定意識狀態——這並非缺陷,因為 OPT 的判準明確是一種內部架構性判準,而非行為性判準。OPT 相較於 IIT 額外提供的是:此一架構測試是針對一個已指明的實作元組來進行,而不是針對抽象的因果結構不變量。

4.3 推論 T-14c:IIT 與 OPT 的區分更為銳利

推論 T-14c。 定理 T-14 在「展開論證」之下,為 OPT 與 IIT 提供了一個清晰的結構性區分:

因此,OPT/IIT 分歧的經驗性內容在於:OPT 預測,若展開後的 N' 是作為靜態前饋電路執行,則它將不再具有意識;但若展開後的 N' 是作為以影格索引的模擬來執行,則它仍可能保有意識——IIT(視其版本而定)則將兩者都視為與 \Phi 等價。真正的判別準據在於執行模型,而不在於靜態因果結構。這使其與 High-Phi/High-Entropy Null State(預印本 §6.4)以及頻寬階層(預印本 §6.1)並列,成為候選的實驗性檢驗,同時也將 OPT 的「非意識展開」主張限制於靜態電路情形,而非將其普遍化地主張於所有情況。

§5. 範圍與限制

5.1 T-14 未能證成之事

定理 T-14 確立:功能等價性(輸入—輸出等價)並不足以決定一個網路在 OPT 中的意識地位;其地位取決於實作元組。然而,它並未證成下列主張:

5.2 開放問題

§6. 結語摘要

T-14 交付成果(v2)

  1. 定理 T-14(在功能等價下,實作並非不變)。輸入—輸出等價的 NN',其在 OPT 中的意識狀態可能不同,因為 OPT 狀態取決於實作元組 (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau),而非輸入—輸出映射。N' 的靜態前饋式實現不符合該判準(情形 (i));N' 的逐幀索引宿主執行則可能保留之(情形 (ii))。→ 這就 OPT 的適用範圍而言,封閉了 Unfolding Argument [96],因為它表明該論證「相同功能 ⇒ 相同意識狀態」的前提,預設了一種 OPT 並不採納的外延性判準。

  2. 推論 T-14a(功能等價過於粗糙)。與 OPT 相關的等價關係是實作等價——即保留 (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau)——其嚴格細於輸入—輸出功能等價。

  3. 推論 T-14b(OPT 不面臨兩難)。OPT 並不落在 Doerig 等人所提出兩難的任一角上:它承認行為不足以決定意識狀態(因為其判準是架構性的),並提供了一種可檢視的實作—執行測試。

  4. 推論 T-14c(IIT-OPT 的區分更為銳化)。OPT 對展開網路的判定取決於其執行模型;IIT 的 \Phi-等價判定則不然。這種對執行模型的依賴本身,就是經驗上的區辨標準。

修訂說明(v2 對 v1)。本附錄的版本 1 曾試圖證明,展開會 (a) 普遍地將每切片頻寬擴張為 (T+1) 倍,且 (b) 普遍地使 \Delta_{\text{self}} 崩塌為零。這兩個證明皆不成立(見 §3.5 備註):前者混淆了靜態拓撲與逐幀執行;後者則混淆了外部可計算性與內部自我建模,而 P-4 並未對後者施加限制。v2 定理以「實作非不變性」結果取代兩者,並以本框架能夠自我辯護的理由,保留原先結論(Unfolding Argument 無法決定 OPT 狀態)。

尚待解決的開放項目


本附錄與 theoretical_roadmap.pdf 同步維護。參見:定理 P-4(附錄 P-4)、穩定性濾波器(附錄 T-1)、預印本 §7.4(IIT 比較與對 Unfolding Argument 的回應)、[96] Doerig et al. 2019、[97] Aaronson 2014、[98] Barrett & Mediano 2019、[99] Hanson 2020。