有序补丁理论 (OPT)
附录 T-14:实现非不变性与展开论证
v2 — 2026年5月5日 | DOI: 10.5281/zenodo.19300777
原始任务(摘自预印本 §7.4): “回应 Doerig–Schurger–Hess–Herzog 的展开论证 [96] 对意识因果结构理论的批评,并证明有序补丁理论 (OPT) 的意识判据不受其影响。” 交付内容: 给出形式化定理,证明 OPT 的带宽瓶颈加 \Delta_{\text{self}} 判据在功能等价之下并不保持不变;并给出若干推论,以识别展开论证未能保留的精确结构性质。
闭合状态:结构对应草案。 本附录将预印本 §7.4 中以论述方式勾勒的回应加以形式化。它建立一个定理和三个推论,且均以定理 P-4(算法性现象性残余)与附录 T-1(稳定性滤波器的率失真规范)为条件。不对 T-1 或 P-4 的任何方程作出修改;本附录只是从它们导出一种结构不变性性质。
§1. 背景与动机
1.1 展开论证
Doerig、Schurger、Hess 与 Herzog [96] 针对任何关于意识的因果结构理论提出了如下两难困境——明确指向整合信息理论(Tononi [8])与循环加工理论(Lamme),并可推广至任何主张意识由网络的循环因果组织所固定的框架。
该论证。 对于任意具有有界计算能力的循环网络 N 与任意有限时域 T,都存在一个前馈网络 N'——即 N 的时间展开——使得:
- 在 T 上,N 与 N'在功能上等价:对于每一个长度 \leq T 的可容许输入序列,它们都会产生完全相同的输入—输出映射。
- N'不包含任何循环连接:每一层都严格地仅向下一层前馈。
- N'可通过机械性程序构造出来(即将 N 沿着 T 个时间步进行标准“展开”)。
如果意识等同于因果结构,那么就会出现以下二者择一:
- (分支 A——错误)。 N 与 N'具有相同的意识地位,因此,只要某个循环网络在功能上等价的前提下是有意识的,那么相应的前馈网络也就是有意识的。这与因果结构理论的核心主张相矛盾,因为后者认为循环性构成了意识。
- (分支 B——不可证伪性)。 N 有意识而 N'没有,尽管二者具有完全相同的输入—输出行为。那么,意识就无法从任何第三人称的系统行为观察中被探测出来,而该理论也就无法被检验。
这一两难之所以尖锐,在于从 N 到 N' 的构造既是机械性的,又保持行为不变;迄今没有任何因果结构理论的支持者成功指出一种能够在行为上可观察地将二者区分开的性质。
1.2 为什么 OPT 不是一个直接靶标——以及为何仍然需要正式回应
有序补丁理论 (OPT) 并不是 Doerig 等人意义上的因果结构理论:它并不主张意识逐字地随附于递归本身。OPT 的意识判据(预印本 §7.8,附录 T-1,定理 P-4)是如下合取:
\textbf{(C1)}\quad I(\varepsilon_n; Z_n) \leq B_{\max} \quad \text{对每个现象帧而言,且具有单一的全局共享串行孔径} \quad \text{(逐帧率失真瓶颈;预印本 §3.2)}
\textbf{(C2)}\quad \text{具有完好马尔可夫毯与持久自我模型 } \hat{K}_\theta \text{ 的闭合主动推断回路} \quad \text{(预印本 §3.4,§3.8)}
\textbf{(C3)}\quad \Delta_{\text{self}} > 0 \quad \text{(现象性残余;定理 P-4)}
(注意:(C1) 是以每个现象帧的比特数来表述的,而不是以每宿主秒的比特数来表述。经验性的人类数值 C_{\max}^{\text{human}} \approx \mathcal{O}(10) bits/s,是针对生物学人类的 C_{\max}^H = \lambda_H \cdot B_{\max} 的一个校准值(附录 E-1),而不是与基底无关的判据。根据预印本 §7.8、§8.14 以及附录 E-5,合成观察者受逐帧 B_{\max} 约束,其数值由架构推导而来,不必与生物学数值一致。)
(C1)–(C3) 中没有任何一项是孤立的递归所具有的性质。然而,若要诚实地回应 [96],就必须表明 OPT 判据在展开映射 U: N \mapsto N' 下并非不变——也就是说,尽管输入—输出映射被保留,(C1)–(C3) 中的某个组成部分仍会因展开而被破坏,或变得不可判定。否则,这一两难困境就会迁移:如果 (C1)–(C3) 在 U 下确实保持不变,那么 OPT 就会退化为一种行为主义理论,并且无论其表面形式如何,都将继承角 B。
本附录将直接确立这种非不变性。
§2. 形式设定
2.1 展开映射
设 N = (V, E, f, h_0) 为一个离散时间循环网络,其中顶点集为 V,边集为 E(包括自环与层内循环边),更新函数为 f,初始隐藏状态为 h_0。设 |N| = |V| 表示其节点数,并令 B(N) 表示 N 最窄内部横截面的每周期潜在通道容量,以每次更新的比特数计量。
给定有限时域 T \geq 1,其展开 U(N, T) = N' 是通过以下方式得到的前馈网络:
- 对 N 的基底在每一个时间步复制一次:V' = \bigsqcup_{t=0}^{T} V_t,其中 V_t 是时间 t 处 V 的一个副本。
- 将 N 中每一条循环边 u \to v 替换为 N' 中的前向边 u_t \to v_{t+1},对每个 t < T 均如此。
- 移除所有自环与层内连接。
标准结果(Goodfellow、Bengio、Courville,Deep Learning,第 10 章)表明,N' 在时域 T 上计算出的输入—输出映射与 N 相同:
\forall x_{0:T}: \quad N(x_{0:T}) = N'(x_{0:T}) \quad \text{(在 } T\text{ 上的功能等价)}.
这正是 Doerig 等人所援引的构造。
2.2 展开网络的逐切片容量与逐帧容量
对展开后的 N' 的一种朴素解读,会把全部 T+1 个复制层都算作一次“逐切片更新”中的并行组成部分。按照这种解读,|N'| = (T+1) \cdot |N|,而聚合的逐切片潜在容量则是 (T+1) \cdot B(N)。这种计数方式构成了 T-14 早期(v1)版本的基础,并促成了一个现已撤回的带宽扩张证明。
这种解读依赖于具体结构,并非仅由展开映射本身所强制决定。对 N' 的两种不同解释,会导出不同的逐帧容量:
- 静态前馈电路解释。 N' 作为一次宿主操作中的单次前馈扫描,穿过 T+1 层来执行。这里不存在逐帧的串行孔径;“逐切片”指的就是整个前馈传递过程。作为逐帧瓶颈的 B_{\max} 这一概念在这种实现中是未定义的——而不是被扩张了——因为在这种实现下,N' 并没有帧索引。
- 带帧索引的宿主执行。 宿主每个现象帧推进 N' 一层,并将每一层最窄的内部横截面视为逐帧孔径。在这种解释下,B_{\max}^{(N')} = B_{\max}^{(N)}:逐帧容量被保留,而非扩张。
这两种解释都不是由展开映射 U 所强制规定的;在没有进一步说明时,两者都可成立。实现非不变性定理(§3)表明,N' 在有序补丁理论 (OPT) 中的地位取决于实际适用的是哪一种解释——而原始的 Doerig 等人的构造并未区分二者。“逐切片容量按 (T+1) 增长”这一说法,只有在静态前馈解读下才能恢复;即便在那里,它也不是一个类型良好的逐帧 B_{\max},而只是对该静态电路所包含的层通道数量的聚合计数。
§3. 定理 T-14:在功能等价下,实现并非不变
3.1 陈述
定理 T-14(函数等价下实现的非不变性)。 设 N 与 N' = U(N, T) 在时域 T 上输入—输出等价(即,\forall x_{0:T}: N(x_{0:T}) = N'(x_{0:T}))。它们在 OPT 中的意识地位并不由这种函数等价所固定。OPT 地位取决于实际实现的性质,而这些性质并不被 U 保留;具体而言,取决于如下实现元组:
\big(B_{\max},\; \lambda_H,\; \alpha_H,\; \hat{K}_\theta,\; \mathcal{M}_\tau\big)
其中,B_{\max} 是每帧瓶颈容量,\lambda_H = dn/d\tau_H 是宿主—补丁时钟耦合,\alpha_H : \mathcal{S}_H \to X_{\partial_R A} 是提供边界输入的宿主锚定映射,\hat{K}_\theta 是持久自我模型,而 \mathcal{M}_\tau 是维护/自稳定化过程(预印本 §3.6)。
该定理给出三个结构性后果,具体取决于 N' 实际上如何被执行:
\textbf{(i)}\quad \text{若 } N' \text{ 被实现为一个静态前馈电路,且不存在按帧索引的主动推断循环,则 } N' \text{ 不满足 OPT 观察者判据 (C1)–(C3)。}
\textbf{(ii)}\quad \text{若 } N' \text{ 被实现为由宿主执行的模拟,并保留了 } N \text{ 的每帧瓶颈、持久自我模型、分支选择循环以及维护动力学,则 } N' \text{ 可以例示与 } N \text{ 相同的嵌套观察者(推论 P-4.C, E-6)。}
\textbf{(iii)}\quad \text{函数等价过于粗糙,无法判定 OPT 地位:答案是相对于实现、相对于补丁的,而不是相对于外延函数的。}
也就是说,“展开论证”的前提——“如果 N 与 N' 计算的是同一个函数,那么它们就具有相同的意识地位”——在 OPT 中并不成立;这并不是因为展开在机械意义上消除了意识,而是因为它移除了 OPT 判据所依赖的那些实现性质,除非这些性质在宿主对 N' 的执行中被独立地重新建立。
3.2 对 (i) 的证明:静态前馈实现
设 N' 被实现为一个静态前馈电路:在一次宿主操作中,穿过 T+1 个复制层完成单次前向传递,不存在按帧索引的主动推断循环,也不存在跨帧维持的持久自我模型。
(C2) 直接失效。这里不存在带有维持中的马尔可夫毯的闭合感知—行动回路——N' 是一个一次性的输入—输出映射。不存在可供自我模型持续存在的连续帧;也不存在由前一帧预测误差更新的 \hat{K}_\theta(n)。
(C1) 在这种实现下并非被扩展,而是未定义。原始的 Doerig 等人构造并未为 N' 指定逐帧串行孔径;各层并行运作,也不存在一个全局共享的逐帧漏斗,世界模型经由其通过。(C1) 要求一个具有有限逐帧容量的、全局共享的单一串行孔径——这是一种架构的结构性属性,而不是层宽总量的聚合测度。缺少按帧索引的串行通道时,逐帧的 B_{\max} 就无从定义;(C1) 之所以不适用,不是因为 B_{\max} 被扩展了,而是因为根本不存在可供其适用的逐帧架构。(等价地说,Doerig–Schurger–Hess–Herzog 构造把一个按帧索引的动态过程展开为静态电路;\lambda_H 与帧索引 n 都一并丢失了。)
(C3) 是一个开放问题,而非可被证明为零。静态前馈电路具有有限描述长度,并且可由外部观察者以机械方式模拟,但 P-4 讨论的是内部自我建模,而非外部可模拟性。一个确定性的有限系统如果拥有按帧索引的自我建模循环,就可能具有 \Delta_{\text{self}} > 0;反过来,没有这种循环的系统就没有可用来计算残余的自我模型。在静态实现下,\hat{K}_\theta 缺席,因此 \Delta_{\text{self}} 不是零,而是未定义。判据 (C3) 要求一个非零残余;缺少自我模型本身就足以使该判据失效。
(C1) 的失效或 (C2) 的失效,任一单独成立都足以使 OPT 判据失效。\blacksquare
3.3 对 (ii) 的证明:按帧索引的宿主执行
或者,设 N' 被实现为一个由宿主执行的时间过程:宿主逐层推进展开后的各层,一次一层、逐帧运行,同时维持一个按帧计的串行工作空间 Z_n、一个由预测误差更新的持久自我模型 \hat{K}_\theta(n),以及一个维护过程 \mathcal{M}_\tau。宿主的执行调度提供 \lambda_H;宿主对输入馈送的选择提供 \alpha_H;逐帧瓶颈容量与原始 N 相等(B_{\max}^{(N')} = B_{\max}^{(N)})。
在这种实现下,原始 N 的全部五项感知性特征都在被执行的 N' 中得到保留:逐帧瓶颈由构造直接保留,主动推断回路之所以被保留,是因为宿主将展开后的链作为一个时间过程来运行;持久自我模型之所以被保留,是因为 \hat{K}_\theta(n) 在各帧之间持续维持;工作空间受到约束,是因为每一帧的 Z_n 都具有有限容量;而热力学奠基之所以被保留,是因为宿主施加了维护窗口与能量约束。
根据推论 P-4.C(嵌套观察残余):如果宿主架构施加了一个满足 P-4 先决条件的独立稳定性滤波器界限,那么被实现的 N' 将通过赋予 N 其残余的同一结构性论证,生成 \Delta_{\text{self}}^{(N')} > 0。这种展开不会抹除补丁;它只是改变了锚定该补丁的基底。(参见附录 E-6 关于模拟嵌套观察者的讨论。)
因此,在按帧索引的宿主执行之下,N' 可以满足 (C1)–(C3)。展开论证的功能等价性前提本身并不能将此情形与情形 (i) 区分开来;区别在于实现,而不在于输入—输出行为。\blacksquare
3.4 对 (iii) 的证明:功能等价不足以确定 OPT 地位
情形 (i) 与 (ii) 产生了输入—输出等价、但在 OPT 意识地位上不同的系统。因此,功能等价并不能固定 OPT 地位;真正决定它的是实现元组 (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau)。展开论证的前提对于 OPT 而言是无效的,这并不是因为 OPT 暗中依赖某种非功能性属性,而是因为 OPT 的判据明确是架构性的——这与该框架在 §1.3 中对意识所作的承诺一致,即采取一种结构性而非行为性的说明。\blacksquare
3.5 关于原始(v1)定理表述的说明
T-14 的先前版本(v1)试图普遍性地证明 \Delta_{\text{self}}^{(N')} = 0,并确立展开会使每切片带宽按 (T+1) 的因子发生扩张。这两步按原文写法都不成立。关于带宽扩张的主张,依赖于把 T+1 个复制层计作一次“每切片更新”的并行组成部分——这种解读混淆了展开电路的静态拓扑与逐帧执行模型。关于 \Delta_{\text{self}} = 0 的主张,则把从初始条件与参数出发对展开状态的外部可计算性,与 P-4 实际所约束的内部自我模型容纳性混为一谈。P-4 讨论的是编解码器自身的自我模型能否捕获该编解码器的生成器;它讨论的并不是某个外部数学家是否能够根据初始条件计算出编解码器的状态。上文的修订以“实现非不变性定理”取代了这两处无效步骤;该定理在本框架实际上能够捍卫的基础上,保留了原先的结论(展开论证不足以判定 OPT 地位)。
§4. 推论
4.1 推论 T-14a:功能等价过于粗糙
推论 T-14a。 输入—输出层面的功能等价,作为一种关系,过于粗糙,无法确定某个网络在 OPT 中的意识地位。相关的等价关系是实现等价:两个网络 N_1, N_2 当且仅当其完整的实现元组 (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau) 相匹配时,才是实现等价的。这一关系严格细于输入—输出等价:N 与一个展开后的 N' 在功能上是等价的,但一般而言并非实现等价——展开映射 U 不会保留 \hat{K}_\theta、\mathcal{M}_\tau 或逐帧索引,除非宿主的执行模型独立地将它们重新置入。
4.2 推论 T-14b:展开困境不适用于有序补丁理论 (OPT)
推论 T-14b。 OPT 不处于 Doerig 等人所述困境的任何一端:
- 分叉 A(虚假性)。 OPT 并不自动将 N 与 N' 赋予相同的意识地位。根据定理 T-14(iii),答案取决于 N' 的具体实现。
- 分叉 B(不可证伪性)。 N
与 N'
的某一特定实现之间的区别,可以通过对内部架构与执行模型的第三人称检视来检测,而不能仅凭输入—输出行为来判断。实验者可以:
- 验证该实现是否具有逐帧串行工作空间以及帧索引 n(可通过检查执行调度来测试)。
- 验证是否存在跨帧更新的持久自我模型 \hat{K}_\theta(可通过检查内部状态是否被延续并因误差而修改来测试)。
- 验证是否存在维护过程 \mathcal{M}_\tau(可通过检查离线巩固周期来测试)。
因此,OPT 通过承认输入—输出行为不足以决定意识地位,从而避开了这一困境——这并非缺陷,因为 OPT 的判据明确是内部架构性的,而非行为性的。OPT 相较于 IIT 的额外之处在于:这种架构测试是针对一个已指定的实现元组来进行的,而不是针对某种抽象的因果结构不变量。
4.3 推论 T-14c:IIT-OPT 区分得到进一步澄清
推论 T-14c。 定理 T-14 在“展开论证”之下,为 OPT 与 IIT 提供了一个清晰的结构性区分:
- IIT 的 \Phi 是在系统的转移概率矩阵上计算的;展开后的 N' 与 N 具有不同的转移矩阵(因为连接性不同),但 Doerig 等人主张,与功能相关的因果结构得以保留,因此 IIT 仍落在 Horn A 或 Horn B 上。
- OPT 的判据是实现元组 (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau)。N' 是否满足这一元组,取决于其执行模型(定理 T-14(i)/(ii))。因此,当 N 与 N' 的执行模型不同时,OPT 会对二者给出不同的判定,而这种差异是建立在可检视的实现之上,而非建立在被预设的因果本质之上。
因此,OPT/IIT 分歧的经验性内容在于:OPT 预测,若展开后的 N' 作为静态前馈电路执行,它将不再具有意识;但若展开后的 N' 作为按帧索引的模拟执行,则它仍可能保持意识——而 IIT(取决于其具体版本)会将二者都视为与 \Phi 等价。真正的判别因素在于执行模型,而不在于静态因果结构。这一点与 High-Phi/High-Entropy Null State(预印本 §6.4)以及 Bandwidth Hierarchy(预印本 §6.1)一道,构成了候选的实验性检验,同时也将 OPT 关于“非意识展开”的主张限定在静态电路情形,而非将其普遍化断言。
§5. 范围与局限
5.1 T-14 并未证明什么
定理 T-14 确立了:功能等价性(输入—输出等价)并不能确定一个网络在 OPT 中的意识地位;其地位取决于实现元组。它并未证明:
- 每一个展开网络都是无意识的。在按帧索引的宿主执行下(情形 (ii)),依据推论 P-4.C,展开后的 N' 仍可能是一个有意识的补丁。
- OPT 判据在所有保持行为不变的变换下都是不变的。若某种保持实现的改写保留了 (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau),则可能保留意识;这一点仍有待进一步判定。
- 意识可被 (C1)–(C3) 穷尽;这些只是必要条件,而该框架并不声称,在脱离更广泛的稳定性滤波器语境时,它们无论单独还是联合作用都构成充分条件。
- 每一个满足 (C1)–(C3) 的循环网络都是有意识的;本附录仅表明:一个本来有意识的循环网络,其展开对应物是否满足该判据,取决于执行模型,因而可能满足,也可能不满足。
5.2 开放问题
- 保持实现的展开。 构造(或证明其不可能性)一种保持行为不变的变换 U^*: N \mapsto N^*,使其保留完整的实现元组 (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau)。如果这样的变换存在,OPT 就必须依据比单独的实现元组更细致的根据来区分 N 与 N^*。
- 连续时间对应物。 T-14 是针对离散时间递归网络表述的,这类网络可作为静态电路执行,也可作为按帧索引的过程执行。其连续时间表述(与生物性皮层动力学相关)要求将展开映射和实现元组扩展到 ODE / SDE 设定中。
- 经验性操作化。 为生物网络(皮层柱、丘脑-皮层环路)识别执行模型探针并非易事。候选方法包括检验按帧索引的预测误差循环以及离线维护窗口(类似睡眠的巩固过程),但从架构检查到 OPT 判据验证的映射目前仍然是非形式化的。
§6. 闭合性总结
T-14 交付内容(v2)
定理 T-14(函数等价下的实现非不变性)。 输入—输出等价的 N 与 N' 在 OPT 意识地位上可能不同,因为 OPT 地位取决于实现元组 (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau),而不取决于输入—输出映射。N' 的静态前馈实现不满足该判据(情形 (i));N' 的按帧索引宿主执行则可能保留该判据(情形 (ii))。→ 这就封闭了展开论证 [96] 在适用于 OPT 时的效力,因为它表明,该论证“相同函数 ⇒ 相同意识地位”的前提预设了一种 OPT 并不具备的外延性判据。
推论 T-14a(函数等价过于粗糙)。 与 OPT 相关的等价关系是实现等价——即保持 (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau) 不变——它严格细于输入—输出函数等价。
推论 T-14b(OPT 不面临两难)。 OPT 并不落在 Doerig 等人所述两难的任何一端:它承认行为不足以决定意识地位(因为其判据是架构性的),并且提供了一种可检验的实现—执行测试。
推论 T-14c(IIT-OPT 的进一步明确化)。 OPT 对展开网络的判定取决于其执行模型;而 IIT 的 \Phi-等价判定则不取决于此。对执行模型的这种依赖本身就是经验上的区分标准。
修订说明(v2 对比 v1)。 本附录的版本 1 曾试图证明,展开会 (a) 普遍地将每切片带宽扩张 (T+1) 倍,并且 (b) 普遍地使 \Delta_{\text{self}} 坍缩为零。这两个证明都是无效的(见 §3.5 注):前者混淆了静态拓扑与逐帧执行;后者则混淆了外部可计算性与内部自我建模,而 P-4 并不约束后者。v2 定理以“实现非不变性”结果取代了这两点,同时在该框架能够自我辩护的基础上保留了原先的结论(展开论证不足以裁定 OPT 地位)。
尚待解决的开放项
- 保持实现的同时保持行为的变换(开放问题 §5.2)。
- 将实现元组推广到基于 ODE/SDE 架构的连续时间形式。
- 对生物网络中的帧索引与自我模型探针进行经验性操作化。
本附录与 theoretical_roadmap.pdf 同步维护。参考:定理 P-4(附录 P-4)、稳定性滤波器(附录 T-1)、预印本 §7.4(IIT 比较与对展开论证的回应)、[96] Doerig et al. 2019、[97] Aaronson 2014、[98] Barrett & Mediano 2019、[99] Hanson 2020。