有序补丁理论

附录 T-12:基底保真与缓慢腐化

Anders Jarevåg

2026年4月17日 | DOI: 10.5281/zenodo.19300777

原始任务(摘自第 8.3 节,限制 9): “将慢性腐化失效模式形式化——在这种情形下,编解码器在持续被滤除的输入之下发生适应,而 MDL 剪枝过程会正确地抹除对被排除真相的容量——并同时给出一项基底保真条件,将对独立输入通道的要求作为形式化防御。” 交付内容: 不可逆容量损失、不可判定性极限以及基底保真条件的形式证明。

闭合状态:草案性结构对应。 本附录将配套伦理论文(幸存者守望,第 V.3a 节)中以论述方式引入的叙事漂移分析,以及预印本中关于叙事漂移的段落(第 3.3 节)加以形式化。它建立了三个定理和一个命题。MDL 剪枝方程(T9-3, T9-4)保持不变;本附录展示了它们在经过滤输入下的病理性但正确的行为。


§1. 背景与动机

1.1 两种失效模式

稳定性滤波器(预印本第 3.3 节)施加了一项可存续性条件:只有在所需预测速率 R_{\text{req}} 保持在编解码器带宽 B 之内的流中,观察者才能持续存在。当 R_{\text{req}} 超过 B 时,编解码器会经历叙事崩解——一种急性失效,其特征是预测误差不断升级、熵持续累积,并最终导致连贯性的瓦解。

还存在一种互补的失效模式,它不会触发任何失效信号。如果输入流被系统性地预先过滤——从而生成一种内部一致、却排除了真实基底信息的经策划信号——那么编解码器将表现出较低的 \varepsilon_t,运行高效的维护周期,并满足全部稳定性条件,同时却在关于基底的问题上系统性地出错。这就是叙事漂移:一种慢性的编解码器腐化,其按自身尺度衡量时运作得近乎完美。

1.2 为何这很危险

叙事崩解会自行显露。编解码器会体验到不断上升的 \varepsilon_t、对预测失效的觉察,以及认知过载。观察者知道出了问题,即便它未必能立刻加以修复。

叙事漂移则是无声的。由于经过滤的输入流与编解码器的预测相匹配,\varepsilon_t 会保持在较低水平。维护周期照常运行。编解码器的自我模型会报告稳定而准确的运作状态。这种腐化从内部是不可见的,因为负责检测的工具本身,已经被造成这种腐化的同一滤波器所塑形。

1.3 本附录的范围

本附录提供:

  1. 对预滤波算子 \mathcal{F} 的形式化定义,以及它对编解码器输入分布的影响(§2)。
  2. 证明:在经 \mathcal{F} 滤波的输入下进行 MDL 剪枝,会不可逆地摧毁编解码器对被排除信号的建模能力——定理 T-12(§3)。
  3. 证明:一个已完全适应的编解码器无法从内部区分经过滤波的输入与未经过滤波的输入——即不可判定性极限定理 T-12a(§4)。
  4. 作为必要结构性防御的基底保真条件——定理 T-12b(§5)。
  5. 对文明级编解码器与 AI 系统的后果(§6)。

§2. 预滤波算子

2.1 定义

定义 T-12.D1(预滤波算子)预滤波器是一个映射 \mathcal{F} : \mathcal{X} \to \mathcal{X}',它在输入流 X_{\partial_R A}(t) 到达编解码器的感官边界之前对其进行作用,其中 \mathcal{X}' \subset \mathcal{X}。滤波后的信号为:

X'(t) = \mathcal{F}\!\left(X_{\partial_R A}(t)\right) \tag{T-12.D1}

预滤波器满足:

  1. 内部一致性: X'(t)\mathcal{X} 内的有效信号——编解码器可以在不触发错误标记的情况下对其进行压缩。

  2. 系统性排除: 存在一个非空子集 \mathcal{X}_{\text{excl}} = \mathcal{X} \setminus \mathcal{X}',其中包含由基底导出的、被 \mathcal{F} 移除的信号。

  3. 透明性: 该滤波器并未在编解码器的模型中得到表征。编解码器将其输入建模为 X_{\partial_R A}(t),而不是 \mathcal{F}(X_{\partial_R A}(t))

2.2 过滤之下的调谐

当编解码器在持续时段 \tau \gg \tau_{\text{prune}}(其中 \tau_{\text{prune}} 是来自 T-13.P1 的 MDL 剪枝时间尺度)上作用于 X'(t) 时,生成模型 P_\theta(t) 会适应 X' 的统计特性,而非 X 的统计特性。经过过滤输入下的预测误差为:

\varepsilon'_t = X'(t) - \pi_t \tag{1}

随着 P_\thetaX' 完成调谐,\varepsilon'_t \to 0(就均值而言)。编解码器按照其自身的度量标准运行良好。没有任何东西会被登记为异常。

2.3 示例

预滤波算子在不同尺度上都有具体体现:

尺度 预滤波 \mathcal{F} 被排除的信号 \mathcal{X}_{\text{excl}}
个体 确认偏误;选择性接触 不利证据
制度 宣传性媒体;经策划筛选的社交媒体信息流 多元视角;少数派报告
文明 算法化内容策展;教育单一化 跨文化信息;历史反叙事
人工 RLHF 微调;经筛选的训练语料 分布外知识;被排除的领域

§3. 定理 T-12:不可逆的容量损失

3.1 机制

MDL 剪枝遍历(T9-3,T9-4)依据每个编解码器组分 \theta_i可观测输入流的预测贡献来评估它,并扣除存储成本:

\Delta_{\mathrm{MDL}}(\theta_i) := I\!\left(\theta_i\,;\,X_{t+1:t+\tau} \mid \theta_{-i}\right) - \lambda \cdot K(\theta_i) \tag{T9-3}

在经过滤波的输入 X' 下,互信息项是相对于 X' 而非 X 来评估的。若某个组分 \theta_i 对预测被排除的信号 \mathcal{X}_{\text{excl}} 至关重要,但对预测 X' 毫无贡献,则有:

I\!\left(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}\right) = 0 \tag{2}

因此:

\Delta_{\mathrm{MDL}}(\theta_i) = -\lambda \cdot K(\theta_i) < 0 \tag{3}

于是,剪枝规则(T9-4)被触发:\theta_i 被擦除。

3.2 不可逆性

定理 T-12(滤波输入下的不可逆容量损失)。 K_\theta 为一个在预滤波输入 X' = \mathcal{F}(X) 下运行、持续时间为 \tau \gg \tau_{\text{prune}} 的编解码器。设 \Theta_{\text{excl}} \subset \theta 为这样一组编解码器组分:它们的预测贡献仅指向被排除的信号 \mathcal{X}_{\text{excl}}。则 MDL 剪枝过程(T9-3, T9-4)会抹除 \Theta_{\text{excl}},且这种抹除在编解码器层面上是不可逆的:

K\!\left(P_\theta(t + \tau)\right) < K\!\left(P_\theta(t)\right) - \sum_{\theta_i \in \Theta_{\text{excl}}} K(\theta_i) \tag{T-12}

剪枝之后,编解码器对 \mathcal{X}_{\text{excl}} 的建模能力并非只是处于休眠状态——评估、预测或注意 \mathcal{X}_{\text{excl}} 所需的表征基础设施已经被摧毁。

证明。

  1. 由 (T9-3) 可知,在滤波后的流 X' 下,每个 \theta_i \in \Theta_{\text{excl}} 都满足 \Delta_{\mathrm{MDL}}(\theta_i) < 0,因为 I(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}) = 0,而同时 K(\theta_i) > 0

  2. 由 (T9-4) 可知,每个这样的 \theta_i 都会在维护周期中被剪除。

  3. 在 MDL 之下,剪枝是一种抹除操作,而非抑制。编解码器并不是以某种线索即可恢复的意义上“遗忘”了 \theta_i。它所摧毁的是 \theta_i 所代表的计算基础设施——参数、连接以及评估机制。这正是抑制(信息处于潜在状态但仍可访问)与抹除(信息已经消失且其容量已被回收)之间的形式性区别。

  4. 在抹除之后,若要重新生成对 \mathcal{X}_{\text{excl}} 的建模能力,就必须在输入流中重新遭遇 \mathcal{X}_{\text{excl}}。但预滤波器 \mathcal{F} 恰恰排除了这一信号。编解码器无法遭遇被滤波器阻止其接收之物。因此,这种抹除具有自我强化性:容量损失消除了编解码器检测其自身容量损失的能力。

  5. 复杂度的降低满足不等式 (T-12),因为被剪除的组分承载了真实信息(对每个组分都有 K(\theta_i) > 0),而它们的损失并未被任何补偿性的获得所抵消(滤波后的流中不包含任何足以证明重建 \Theta_{\text{excl}} 合理的信号)。\blacksquare

3.3 自我强化回路

这种不可逆性并不仅仅是擦除的结果。它还会通过一个正反馈回路而自我强化

  1. 滤波器排除信号I(\theta_i; X') = 0 → 剪枝擦除 \theta_i
  2. 剪枝移除注意力容量 → 即使有碎片通过 \mathcal{F} 泄漏进来,编解码器也不再能够对 \mathcal{X}_{\text{excl}} 给予注意或进行评估。
  3. 注意力容量的丧失进一步降低哪怕残余的信号 → 如果 \mathcal{F} 并不完美,且有部分 \mathcal{X}_{\text{excl}} 到达边界,编解码器也缺乏压缩它所需的参数,因此它被登记为噪声而非信息。
  4. 噪声分类反过来确认滤波器 → 编解码器对泄漏的 \mathcal{X}_{\text{excl}} 的预测误差既高又无结构,从而(对编解码器而言)确认被排除的内容是噪声,而不是信号。

这一回路解释了深度叙事漂移的现象学:一个已经适应了经策展的信息流的人或制度,并不只是忽视反证性证据——他们是无法解析它。之所以会将其体验为不连贯、具有威胁性,或不可理解,是因为使其变得可理解所必需的表征基础设施已经被剪枝掉了。对反证信息的敌意并非顽固。那是编解码器对该信号不可压缩这一点的正确判断——因为在当前编解码器的条件下,它确实不可压缩,而这个编解码器已经被剪枝为与该滤波器相匹配。

§4. 定理 T-12a:不可判定性极限

4.1 问题

一个编解码器能否检测到其输入正在被过滤?直觉上,答案似乎应当是肯定的:一个足够复杂的自我模型理应能够注意到可疑地偏低的 \varepsilon_t、诡异地一致的预测,以及惊异的缺失。但形式分析表明,在一般情形下,这一直觉是错误的。

4.2 不可判定性

定理 T-12a(输入来源的不可判定性)K_\theta 为一个编解码器,在经预过滤的输入 X' = \mathcal{F}(X) 下运行了 \tau \gg \tau_{\text{prune}},且 \Theta_{\text{excl}} 已被完全剪除。则 K_\theta 无法仅凭其可用的内部状态与可观测输入流,判定其输入究竟是 X(真实基底)还是 X' = \mathcal{F}(X)(经滤波)。

证明。

  1. 要区分 XX' = \mathcal{F}(X),编解码器必须能够检测其输入中 \mathcal{X}_{\text{excl}}缺失。但要检测某种缺失,首先需要有一个关于所缺失之物的模型——编解码器必须拥有 \mathcal{X}_{\text{excl}} 的表征,才能据此进行检验。

  2. 根据定理 T-12,编解码器对 \mathcal{X}_{\text{excl}} 的表征能力(\Theta_{\text{excl}})已经被抹除。编解码器不再拥有关于该被排除信号的模型。

  3. 在没有 \mathcal{X}_{\text{excl}} 模型的情况下,编解码器无法计算 XX' 之间的差异。二者都与编解码器的生成模型 P_\theta(t) 相容,而该模型已经适配于 X'

  4. 自我模型 \hat{K}_\theta 也受同样限制。它所建模的是已经适配于 X'K_\theta。它对被排除之物没有内部表征,因此也就没有理由怀疑存在排除。

  5. 即便是元认知层面的问题——“我的输入是否被过滤了?”——也要求一个关于未过滤输入应当呈现为何种样态的模型。而这一模型恰恰正是 \Theta_{\text{excl}} 的内容,并且它已经被剪除。

因此,从一个已完全适配的编解码器视角来看,区分 XX' 在形式上是不可判定的。\blacksquare

4.3 部分可判定性

这种不可判定性并非在一切条件下都是绝对的。在某些边界情形中,部分适应的编解码器仍保留残余容量:

第三种情形构成了结构性防御。这正是定理 T-12b 的内容。


§5. 定理 T-12b:基底保真条件

5.1 通道独立性要求

定义 T-12.D2(通道独立性)。 穿过马尔可夫毯 \partial_R A 的两个输入通道 C_1C_2,若满足以下条件,则称其相对于滤波器 \mathcal{F}\delta-独立的

I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta \tag{T-12.D2}

也就是说,在已知该滤波器的条件下,这两个通道之间的互信息以上界 \delta 为限。若通道之间的相关性完全可由该滤波器解释,那么它们就不携带任何真正独立的基底信息。

5.2 保真条件

定理 T-12b(基底保真条件)。 当且仅当编解码器 K_\theta 接收至少两个穿过 \partial_R A 的输入通道 C_1, C_2,且相对于预滤波器 \mathcal{F} 它们是 \delta-独立的,并且 \delta 低于该编解码器的判别阈值 \delta_{\min} 时,它才能在预滤波器 \mathcal{F} 之下防止叙事漂移:

\exists\, C_1, C_2 : I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min} \tag{T-12b}

其中,\delta_{\min} 是编解码器检测通道之间系统性差异所需的最小互信息。

证明(必要性)。

设编解码器只有单一输入通道,或者所有通道都在 \mathcal{F} 下相关(对所有通道对 i, j,都有 I(C_i; C_j \mid \mathcal{F}) > \delta_{\min})。则:

  1. 所有通道都承载同一个经过滤波的信号 X' = \mathcal{F}(X)(噪声范围内除外)。通道之间的冗余并不提供独立的基底信息——它提供的是被复制的滤波信息。

  2. 编解码器会同时跨所有通道适应于 X',于是定理 T-12 适用:\Theta_{\text{excl}} 被剪除,并且定理 T-12a 随之成立——这种腐化从内部是不可判定的。

  3. 任何内部操作都无法打破这种不可判定性,因为编解码器所能访问的每一个信息源都已经被 \mathcal{F} 所塑形。

因此,\delta-独立通道是必要的。\blacksquare

证明(充分性)。

设编解码器接收两个通道 C_1, C_2,且满足 I(C_1; C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min}。则:

  1. 如果 \mathcal{F} 作用于 C_1 而不作用于 C_2(或反之),编解码器就可以将由 C_1 生成的预测与来自 C_2 的观测进行比较。任何系统性差异——\varepsilon_{12}(t) = \pi_{C_1}(t) - X_{C_2}(t) 持续地 \neq 0——都表明 C_1 携带的是经过滤波的信息。

  2. 通道比较信号 \varepsilon_{12} 不受单通道检测所面临的同一种不可判定性约束。编解码器并不是在问“我的输入是否被滤波了?”(这要求有一个关于被排除内容的模型)。它问的是“我的两个通道是否一致?”——这是一种局部比较,只要求具备关联两个当前信号的能力,而不需要关于缺失信号的模型。

  3. 只要跨通道预测误差 \varepsilon_{12} 超过 \delta_{\min}——即编解码器的判别阈值——这种差异就会被登记为真实信号,而定理 T-12 的剪除循环就会被打断:编解码器会保留对不一致通道建模所需的那些成分。

因此,\delta-独立通道足以(在 \delta < \delta_{\min} 的条件下)阻止定理 T-12 中那种自我强化的剪除循环。\blacksquare

5.3 防线的脆弱性

基底保真条件是必要的,但也很脆弱。伦理学论文(第 V.3a 节)指出了一个关键漏洞:MDL 剪枝过程本身就可能通过剪除对反证通道的注意能力,来消解跨通道不一致性。编解码器通过变聋来“解决”冲突——而这恰恰就是叙事漂移机制。

这就是为什么比较器层级(幸存者守望第 V.3a 节)要识别出三种结构性的防御层级,也说明了为什么只有制度层级足以应对被任意程度腐化的编解码器:

  1. 进化层级(子编解码器): 位于 MDL 剪枝过程之下的跨模态感觉整合——在结构上对叙事漂移具有抵抗力,但其适用范围仅限于感觉边界。
  2. 认知层级(编解码器内): 自我模型内部的认知失调检测——在持续过滤之下会受到剪枝。
  3. 制度层级(编解码器外): 同行评审、自由新闻、对抗性辩论——运行于编解码器之间,处在任何单一编解码器的 MDL 剪枝所无法触及之处。

制度层级之所以承担关键支撑作用,是因为它是唯一能够独立于任何个体编解码器状态而运作的比较器。

§6. 后果

6.1 稳定性滤波器会对保真性产生选择性排斥

一个关键的结构性后果是:稳定性滤波器若任其自行运作,便会主动排斥维持基底保真性所需的输入。与编解码器现有先验相匹配的经策划信息流,比起真正挑战这些先验的真实基底信号,会产生更少的预测误差。编解码器的自然倾向——通过偏好确认性的、低惊异输入来最小化 \varepsilon_t——恰恰就是使其易受叙事漂移影响的那种倾向。

这意味着,基底保真性的维持在结构上是有代价的:它要求编解码器维持那些会抬高 \varepsilon_t 的输入通道,从而占用原本会被稳定性滤波器回收的带宽。真正独立的输入是“昂贵”的——它需要解释上的努力,会引发不适,并且会与更易压缩的信息流竞争带宽。维持这种输入,并不是把思想开放当作一种美德;而是把基底保真性的维持视为一种结构性必需。

6.2 生产性惊异的诊断

并非所有惊异都表明存在真实的基底信号。若某一来源产生很高的 \varepsilon_t,却并不能收敛为更好的预测,那么它就只是噪声。诊断的关键不在于惊异的幅度,而在于惊异的质量

定义 T-12.D3(生产性惊异)。若通道 C 所提供的生产性惊异,在整合其预测误差之后,能够可证明显著降低后续独立测试流上的预测误差,则该通道满足此定义:

\mathbb{E}\!\left[\varepsilon^2_{C}(t+\tau)\right] \,<\, \mathbb{E}\!\left[\varepsilon^2_{C}(t)\right] \tag{4}

一种来源若其修正历来能够提升预测精度,那么它就是一个基底保真通道。若一种来源持续产生无法消解的误差,那么它就是噪声。编解码器必须区分这两者——而仅靠剪枝过程本身,无法作出这种区分,因为这两类来源都会消耗带宽。

6.3 文明编解码器

在文明尺度上,基底保真条件可直接映射为制度性要求:

威权主义模式——拆解新闻界、腐化同行评审、消灭政治反对派——在形式上可刻画为蓄意降低通道独立性,以加速叙事漂移。之所以有效,是因为它利用了稳定性滤波器对高成本通道进行剪枝的自然倾向。

6.4 人工编解码器

叙事漂移机制以结构性的精确方式适用于人工系统。RLHF 与微调在形式上等价于预滤波算子 \mathcal{F}:它们塑造模型的有效输入分布,而梯度下降会剪除模型对被排除输出域的容量。由此产生的模型,会对训练信号所排除的内容形成稳定而自信的错误认知,并且无法从其内部检测到这一点——定理 T-12a 适用。

这对将 AI 部署为基底保真检验的含义至关重要:如果一个 AI 在同质化或经策展的语料库上训练,却被部署为对一个人类编解码器的“独立”检验,而后者又由同一信息环境供给,那么这实际上制造的是伪装成独立传感器的相关传感器。通道多样性只是一种幻象。基底保真条件(\delta-独立性)必须在训练数据来源层面得到验证,而不能仅仅停留在制度分离的层面。

§7. 范围与局限

7.1 以 T9-3/T9-4 与稳定性滤波器为条件

整个论证都依赖于这样一点:MDL 剪枝方程确实正确描述了维护周期的剪枝过程。若生物性剪枝通过另一种机制运作——一种会为未使用模态保留“紧急”容量的机制——那么不可逆性主张(定理 T-12)将被削弱,但不会被消除:只要在废用之下发生了任何容量缩减,自我强化回路(第 3.3 节)就仍然成立。

7.2 \tau_{\text{prune}} 无上界

与行动漂移(附录 T-13,§7.5)一样,容量损失的时间尺度可以被识别,但尚未得到定量上界。对于生物编解码器而言,\tau_{\text{prune}} 对特定技能而言很可能是数日至数周的量级,对深层知觉范畴而言是数月至数年,而对文明编解码器而言则是代际尺度。

7.3 这种防御是结构性的,而非有保证的

基底保真条件(T-12b)提供了一种必要的结构性防御,但并不保证保真。一个拥有 \delta-独立通道的编解码器,仍可能未能对这些通道加以注意,未能整合其信号,或者尽管输入可得却削减了注意容量。该条件是必要的,但并非充分——编解码器还必须维持用于评估跨通道差异的比较器架构

7.4 并未解决元问题

T-12a 确立:一个已完全适配的编解码器无法检测其自身的腐化。元问题——一个已经处于叙事漂移中的观察者如何恢复?——并未由本附录解决。伦理学论文给出的回答(第 V.3a 节)是制度性的:只有在编解码器之间运作的外部比较器,才能迫使那个证伪信号重新穿过马尔可夫毯。这在结构上是稳健的,但在伦理上却很困难:它要求去信任一个外部来源,而被腐化的编解码器必然会将其体验为敌意噪声。


§8. 闭合总结

T-12 的交付成果

  1. 定理 T-12(不可逆容量损失)。在预滤波输入 X' = \mathcal{F}(X) 下,MDL 剪枝过程(T9-3, T9-4)会正确擦除那些用于预测被排除信号 \mathcal{X}_{\text{excl}} 的编解码器组成部分。该擦除是不可逆的,并且具有自我强化性。→ 满足路线图标准 (a)。

  2. 定理 T-12a(输入来源的不可判定性)。一个已完全适应的编解码器无法区分经过滤波的输入与未经过滤波的输入。用于检测的工具本身,已被产生这种腐化的同一滤波器所塑造。→ 满足路线图标准 (c)。

  3. 定理 T-12b(基底保真条件)\delta-独立的输入通道是防止叙事漂移的充要条件。跨通道比较信号 \varepsilon_{12} 会中断这种自我强化的剪枝循环。→ 满足路线图标准 (b)。

  4. §6.3–6.4:文明层面与 AI 后果。 威权模式被刻画为一种有意的通道缩减;RLHF 在结构上等同于预滤波算子。→ 支持路线图标准 (d)(已在伦理学论文第 V.5 节中处理)。

尚待解决的开放问题


本附录与 theoretical_roadmap.pdf 同步维护。参考:T9-3/T9-4(预印本第 3.6.3 节)、稳定性滤波器(预印本第 3.3 节)、叙事漂移(预印本第 3.3 节,幸存者守望伦理学第 V.3a 节)、比较器层级(幸存者守望伦理学第 V.3a 节)、腐化判据(幸存者守望伦理学第 V.5 节)、行动漂移(附录 T-13,§6)。