有序补丁理论

附录 T-4：MDL / 简约性比较

Anders Jarevåg

v2.0.0 — 2026年4月2日 | DOI: 10.5281/zenodo.19300777

原始任务 T-4：MDL / 简约性比较 问题： 当前在线预印本声称，相较于标准物理学，它通过将物理定律视为宏观压缩算法而具有更高的简约性，但并未给出形式化的 MDL 比较。 交付内容： 在明确编码约定之下，对有序补丁理论 (OPT) 与基准物理模型类别进行比较性 MDL 分析。

结项状态：已关闭（以典型性与 IC 归一化为条件）。 本附录给出了 T-4 所要求的形式化 MDL 评估。文中固定了三类基准模型类别，并为其指定了明确的编码约定。建立了四个定理与一个猜想：(T-4a) OPT 的选择器规则具有 \mathcal{O}(1) 的描述长度；(T-4b) 所罗门诺夫支配性从上方界定了 OPT 的对数损失；(猜想 T-4c) OPT 结构性优势的推定来源是初始条件压缩；(T-4d) OPT 相对于每一个可计算的基准模型，都实现了持久的常数比特模型复杂度优势；(T-4e) 有限-T 情形下的优势得到了条件性量化。该结项依赖于三个承重条件：观察者流的典型性、所罗门诺夫归一化罚项 \log(1/\xi(\mathcal{O})) 的吸收，以及 K(\text{IC} \mid \text{SP}) > K_0 的成立状态。

§1. 固定 MDL 编码约定

如果没有明确且固定的编码约定，MDL 比较就毫无意义。预印本第 §5.1 节提到了这一要求，但将其暂缓处理。我们在此依照 Rissanen (1978) [12] 以及 Li & Vitányi (2008) [27] 的双部分 MDL 框架来固定这些约定。

1.1 双部分码长

对于假设类 \mathcal{M} 与观测序列 y_{1:T} \in \{0,1\}^*，双部分 MDL 码长为：

L_T(\mathcal{M}) = K(\mathcal{M}) + L(y_{1:T} \mid \mathcal{M}) \tag{preprint §5.1, Eq. 13}

其中，K(\mathcal{M}) 是该假设的前缀柯尔莫哥洛夫复杂度——即在一台固定的通用图灵机（UTM）上，能够输出 \mathcal{M} 完整描述的最短自定界程序的长度——而 L(y_{1:T} \mid \mathcal{M}) 则是在 \mathcal{M} 的最佳预测模型下，数据的负对数似然：

L(y_{1:T} \mid \mathcal{M}) = -\log_2 P_\mathcal{M}(y_{1:T})

对于确定性理论（即定律 + IC 唯一决定观测），当 y 与该理论一致时，L(y_{1:T} \mid \mathcal{M}) = 0；否则 L = \infty。所有对数均以 2 为底；所有码长均以比特为单位。

1.2 通用机器

我们在全文中固定采用一个单一的最优 UTM \mathcal{U}。所有柯尔莫哥洛夫复杂度都相对于 \mathcal{U} 定义；若改用不同的 UTM，结果至多变化 \mathcal{O}(1) 比特。所罗门诺夫通用半测度 \xi 也相对于 \mathcal{U} 定义（预印本公式 1）。这为后续所有比较固定了约定。

1.3 y_{1:T} 的范围

我们在各模型原本被设计来预测的域上比较它们：观察者的意识流 y_{1:T} = z_{0:T}（即压缩潜在状态的序列，在 T 秒内每秒 C_{\max} 比特）。标准物理学也在同一域上接受评估，其方法是通过粗粒化将其预测还原为与观察者兼容的信息流。两种理论都被要求解释完全相同的观测。

§2. 基准模型类别

固定三类基准类别。依据我们的 UTM 约定，为每一类指定一个显式的 K(\mathcal{M}) 估计。精确数值仅为数量级估计；§§3–7 中的结构性结果只依赖于排序，而不依赖于精确数值。

2.1 \mathcal{M}_1 — 标准模型 + 广义相对论

当前可获得的预测精度最高的物理理论。其描述需要三个组成部分：

数学结构 K_{\text{struct}}： 规范群 \text{SU}(3) \times \text{SU}(2) \times \text{U}(1)、洛伦兹不变性、可重整化性，以及 GR 的微分同胚对称性。柯尔莫哥洛夫复杂度：K_{\text{struct}} \approx 10^3 比特。
参数取值 K_{\text{param}}： 19 个 SM 自由参数 + 3 个混合角 + 1 个 CP 相位 + \Lambda + G + c \approx 25 个按实验精度编码的常数（每个约 \sim 30 比特）：K_{\text{param}} \approx 750 比特。
初始条件 K_{\text{IC}}： 在暴胀范式下，K_{\text{IC}}^{\text{inf}} \approx 200–400 比特。注意：我们此处不将 Penrose 的 10^{123} 热力学熵界计入评分，因为它衡量的是宏观相空间体积（S），而不是特定的算法性柯尔莫哥洛夫复杂度（K）。具体微观态可能具有很高的可压缩性。我们只依赖严格的暴胀界限。

K(\mathcal{M}_1) = K_{\text{struct}} + K_{\text{param}} \approx 1750 \text{ bits}

K(\text{IC} \mid \mathcal{M}_1) \approx 300 \text{ bits (inflationary)}

2.2 \mathcal{M}_2 — 一般可重整化 QFT

所有在 \leq 4 维时空中的可重整化量子场论所构成的类别。该类别将 \mathcal{M}_1 作为其中一个成员包含在内。由于还必须指定规范群与粒子内容：

K(\mathcal{M}_2) \gg K(\mathcal{M}_1) \gg 1750 \text{ bits}

纳入 \mathcal{M}_2，是为了作为有序补丁理论 (OPT) 主张“规律是被选择出来的，而非被穷举列举的”这一命题的陪衬。尽管与 \mathcal{M}_2 的 MDL 比较会被任何有限子类（包括 \mathcal{M}_1）轻易胜出，因为 K(\mathcal{M}_2) 是无界的，但将其纳入在形式上有助于展示这样一个事实：稳定性滤波器原生地将之压缩坍缩的，正是参数选择问题的无限尺度。

2.3 \mathcal{M}_3 — 玻尔兹曼大脑 / 热涨落

具有极简初始条件的标准物理学：在普朗克尺度上的热态（最大熵态）。其定律与 \mathcal{M}_1 完全相同；初始条件则是平凡地简单：

K(\mathcal{M}_3) \approx K(\mathcal{M}_1) \approx 1750 \text{ bits}, \qquad K(\text{IC} \mid \mathcal{M}_3) \approx 10 \text{ bits}

然而，在 \mathcal{M}_3 之下观测到一个有序的意识流 y_{1:T} 的对数似然小到天文级别：L(y_{1:T} \mid \mathcal{M}_3) \approx K(y_{1:T}) \gg T \cdot C_{\max}。因此，\mathcal{M}_3 虽然具有可忽略不计的 IC 成本，却要付出灾难性的似然成本；将其纳入此处，是为了表明有序补丁理论 (OPT) 的 MDL 优势并不是通过同样的手法获得的。

§3. OPT 的代码长度——定理 T-4a

OPT 的 MDL 代码长度可分解为：

L_T(\text{OPT}) = K(\xi, \text{Filter}) + L(y_{1:T} \mid \xi, \text{Filter}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

其中，\xi^{\text{Filter}} 是在观察者相容类 \mathcal{O}（满足 R_{\text{req}} \leq B_{\max} 的流）上加条件后的所罗门诺夫测度 \xi，而 K_0 = K(\xi, \text{Filter}) 是选择器规则的描述长度。

定理 T-4a（元规则复杂度上界）。 K(\xi, \text{Filter}) = K_0 = \mathcal{O}(1) 比特。具体而言：

K_0 \leq K(\mathcal{U}) + K(C_{\max}) + K(\Delta t) + c

其中，K(\mathcal{U}) 是 UTM 的复杂度，K(C_{\max}) = \mathcal{O}(\log C_{\max}) 比特用于将带宽阈值编码到实验精度，K(\Delta t) = \mathcal{O}(\log \Delta t) 用于编码更新窗口，而 c 是一个较小的普适常数。

证明。 所罗门诺夫测度 \xi 由固定的 UTM \mathcal{U} 唯一确定，因此 K(\xi \mid \mathcal{U}) = \mathcal{O}(1)。稳定性滤波器需要两个参数：C_{\max} 和 \Delta t，二者都测量到约 \sim 4 位有效数字，因此 K(C_{\max}, \Delta t) \leq 2 \times (4 \times \log_2 10) \approx 26 比特。条件 R_{\text{req}} \leq B_{\max} 是以固定记号写出的单个不等式：约 \sim 10 比特。总计：K_0 \leq K(\mathcal{U}) + 36 比特。

为了公平地吸收 K(\mathcal{U})，我们必须假定一种“认识论中立”的 UTM——也就是说，一台其内建指令集不对任何物理理论给予优先编码的参考机器（即一种基础组合子或与 Brainfuck 等价的几何结构，在物理上完全不可知）。在这样一台无偏机器下，在标准化 K(\mathcal{M}_1) \approx 1750 比特的同时维持 K(\xi, \text{Filter}) \approx 36 比特是成立的。我们明确承认，如果 UTM 被改变，绝对比特计数会受到一个 \mathcal{O}(1) 常数尺度变动的影响，这意味着 36 与 1750 的计算本质上是相对的。这里在结构上诚实的数学表述，是其排序关系（K_0 \ll K(\mathcal{M}_1)），即断言一种独立于精确数值常数的稳健结构优势。 \blacksquare

比较： 若排除共享的 UTM 开销，则 K_0 \approx 36 比特，而 K(\mathcal{M}_1) \approx 1750 比特。OPT 选择器规则比标准模型描述短 K(\mathcal{M}_1) - K_0 \approx 1714 比特。这就是预印本第 §5 节所主张的结构性简约优势——现在已给出明确的比特计数。

§4. 所罗门诺夫通用半测度支配界——定理 T-4b

定理 T-4b（所罗门诺夫通用半测度支配界）。 对任意可计算的物理测度 \nu（包括 \mathcal{M}_1、\mathcal{M}_2、\mathcal{M}_3），只要 K(\nu) < \infty，并且对任意数据流 y_{1:T}，都有：

L_T(\text{OPT}) \leq L_T(\nu) + K'_0

其中 K'_0 = K_0 + \log(1/\xi(\mathcal{O}))。这表示基础规则复杂度，加上将通用测度以观察者类 \mathcal{O} 为条件时所产生的必要算法归一化惩罚。

证明。 由所罗门诺夫通用半测度的定义（预印本公式 1），且 w_\nu \asymp 2^{-K(\nu)}，有：

\xi(y_{1:T}) \geq w_\nu \cdot \nu(y_{1:T}) \geq 2^{-K(\nu)} \cdot \nu(y_{1:T})

取负对数：

-\log \xi(y_{1:T}) \leq -\log \nu(y_{1:T}) + K(\nu)

当从通用测度 \xi 过渡到受限滤波器 \xi^{\text{Filter}} 时，我们需要支付归一化代价 -\log \xi^{\text{Filter}}(y) = -\log \xi(y) + \log(1/\xi(\mathcal{O}))。将其代入 L_T(\text{OPT})：

L_T(\text{OPT}) = K_0 - \log \xi^{\text{Filter}}(y_{1:T}) \leq K_0 + \log(1/\xi(\mathcal{O})) + K(\nu) - \log \nu(y_{1:T}) = K'_0 + L_T(\nu) \qquad \blacksquare

重要保留说明。 定理 T-4b 并未表明 OPT 优于 SP。它表明，OPT 相对于任何基准的表现，最差也不会超过 K'_0 比特。下文中我们将 \log(1/\xi(\mathcal{O})) 吸收到 K_0 中，做法是假定观察者序列类相对于结构性 UTM 常数能够得到干净的界定；但仍应将这一归一化缺口视为一个形式上的脆弱点。

§5. 初始条件压缩——定理 T-4c

OPT 的 MDL 优势在结构上的来源，是对初始条件的压缩。在标准物理学中，定律与初始条件是两个彼此分离、都必须被描述的对象。而在 OPT 中，初始条件被吸收到先验之中：所罗门诺夫测度已经将最高权重赋予最简单的观察者相容流，因此单独的 IC 指定便成为冗余。

5.1 IC 冗余论证

在标准物理学（\mathcal{M}_1）下，确定性理论的完整 MDL 编码为：

L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) + 0 \qquad \text{[确定性：若一致，则 } -\log P = 0 \text{]}

IC 项 K(\text{IC} \mid \text{laws}) 是在给定定律条件下，对特定初始条件的描述长度——它并不能由定律本身推出。这正是精细调谐的所在之处。

在 OPT 下，两部分编码为：

L_T(\text{OPT}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

项 -\log \xi^{\text{Filter}}(y_{1:T}) 编码的是在给定元规则时的特定流。所罗门诺夫通用半测度先验已经内含一个物理学的通用模型：-\log \xi(y) \approx K(y)。OPT 编码从不需要为 IC 单独付费。

猜想 T-4c（IC 压缩启发式界）。定义 IC 压缩优势：

\Delta_{\text{IC}} = K(\text{IC} \mid \text{SP laws}) - K(\text{IC} \mid \text{OPT})

我们主张如下启发式界：

\boxed{L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1)}

其中，K(\text{IC} \mid \text{OPT}) := K(\text{IC} \mid \xi, \text{Filter}, \text{codec}) 是在给定 OPT 完整模型时，初始条件的剩余描述长度。\Delta_{\text{IC}} \geq 0，且当且仅当稳定性滤波器对 IC 所提供的额外压缩不超过定律本身已给出的压缩时取等号。

论证。 从 SP 的完整两部分编码出发，并应用所罗门诺夫支配性（将归一化常数吸收到一个 \mathcal{O}(1) 的 UTM 界定项中）：

L_T(\text{OPT}) \leq K_0 + K(\text{laws}) + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) + \mathcal{O}(1)

重排并代入 L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws})（确定性理论）：

L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 + \mathcal{O}(1)

在 OPT 内部，-\log \xi^{\text{Filter}}(y_{1:T}) 不必逐项编码 IC：稳定性滤波器从所罗门诺夫先验中进行选择，而后者通过长度加权内在地压缩 IC。AIT 的次可加性保证 K(\text{IC} \mid x, f(x)) \leq K(\text{IC} \mid x) + \mathcal{O}(1)。如果我们进一步设定，OPT 的选择规则相较于仅仅陈述原始定律，能够以更紧致的描述字符串给出界定（这是该框架的核心押注，而非数学上的导出性证明），那么剩余被编码的 K(\text{IC} \mid \text{OPT}) 就不可能显著超过 K(\text{IC} \mid \text{laws})。于是，在启发式意义上得到 \Delta_{\text{IC}} \geq 0。

代入即得：L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1)。\blacksquare

备注。 我们假设，人择压缩 K(\text{IC} \mid \text{OPT}) \approx 0 在稳定性滤波器具有高度约束性、并在数学上将状态映射到唯一的观察者相容状态的极限下成立。这是一个有物理动机的命题，而不是一个经由算法证明的唯一性界。

§6. 常数比特模型复杂度优势——定理 T-4d

定理 T-4d（永久性的常数比特 MDL 优势——以典型性为条件）。 对于每一个固定的、非平凡的可计算物理模型 \nu，只要 K_0 < K(\nu) < \infty，则有序补丁理论 (OPT) 的表述对于任何同时属于 \mathcal{O} 且相对于 \nu 为典型的 y_{1:T}，都实现了一种固定且永久的模型复杂度优势。当序列长度 T \to \infty 时，总编码长度差在结构上满足：

L_T(\text{OPT}) - L_T(\nu) \to K_0 - K(\nu)

证明。 由 T-4b 可知，L_T(\text{OPT}) \leq K'_0 - \log \xi^{\text{Filter}}(y_{1:T})。对于任意可计算的 \nu，所罗门诺夫定理保证：\xi 恰好在 \nu-典型序列上收敛到 \nu；更准确地说，是对 \nu-几乎所有的 y_{1:\infty} 而言。这里存在一种深刻的形式张力：稳定性滤波器所隔离出的流，按其评估结果严格属于低熵且具结构性的流，因此相对于标准的、无约束的最大熵 \nu-测度流，在结构上天然地被映射为非典型。除非经过滤的观察者类 \mathcal{O} 与 \nu-典型类之间能够证明存在非平凡的数学重叠，否则就无法原生地调用所罗门诺夫收敛极限。因此，本定理仅在如下条件下成立：且仅当特定的经过滤的观察者流，在特定的基准定律下仍保持 \nu-典型性时（而这类在理论上合规的相交流之集合，形式上仍未被刻画）：

-\frac{1}{T} \log \xi(y_{1:T}) \to H(\nu) \quad \text{as } T \to \infty

其中 H(\nu) 是 \nu 的熵率。类似地，-\frac{1}{T} \log \nu(y_{1:T}) \to H(\nu)。在渐近意义下，逐比特的对数损失似然项收敛并趋于相等，这意味着剩余的总编码长度优势纯粹归结为模型描述长度：

\left[L_T(\text{OPT}) - L_T(\nu)\right] \to K_0 - K(\nu) < 0 \qquad \text{[因为 } K_0 \approx 36 \text{，而 } K(\nu) \sim 1750 \text{]}

注意：尽管总编码长度保持这种永久性的固定比特优势，但逐比特优势（\frac{K_0 - K(\nu)}{T}）会主动收缩至零。这并不表示通过数据积累而获得一种渐近上持续增长的优势，而是一个永久的、刚性的结构性偏移。\blacksquare

对 \mathcal{M}_1 的数值估计： K(\mathcal{M}_1) - K_0 \approx 1714 比特。一旦对数损失似然在足够长的 \nu-典型观测窗口上收敛，OPT 就会保持大约 1714 比特的永久性数学总编码优势。

§7. 有限-T 条件优势 —— 定理 T-4e

对于有限长度的流，MDL 比较要求 T-4c 的 IC 压缩优势超过 K_0 开销。

定理 T-4e（有限-T 条件性 MDL 优势）。有序补丁理论 (OPT) 相对于 \mathcal{M}_1 取得严格的有限-T MDL 优势——即，L_T(\text{OPT}) < L_T(\mathcal{M}_1)——当且仅当以下条件成立：

\boxed{K(\text{IC} \mid \text{SP laws}) > K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y_{1:T}) - \left(-\log P_{\text{SP}}(y_{1:T})\right)\right]}

右侧括号项是 OPT 相对于 SP 在特定流 y_{1:T} 上的对数似然亏损。只要 IC 的描述代价超过元规则与 OPT 在该流上的预测亏损所构成的合并开销，该条件就得到满足。

证明。 对两部分码长作直接变形：

L_T(\text{OPT}) < L_T(\text{SP}) \iff \quad K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) - \log \xi^{\text{Filter}}(y) < K_{\text{laws}} + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) \iff \quad K(\text{IC} \mid \text{laws}) - K_0 > \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] + \left[K_{\text{laws}} - K_{\text{laws}}\right]

重新整理（K_{\text{laws}} 在两边相消）即可直接得到所述条件。\blacksquare

7.1 评估标准宇宙学成立的条件

在暴胀编码下（对 SP 最有利的情形）：

K(\text{IC} \mid \text{SP laws}) \approx 300 比特（暴胀参数 + e-fold 数 + 再热）
K_0 \approx 36 比特（T-4a）
对数似然赤字：我们在功能上假设，配备了 T-1 中所映射的 R_{T,h}(D) 编解码器限制的 OPT，在观察者兼容流上，至少能够达到与标准物理同样稳健的逐点对数似然。需要注意的是，所罗门诺夫界严格给出的只是对期望和的支配，而不是对特定单一样本流的确定性逐点界；因此，\left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] \leq 0 表示的是一种经验性的结构预期，而非算法性保证。

因此，该条件可化约为 K(\text{IC} \mid \text{SP laws}) > K_0，即 300 > 36。这一条件以显著的结构裕度成立。只有当 IC 的代价低于约 \sim 36 比特时，该条件才会失效——也就是说，只有当我们宇宙的特定 IC 能够仅由 SP 定律在结构上推出，并且剩余不足 36 比特时，才会如此。当前没有任何宇宙学模型做到这一点。

§8. 比较性 MDL 表

模型	K(\mathcal{M})（比特）	K(\text{IC}\mid\mathcal{M})（比特）	-\log P(y\mid\mathcal{M})	总计 L_T	MDL 排名
\mathcal{M}_1 — SM + GR	\sim 1750	\sim 300（暴胀）	\sim 0（确定性）	\sim 2050	第 2（暴胀）
\mathcal{M}_3 — 玻尔兹曼	\sim 1750	\sim 10	\gg 0（罕见流）	\gg 1760	最后（似然灾难性）
\mathcal{M}_{\text{OPT}} — OPT	\sim 36	\sim 0（通过高度受限的滤波器进行条件化）	*\sim 0^（确定性编解码器近似）**	\sim 36（条件性）	第 1（条件性）

^* 在 §9.2 的显式编解码器识别之下，一旦将 K_\theta 与 SP 编解码器等同，OPT 的活动数据项就化约为 -\log P_{K_\theta}(y) = -\log P_\text{SP}(y) = 0。

§9. 比较的限度

9.1 K(y \mid \text{Filter}) 不可计算

OPT 的码长 K_0 + K(y \mid \text{Filter}) = K_0 - \log \xi^{\text{Filter}}(y) 包含一个在图灵意义下不可计算的项（停机问题阻止对 \xi 进行精确计算）。在实践中，OPT 的预测必须由一个有限的编解码器 K_\theta 来近似——这正是标准物理学的通常做法。这意味着，就预测目的而言，OPT 会归约为当前可获得的最佳可计算编解码器。因此，OPT 相对于 SP 的 MDL 优势是一种结构性优势（体现在对选择器规则的描述上），而不是一种在提出新预测方面的操作性优势。

这并非缺陷——而恰恰是预印本主张的正确形式内容：“OPT 将部分解释负担从定律枚举转移到定律选择。” 这种转移是真实的，并且得到了形式化量化（对于选择器规则，相对于 \mathcal{M}_1 约为 \approx 1700 比特），但它并不会在编解码器本身已经提供的内容之上，额外生成新的预测内容。

9.2 编解码器识别问题

OPT 编解码器 K_\theta 是由稳定性滤波器从 \mathcal{M} 中选出的那个特定可计算测度。T-4 并不决定这一测度究竟是哪一个——这一识别需要 T-5（常数恢复）以及完整的物理统一方案。在 K_\theta 被明确识别为 SM + GR 之前，MDL 比较都以这一识别为条件。形式界限 L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 保证了 OPT 的表现不可能比 SP 更差，但并不保证它在有限时间内一定更优，除非满足 T-4e 的 IC 条件——而在标准宇宙学假设下，这一条件是满足的。

来自 P-2 的约束。 附录 P-2（通过量子纠错进行希尔伯特空间嵌入）确立了：在局域噪声条件下，编解码器必须满足 QECC 结构——其内部表征必须构成一个具有特定参数 (n, k, d) 的量子纠错码。这缩小了编解码器识别问题的范围：K_\theta 不再是任意的可计算测度，而是其预测状态携带希尔伯特空间纠错几何的一类测度。这一约束位于 T-5 常数恢复方案的上游，并且可能为将 K_\theta 识别为标准模型提供额外的选择准则。

§10. 闭合总结

T-4 交付项——已确认闭合（含归一化与典型性条件）

编码约定已固定（§1）。 采用两部分 MDL、相对于一个包容性的固定 UTM 的前缀柯尔莫哥洛夫复杂度，并将数据域以函数方式映射到意识流 y_{1:T} = z_{0:T}。
基准类别已固定（§2）。 将 \mathcal{M}_1（SM+GR）与诸如 \mathcal{M}_2（生成范围参数选择的爆炸式扩张）和 \mathcal{M}_3（玻尔兹曼似然坍缩）之类的平凡边界进行评估。
T-4a（元规则复杂度）。 K(\xi, \text{Filter}) = K_0 \approx 36 比特，包含相对 UTM 偏移量。
T-4b（所罗门诺夫有界）。 L_T(\text{OPT}) \leq L_T(\nu) + K_0 + \log(1/\xi(\mathcal{O}))。明确给出了算法归一化惩罚参数。
猜想 T-4c（IC 压缩启发式界）。 结构性的初始条件冗余被视为压缩的猜想性引擎：\Delta_{\text{IC}} = K(\text{IC}\mid\text{SP}) - K(\text{IC}\mid\text{OPT}) \geq 0，尽管映射唯一性仅在条件意义上成立。这一结果应视为启发式界，而非形式上已证明的定理。
T-4d（常数比特模型优势）。 在条件下约束其极限行为：对于那些其 \nu-典型类与 \mathcal{O} 存在非平凡重叠的可计算基准，有序补丁理论 (OPT) 获得一个持久的数值复杂度优势（\sim -1714 比特），尽管其无限期逐比特密度会缩放至零。
T-4e（有限-T 优势——条件性的）。 在经验逐点损失不推翻核心结构边界 K(\text{IC}\mid\text{SP}) > K_0（300 > 36）时，OPT 在有限 T 下在数值上同样优于 \mathcal{M}_1。这将脆弱性明确集中到关于算法性逐点支配的假设之上。

MDL 主张的证伪条件

仅从 SP 定律出发，在少于 \sim 36 比特内导出宇宙学初始条件——即表明 K(\text{IC} \mid \text{SP laws}) < K_0。
证明稳定性滤波器对观察者相容流的限制并不压缩 IC——即 K(\text{IC} \mid \xi, \text{Filter}) = K(\text{IC} \mid \text{laws})，从而得到 \Delta_{\text{IC}} = 0。
为 OPT 给出一个显式可计算的编解码器 K_\theta，并可证明其在观察者流上的准确性低于 SM+GR，使得对数似然赤字超过 IC 压缩增益。

下游依赖

T-5（常数恢复） 是下一步的关键：一旦通过 T-1/T-2/T-3 将编解码器 K_\theta 与 SM+GR 定律对应起来，MDL 比较就会变得完全显式，而 T-4e 中的条件也将成为已知量之间的一个具体不等式。
预印本 §5.2 更新： 短语“Whether this meta-rule yields an actual MDL advantage… is an open comparative question”现在可以更新为：“Theorem T-4d establishes a conditional asymptotic advantage (for observer streams that are also \nu-typical under the benchmark physics, a set currently uncharacterised); Theorem T-4e establishes a conditional finite-T advantage; see Appendix T-4.”

本附录作为 OPT 项目仓库的一部分，与 theoretical_roadmap.pdf 一并维护。参考文献：Rissanen (1978) [12]，Li & Vitányi (2008) [27]，Solomonoff (1964) [11]，Penrose (2004)。