有序补丁理论
附录 T-4:MDL / 简约性比较
v2.0.0 — 2026年4月2日 | DOI: 10.5281/zenodo.19300777
原始任务 T-4:MDL / 简约性比较 问题: 当前在线预印本声称,相较于标准物理学,它通过将物理定律视为宏观压缩算法而具有更高的简约性,但并未给出形式化的 MDL 比较。 交付内容: 在明确编码约定之下,对有序补丁理论 (OPT) 与基准物理模型类别进行比较性 MDL 分析。
结项状态:已关闭(以典型性与 IC 归一化为条件)。 本附录给出了 T-4 所要求的形式化 MDL 评估。文中固定了三类基准模型类别,并为其指定了明确的编码约定。建立了四个定理与一个猜想:(T-4a) OPT 的选择器规则具有 \mathcal{O}(1) 的描述长度;(T-4b) 所罗门诺夫支配性从上方界定了 OPT 的对数损失;(猜想 T-4c) OPT 结构性优势的推定来源是初始条件压缩;(T-4d) OPT 相对于每一个可计算的基准模型,都实现了持久的常数比特模型复杂度优势;(T-4e) 有限-T 情形下的优势得到了条件性量化。该结项依赖于三个承重条件:观察者流的典型性、所罗门诺夫归一化罚项 \log(1/\xi(\mathcal{O})) 的吸收,以及 K(\text{IC} \mid \text{SP}) > K_0 的成立状态。
§1. 固定 MDL 编码约定
如果没有明确且固定的编码约定,MDL 比较就毫无意义。预印本第 §5.1 节提到了这一要求,但将其暂缓处理。我们在此依照 Rissanen (1978) [12] 以及 Li & Vitányi (2008) [27] 的双部分 MDL 框架来固定这些约定。
1.1 双部分码长
对于假设类 \mathcal{M} 与观测序列 y_{1:T} \in \{0,1\}^*,双部分 MDL 码长为:
L_T(\mathcal{M}) = K(\mathcal{M}) + L(y_{1:T} \mid \mathcal{M}) \tag{preprint §5.1, Eq. 13}
其中,K(\mathcal{M}) 是该假设的前缀柯尔莫哥洛夫复杂度——即在一台固定的通用图灵机(UTM)上,能够输出 \mathcal{M} 完整描述的最短自定界程序的长度——而 L(y_{1:T} \mid \mathcal{M}) 则是在 \mathcal{M} 的最佳预测模型下,数据的负对数似然:
L(y_{1:T} \mid \mathcal{M}) = -\log_2 P_\mathcal{M}(y_{1:T})
对于确定性理论(即定律 + IC 唯一决定观测),当 y 与该理论一致时,L(y_{1:T} \mid \mathcal{M}) = 0;否则 L = \infty。所有对数均以 2 为底;所有码长均以比特为单位。
1.2 通用机器
我们在全文中固定采用一个单一的最优 UTM \mathcal{U}。所有柯尔莫哥洛夫复杂度都相对于 \mathcal{U} 定义;若改用不同的 UTM,结果至多变化 \mathcal{O}(1) 比特。所罗门诺夫通用半测度 \xi 也相对于 \mathcal{U} 定义(预印本公式 1)。这为后续所有比较固定了约定。
1.3 y_{1:T} 的范围
我们在各模型原本被设计来预测的域上比较它们:观察者的意识流 y_{1:T} = z_{0:T}(即压缩潜在状态的序列,在 T 秒内每秒 C_{\max} 比特)。标准物理学也在同一域上接受评估,其方法是通过粗粒化将其预测还原为与观察者兼容的信息流。两种理论都被要求解释完全相同的观测。
§2. 基准模型类别
固定三类基准类别。依据我们的 UTM 约定,为每一类指定一个显式的 K(\mathcal{M}) 估计。精确数值仅为数量级估计;§§3–7 中的结构性结果只依赖于排序,而不依赖于精确数值。
2.1 \mathcal{M}_1 — 标准模型 + 广义相对论
当前可获得的预测精度最高的物理理论。其描述需要三个组成部分:
数学结构 K_{\text{struct}}: 规范群 \text{SU}(3) \times \text{SU}(2) \times \text{U}(1)、洛伦兹不变性、可重整化性,以及 GR 的微分同胚对称性。柯尔莫哥洛夫复杂度:K_{\text{struct}} \approx 10^3 比特。
参数取值 K_{\text{param}}: 19 个 SM 自由参数 + 3 个混合角 + 1 个 CP 相位 + \Lambda + G + c \approx 25 个按实验精度编码的常数(每个约 \sim 30 比特):K_{\text{param}} \approx 750 比特。
初始条件 K_{\text{IC}}: 在暴胀范式下,K_{\text{IC}}^{\text{inf}} \approx 200–400 比特。注意:我们此处不将 Penrose 的 10^{123} 热力学熵界计入评分,因为它衡量的是宏观相空间体积(S),而不是特定的算法性柯尔莫哥洛夫复杂度(K)。具体微观态可能具有很高的可压缩性。我们只依赖严格的暴胀界限。
K(\mathcal{M}_1) = K_{\text{struct}} + K_{\text{param}} \approx 1750 \text{ bits}
K(\text{IC} \mid \mathcal{M}_1) \approx 300 \text{ bits (inflationary)}
2.2 \mathcal{M}_2 — 一般可重整化 QFT
所有在 \leq 4 维时空中的可重整化量子场论所构成的类别。该类别将 \mathcal{M}_1 作为其中一个成员包含在内。由于还必须指定规范群与粒子内容:
K(\mathcal{M}_2) \gg K(\mathcal{M}_1) \gg 1750 \text{ bits}
纳入 \mathcal{M}_2,是为了作为有序补丁理论 (OPT) 主张“规律是被选择出来的,而非被穷举列举的”这一命题的陪衬。尽管与 \mathcal{M}_2 的 MDL 比较会被任何有限子类(包括 \mathcal{M}_1)轻易胜出,因为 K(\mathcal{M}_2) 是无界的,但将其纳入在形式上有助于展示这样一个事实:稳定性滤波器原生地将之压缩坍缩的,正是参数选择问题的无限尺度。
2.3 \mathcal{M}_3 — 玻尔兹曼大脑 / 热涨落
具有极简初始条件的标准物理学:在普朗克尺度上的热态(最大熵态)。其定律与 \mathcal{M}_1 完全相同;初始条件则是平凡地简单:
K(\mathcal{M}_3) \approx K(\mathcal{M}_1) \approx 1750 \text{ bits}, \qquad K(\text{IC} \mid \mathcal{M}_3) \approx 10 \text{ bits}
然而,在 \mathcal{M}_3 之下观测到一个有序的意识流 y_{1:T} 的对数似然小到天文级别:L(y_{1:T} \mid \mathcal{M}_3) \approx K(y_{1:T}) \gg T \cdot C_{\max}。因此,\mathcal{M}_3 虽然具有可忽略不计的 IC 成本,却要付出灾难性的似然成本;将其纳入此处,是为了表明有序补丁理论 (OPT) 的 MDL 优势并不是通过同样的手法获得的。
§3. OPT 的代码长度——定理 T-4a
OPT 的 MDL 代码长度可分解为:
L_T(\text{OPT}) = K(\xi, \text{Filter}) + L(y_{1:T} \mid \xi, \text{Filter}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)
其中,\xi^{\text{Filter}} 是在观察者相容类 \mathcal{O}(满足 R_{\text{req}} \leq B_{\max} 的流)上加条件后的所罗门诺夫测度 \xi,而 K_0 = K(\xi, \text{Filter}) 是选择器规则的描述长度。
定理 T-4a(元规则复杂度上界)。 K(\xi, \text{Filter}) = K_0 = \mathcal{O}(1) 比特。具体而言:
K_0 \leq K(\mathcal{U}) + K(C_{\max}) + K(\Delta t) + c
其中,K(\mathcal{U}) 是 UTM 的复杂度,K(C_{\max}) = \mathcal{O}(\log C_{\max}) 比特用于将带宽阈值编码到实验精度,K(\Delta t) = \mathcal{O}(\log \Delta t) 用于编码更新窗口,而 c 是一个较小的普适常数。
证明。 所罗门诺夫测度 \xi 由固定的 UTM \mathcal{U} 唯一确定,因此 K(\xi \mid \mathcal{U}) = \mathcal{O}(1)。稳定性滤波器需要两个参数:C_{\max} 和 \Delta t,二者都测量到约 \sim 4 位有效数字,因此 K(C_{\max}, \Delta t) \leq 2 \times (4 \times \log_2 10) \approx 26 比特。条件 R_{\text{req}} \leq B_{\max} 是以固定记号写出的单个不等式:约 \sim 10 比特。总计:K_0 \leq K(\mathcal{U}) + 36 比特。
为了公平地吸收 K(\mathcal{U}),我们必须假定一种“认识论中立”的 UTM——也就是说,一台其内建指令集不对任何物理理论给予优先编码的参考机器(即一种基础组合子或与 Brainfuck 等价的几何结构,在物理上完全不可知)。在这样一台无偏机器下,在标准化 K(\mathcal{M}_1) \approx 1750 比特的同时维持 K(\xi, \text{Filter}) \approx 36 比特是成立的。我们明确承认,如果 UTM 被改变,绝对比特计数会受到一个 \mathcal{O}(1) 常数尺度变动的影响,这意味着 36 与 1750 的计算本质上是相对的。这里在结构上诚实的数学表述,是其排序关系(K_0 \ll K(\mathcal{M}_1)),即断言一种独立于精确数值常数的稳健结构优势。 \blacksquare
比较: 若排除共享的 UTM 开销,则 K_0 \approx 36 比特,而 K(\mathcal{M}_1) \approx 1750 比特。OPT 选择器规则比标准模型描述短 K(\mathcal{M}_1) - K_0 \approx 1714 比特。这就是预印本第 §5 节所主张的结构性简约优势——现在已给出明确的比特计数。
§4. 所罗门诺夫通用半测度支配界——定理 T-4b
定理 T-4b(所罗门诺夫通用半测度支配界)。 对任意可计算的物理测度 \nu(包括 \mathcal{M}_1、\mathcal{M}_2、\mathcal{M}_3),只要 K(\nu) < \infty,并且对任意数据流 y_{1:T},都有:
L_T(\text{OPT}) \leq L_T(\nu) + K'_0
其中 K'_0 = K_0 + \log(1/\xi(\mathcal{O}))。这表示基础规则复杂度,加上将通用测度以观察者类 \mathcal{O} 为条件时所产生的必要算法归一化惩罚。
证明。 由所罗门诺夫通用半测度的定义(预印本公式 1),且 w_\nu \asymp 2^{-K(\nu)},有:
\xi(y_{1:T}) \geq w_\nu \cdot \nu(y_{1:T}) \geq 2^{-K(\nu)} \cdot \nu(y_{1:T})
取负对数:
-\log \xi(y_{1:T}) \leq -\log \nu(y_{1:T}) + K(\nu)
当从通用测度 \xi 过渡到受限滤波器 \xi^{\text{Filter}} 时,我们需要支付归一化代价 -\log \xi^{\text{Filter}}(y) = -\log \xi(y) + \log(1/\xi(\mathcal{O}))。将其代入 L_T(\text{OPT}):
L_T(\text{OPT}) = K_0 - \log \xi^{\text{Filter}}(y_{1:T}) \leq K_0 + \log(1/\xi(\mathcal{O})) + K(\nu) - \log \nu(y_{1:T}) = K'_0 + L_T(\nu) \qquad \blacksquare
重要保留说明。 定理 T-4b 并未表明 OPT 优于 SP。它表明,OPT 相对于任何基准的表现,最差也不会超过 K'_0 比特。下文中我们将 \log(1/\xi(\mathcal{O})) 吸收到 K_0 中,做法是假定观察者序列类相对于结构性 UTM 常数能够得到干净的界定;但仍应将这一归一化缺口视为一个形式上的脆弱点。
§5. 初始条件压缩——定理 T-4c
OPT 的 MDL 优势在结构上的来源,是对初始条件的压缩。在标准物理学中,定律与初始条件是两个彼此分离、都必须被描述的对象。而在 OPT 中,初始条件被吸收到先验之中:所罗门诺夫测度已经将最高权重赋予最简单的观察者相容流,因此单独的 IC 指定便成为冗余。
5.1 IC 冗余论证
在标准物理学(\mathcal{M}_1)下,确定性理论的完整 MDL 编码为:
L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) + 0 \qquad \text{[确定性:若一致,则 } -\log P = 0 \text{]}
IC 项 K(\text{IC} \mid \text{laws}) 是在给定定律条件下,对特定初始条件的描述长度——它并不能由定律本身推出。这正是精细调谐的所在之处。
在 OPT 下,两部分编码为:
L_T(\text{OPT}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)
项 -\log \xi^{\text{Filter}}(y_{1:T}) 编码的是在给定元规则时的特定流。所罗门诺夫通用半测度先验已经内含一个物理学的通用模型:-\log \xi(y) \approx K(y)。OPT 编码从不需要为 IC 单独付费。
猜想 T-4c(IC 压缩启发式界)。定义 IC 压缩优势:
\Delta_{\text{IC}} = K(\text{IC} \mid \text{SP laws}) - K(\text{IC} \mid \text{OPT})
我们主张如下启发式界:
\boxed{L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1)}
其中,K(\text{IC} \mid \text{OPT}) := K(\text{IC} \mid \xi, \text{Filter}, \text{codec}) 是在给定 OPT 完整模型时,初始条件的剩余描述长度。\Delta_{\text{IC}} \geq 0,且当且仅当稳定性滤波器对 IC 所提供的额外压缩不超过定律本身已给出的压缩时取等号。
论证。 从 SP 的完整两部分编码出发,并应用所罗门诺夫支配性(将归一化常数吸收到一个 \mathcal{O}(1) 的 UTM 界定项中):
L_T(\text{OPT}) \leq K_0 + K(\text{laws}) + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) + \mathcal{O}(1)
重排并代入 L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws})(确定性理论):
L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 + \mathcal{O}(1)
在 OPT 内部,-\log \xi^{\text{Filter}}(y_{1:T}) 不必逐项编码 IC:稳定性滤波器从所罗门诺夫先验中进行选择,而后者通过长度加权内在地压缩 IC。AIT 的次可加性保证 K(\text{IC} \mid x, f(x)) \leq K(\text{IC} \mid x) + \mathcal{O}(1)。如果我们进一步设定,OPT 的选择规则相较于仅仅陈述原始定律,能够以更紧致的描述字符串给出界定(这是该框架的核心押注,而非数学上的导出性证明),那么剩余被编码的 K(\text{IC} \mid \text{OPT}) 就不可能显著超过 K(\text{IC} \mid \text{laws})。于是,在启发式意义上得到 \Delta_{\text{IC}} \geq 0。
代入即得:L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1)。\blacksquare
备注。 我们假设,人择压缩 K(\text{IC} \mid \text{OPT}) \approx 0 在稳定性滤波器具有高度约束性、并在数学上将状态映射到唯一的观察者相容状态的极限下成立。这是一个有物理动机的命题,而不是一个经由算法证明的唯一性界。
§6. 常数比特模型复杂度优势——定理 T-4d
定理 T-4d(永久性的常数比特 MDL 优势——以典型性为条件)。 对于每一个固定的、非平凡的可计算物理模型 \nu,只要 K_0 < K(\nu) < \infty,则有序补丁理论 (OPT) 的表述对于任何同时属于 \mathcal{O} 且相对于 \nu 为典型的 y_{1:T},都实现了一种固定且永久的模型复杂度优势。当序列长度 T \to \infty 时,总编码长度差在结构上满足:
L_T(\text{OPT}) - L_T(\nu) \to K_0 - K(\nu)
证明。 由 T-4b 可知,L_T(\text{OPT}) \leq K'_0 - \log \xi^{\text{Filter}}(y_{1:T})。对于任意可计算的 \nu,所罗门诺夫定理保证:\xi 恰好在 \nu-典型序列上收敛到 \nu;更准确地说,是对 \nu-几乎所有的 y_{1:\infty} 而言。这里存在一种深刻的形式张力:稳定性滤波器所隔离出的流,按其评估结果严格属于低熵且具结构性的流,因此相对于标准的、无约束的最大熵 \nu-测度流,在结构上天然地被映射为非典型。除非经过滤的观察者类 \mathcal{O} 与 \nu-典型类之间能够证明存在非平凡的数学重叠,否则就无法原生地调用所罗门诺夫收敛极限。因此,本定理仅在如下条件下成立:且仅当特定的经过滤的观察者流,在特定的基准定律下仍保持 \nu-典型性时(而这类在理论上合规的相交流之集合,形式上仍未被刻画):
-\frac{1}{T} \log \xi(y_{1:T}) \to H(\nu) \quad \text{as } T \to \infty
其中 H(\nu) 是 \nu 的熵率。类似地,-\frac{1}{T} \log \nu(y_{1:T}) \to H(\nu)。在渐近意义下,逐比特的对数损失似然项收敛并趋于相等,这意味着剩余的总编码长度优势纯粹归结为模型描述长度:
\left[L_T(\text{OPT}) - L_T(\nu)\right] \to K_0 - K(\nu) < 0 \qquad \text{[因为 } K_0 \approx 36 \text{,而 } K(\nu) \sim 1750 \text{]}
注意:尽管总编码长度保持这种永久性的固定比特优势,但逐比特优势(\frac{K_0 - K(\nu)}{T})会主动收缩至零。这并不表示通过数据积累而获得一种渐近上持续增长的优势,而是一个永久的、刚性的结构性偏移。\blacksquare
对 \mathcal{M}_1 的数值估计: K(\mathcal{M}_1) - K_0 \approx 1714 比特。一旦对数损失似然在足够长的 \nu-典型观测窗口上收敛,OPT 就会保持大约 1714 比特的永久性数学总编码优势。
§7. 有限-T 条件优势 —— 定理 T-4e
对于有限长度的流,MDL 比较要求 T-4c 的 IC 压缩优势超过 K_0 开销。
定理 T-4e(有限-T 条件性 MDL 优势)。有序补丁理论 (OPT) 相对于 \mathcal{M}_1 取得严格的有限-T MDL 优势——即,L_T(\text{OPT}) < L_T(\mathcal{M}_1)——当且仅当以下条件成立:
\boxed{K(\text{IC} \mid \text{SP laws}) > K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y_{1:T}) - \left(-\log P_{\text{SP}}(y_{1:T})\right)\right]}
右侧括号项是 OPT 相对于 SP 在特定流 y_{1:T} 上的对数似然亏损。只要 IC 的描述代价超过元规则与 OPT 在该流上的预测亏损所构成的合并开销,该条件就得到满足。
证明。 对两部分码长作直接变形:
L_T(\text{OPT}) < L_T(\text{SP}) \iff \quad K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) - \log \xi^{\text{Filter}}(y) < K_{\text{laws}} + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) \iff \quad K(\text{IC} \mid \text{laws}) - K_0 > \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] + \left[K_{\text{laws}} - K_{\text{laws}}\right]
重新整理(K_{\text{laws}} 在两边相消)即可直接得到所述条件。\blacksquare
7.1 评估标准宇宙学成立的条件
在暴胀编码下(对 SP 最有利的情形):
- K(\text{IC} \mid \text{SP laws}) \approx 300 比特(暴胀参数 + e-fold 数 + 再热)
- K_0 \approx 36 比特(T-4a)
- 对数似然赤字:我们在功能上假设,配备了 T-1 中所映射的 R_{T,h}(D) 编解码器限制的 OPT,在观察者兼容流上,至少能够达到与标准物理同样稳健的逐点对数似然。需要注意的是,所罗门诺夫界严格给出的只是对期望和的支配,而不是对特定单一样本流的确定性逐点界;因此,\left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] \leq 0 表示的是一种经验性的结构预期,而非算法性保证。
因此,该条件可化约为 K(\text{IC} \mid \text{SP laws}) > K_0,即 300 > 36。这一条件以显著的结构裕度成立。只有当 IC 的代价低于约 \sim 36 比特时,该条件才会失效——也就是说,只有当我们宇宙的特定 IC 能够仅由 SP 定律在结构上推出,并且剩余不足 36 比特时,才会如此。当前没有任何宇宙学模型做到这一点。
§8. 比较性 MDL 表
| 模型 | K(\mathcal{M})(比特) | K(\text{IC}\mid\mathcal{M})(比特) | -\log P(y\mid\mathcal{M}) | 总计 L_T | MDL 排名 |
|---|---|---|---|---|---|
| \mathcal{M}_1 — SM + GR | \sim 1750 | \sim 300(暴胀) | \sim 0(确定性) | \sim 2050 | 第 2(暴胀) |
| \mathcal{M}_3 — 玻尔兹曼 | \sim 1750 | \sim 10 | \gg 0(罕见流) | \gg 1760 | 最后(似然灾难性) |
| \mathcal{M}_{\text{OPT}} — OPT | \sim 36 | \sim 0(通过高度受限的滤波器进行条件化) | \sim 0^*(确定性编解码器近似) | \sim 36(条件性) | 第 1(条件性) |
^* 在 §9.2 的显式编解码器识别之下,一旦将 K_\theta 与 SP 编解码器等同,OPT 的活动数据项就化约为 -\log P_{K_\theta}(y) = -\log P_\text{SP}(y) = 0。
§9. 比较的限度
9.1 K(y \mid \text{Filter}) 不可计算
OPT 的码长 K_0 + K(y \mid \text{Filter}) = K_0 - \log \xi^{\text{Filter}}(y) 包含一个在图灵意义下不可计算的项(停机问题阻止对 \xi 进行精确计算)。在实践中,OPT 的预测必须由一个有限的编解码器 K_\theta 来近似——这正是标准物理学的通常做法。这意味着,就预测目的而言,OPT 会归约为当前可获得的最佳可计算编解码器。因此,OPT 相对于 SP 的 MDL 优势是一种结构性优势(体现在对选择器规则的描述上),而不是一种在提出新预测方面的操作性优势。
这并非缺陷——而恰恰是预印本主张的正确形式内容:“OPT 将部分解释负担从定律枚举转移到定律选择。” 这种转移是真实的,并且得到了形式化量化(对于选择器规则,相对于 \mathcal{M}_1 约为 \approx 1700 比特),但它并不会在编解码器本身已经提供的内容之上,额外生成新的预测内容。
9.2 编解码器识别问题
OPT 编解码器 K_\theta 是由稳定性滤波器从 \mathcal{M} 中选出的那个特定可计算测度。T-4 并不决定这一测度究竟是哪一个——这一识别需要 T-5(常数恢复)以及完整的物理统一方案。在 K_\theta 被明确识别为 SM + GR 之前,MDL 比较都以这一识别为条件。形式界限 L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 保证了 OPT 的表现不可能比 SP 更差,但并不保证它在有限时间内一定更优,除非满足 T-4e 的 IC 条件——而在标准宇宙学假设下,这一条件是满足的。
来自 P-2 的约束。 附录 P-2(通过量子纠错进行希尔伯特空间嵌入)确立了:在局域噪声条件下,编解码器必须满足 QECC 结构——其内部表征必须构成一个具有特定参数 (n, k, d) 的量子纠错码。这缩小了编解码器识别问题的范围:K_\theta 不再是任意的可计算测度,而是其预测状态携带希尔伯特空间纠错几何的一类测度。这一约束位于 T-5 常数恢复方案的上游,并且可能为将 K_\theta 识别为标准模型提供额外的选择准则。
§10. 闭合总结
T-4 交付项——已确认闭合(含归一化与典型性条件)
编码约定已固定(§1)。 采用两部分 MDL、相对于一个包容性的固定 UTM 的前缀柯尔莫哥洛夫复杂度,并将数据域以函数方式映射到意识流 y_{1:T} = z_{0:T}。
基准类别已固定(§2)。 将 \mathcal{M}_1(SM+GR)与诸如 \mathcal{M}_2(生成范围参数选择的爆炸式扩张)和 \mathcal{M}_3(玻尔兹曼似然坍缩)之类的平凡边界进行评估。
T-4a(元规则复杂度)。 K(\xi, \text{Filter}) = K_0 \approx 36 比特,包含相对 UTM 偏移量。
T-4b(所罗门诺夫有界)。 L_T(\text{OPT}) \leq L_T(\nu) + K_0 + \log(1/\xi(\mathcal{O}))。明确给出了算法归一化惩罚参数。
猜想 T-4c(IC 压缩启发式界)。 结构性的初始条件冗余被视为压缩的猜想性引擎:\Delta_{\text{IC}} = K(\text{IC}\mid\text{SP}) - K(\text{IC}\mid\text{OPT}) \geq 0,尽管映射唯一性仅在条件意义上成立。这一结果应视为启发式界,而非形式上已证明的定理。
T-4d(常数比特模型优势)。 在条件下约束其极限行为:对于那些其 \nu-典型类与 \mathcal{O} 存在非平凡重叠的可计算基准,有序补丁理论 (OPT) 获得一个持久的数值复杂度优势(\sim -1714 比特),尽管其无限期逐比特密度会缩放至零。
T-4e(有限-T 优势——条件性的)。 在经验逐点损失不推翻核心结构边界 K(\text{IC}\mid\text{SP}) > K_0(300 > 36)时,OPT 在有限 T 下在数值上同样优于 \mathcal{M}_1。这将脆弱性明确集中到关于算法性逐点支配的假设之上。
MDL 主张的证伪条件
- 仅从 SP 定律出发,在少于 \sim 36 比特内导出宇宙学初始条件——即表明 K(\text{IC} \mid \text{SP laws}) < K_0。
- 证明稳定性滤波器对观察者相容流的限制并不压缩 IC——即 K(\text{IC} \mid \xi, \text{Filter}) = K(\text{IC} \mid \text{laws}),从而得到 \Delta_{\text{IC}} = 0。
- 为 OPT 给出一个显式可计算的编解码器 K_\theta,并可证明其在观察者流上的准确性低于 SM+GR,使得对数似然赤字超过 IC 压缩增益。
下游依赖
- T-5(常数恢复) 是下一步的关键:一旦通过 T-1/T-2/T-3 将编解码器 K_\theta 与 SM+GR 定律对应起来,MDL 比较就会变得完全显式,而 T-4e 中的条件也将成为已知量之间的一个具体不等式。
- 预印本 §5.2 更新: 短语“Whether this meta-rule yields an actual MDL advantage… is an open comparative question”现在可以更新为:“Theorem T-4d establishes a conditional asymptotic advantage (for observer streams that are also \nu-typical under the benchmark physics, a set currently uncharacterised); Theorem T-4e establishes a conditional finite-T advantage; see Appendix T-4.”
本附录作为 OPT 项目仓库的一部分,与 theoretical_roadmap.pdf 一并维护。参考文献:Rissanen (1978) [12],Li & Vitányi (2008) [27],Solomonoff (1964) [11],Penrose (2004)。