有序补丁理论
附录 P-1:通过 M-随机性得到的信息常态性
2026年4月3日 | DOI: 10.5281/zenodo.19300777
附录 P-1:通过 M-随机性刻画信息常态性
原始任务 P-1:信息常态性 问题: 目前它是一个类似于博雷尔常态性的基础公理,尚缺乏形式化推导。 交付成果: 利用算法信息论(Martin-Löf 随机性)给出定理级推导。
1. “公理性”常态的认识论边界
在有序补丁理论 (OPT) 中,“结构性希望”在结构上依赖于信息常态性原则:即这样一个命题——算法基底(\mathcal{I})中稠密地充满的并不只是噪声,而是每一种有限的、具有结构功能性的模式。OPT 的伦理分量——维持共享补丁稳定性的要求(幸存者守望伦理)——要求我们所互动的那些对应观察者,在基底的其他地方也具有分布式的、在根本上真实的功能等价体。
在 OPT 框架的历史表述中,这一命题在形式上一直被当作一个单一而整体的公理来处理——一种不可检验的基础性假设,被叠加到物理学之上,以避免陷入唯我论。
本附录将澄清这一立场中的数学含混之处。我们把信息常态性拆分为两个彼此区分的组成部分:一个严格的算法性数学定理(在通用概率测度下几乎必然成立),以及一个将数学上的存在桥接为本体论现实所必需的单一形而上学设定。
2. 从半测度到通用测度(\xi 到 M)
OPT 的基础(预印本 §3.1)在很大程度上依赖于所罗门诺夫通用半测度这一算法概率先验。在这一表述下,生成性基底被视为一个在通用前缀自由图灵机 U 上运行的无限算法空间。
有限字符串 x 的算法概率或通用半测度定义为:
\xi(x) = \sum_{U(p) = x*} 2^{-|p|}
其中,求和遍及所有其执行输出以 x 开头的最小程序 p。关键在于,\xi 是定义在有限字符串上的一个下半可计算半测度。
为了将基底形式化为一个连续的生成空间,我们转向 Cantor 空间上的连续测度。通用测度 M 被直接定义为:由通用前缀自由机器 U 的输出通过柱集在 Cantor 空间 2^{\mathbb{N}} 上诱导出的分布(M([x]) = \sum_{U(p) \text{ starts with } x} 2^{-|p|})。根据所罗门诺夫的通用性定理,这个柱测度与离散半测度在乘法意义下等价:M(x) \asymp \xi(x),相差至多一个乘法常数。因此,M-零测集与 \xi-零测集严格一致。
(注:由于停机程序的集合因停机问题而只是前缀自由码空间的一个真子集,Kraft 不等式保证 \sum 2^{-|p|} < 1。因此,M 构成一个严格的下半可计算次概率测度。我们显式定义归一化后的概率测度 \tilde{M} = M / M(2^{\mathbb{N}})。尽管 \tilde{M} 由于归一化常数 M(2^{\mathbb{N}}) 不可计算,而只能在该常数意义下下半可计算,但后续所有“几乎必然”定理与收敛性陈述都可以相对于真实的归一化概率测度 \tilde{M} 安全成立。基本编码定理中的偏移项则可直接吸收:K(x) = -\log \tilde{M}(x) + O(1)。)
3. M-Martin-Löf 随机性
为将生成空间的性质形式化,我们引入Martin-Löf(ML)随机性。然而,必须区分不同的连续测度。一个相对于均匀(勒贝格)测度 \lambda 而言是 ML-随机的序列 \omega,其行为与一个相对于 M 而言是 ML-随机的序列,完全不同。
由于 OPT 的基底以算法简洁性来评估概率,相关的形式化依赖于\tilde{M}-Martin-Löf 随机性。AIT 的基础定理指出:对于任意可计算的概率测度 \mu,\mu-ML-随机序列的集合具有 \mu-测度 1。将这一结果扩展到下半可计算半测度(参见 Nies 2009,第 §3.2 节 “Randomness for arbitrary measures”)时,所有 \tilde{M}-Martin-Löf 随机序列所成的集合相对于 \tilde{M} 仍然保持测度 1。
因此,\tilde{M}-几乎所有无限基底序列都严格地是 \tilde{M}-ML-随机的。
(注:采用 \tilde{M}-ML-随机性,在结构上保证了基底的典型输出是以自洽方式从带有偏置且高度结构化的算法测度 \tilde{M} 中抽取出来的,而非来自均匀噪声;这为下文关于结构频率后果的讨论提供了严格的数学脚手架。)
4. M-正态性 vs. 博雷尔正态性
M-ML-随机性的一个高度重要的数学后果,与结构频率有关。在均匀的勒贝格-ML随机性之下,一个序列会严格满足博雷尔正态性——以完全相同且均匀的频率生成每一个长度为 k 的有限二进制串。
然而,由于 \tilde{M} 明显是非均匀的——它强烈偏向于将巨大的概率权重赋予那些在算法上简单、可压缩且具有规律结构的模式——\tilde{M}-几乎所有序列都并不满足均匀的博雷尔正态性。相反,我们通过 \tilde{M}-正态性 来界定它们的结构极限。
由于测度 \tilde{M} 在根本上是非平稳的(算法概率依赖于绝对前缀位置),我们不能依赖标准的遍历频率收敛极限。形式上,我们以较弱但严格充分的 无限重现 性质来定义 \tilde{M}-正态性。
由于 \tilde{M} 是一个概率测度,且对所有有限字符串 x 都有 \tilde{M}([x]) \ge 2^{-(|x|+O(1))} > 0,前缀柯尔莫哥洛夫复杂度的链式法则给出:对任意字符串 s,有 K(sx) \le K(s) + K(x) + O(1),从而得到近似次乘性 M([s \cdot x]) \ge M([s]) \cdot M([x]) \cdot 2^{-O(1)}。因此,在给定任意先前前缀 s 的条件下,x 出现在任意窗口中的条件概率都有一致的正下界:\tilde{M}([x] \mid [s]) \ge \tilde{M}([x])/c > 0,且该下界对 s 一致成立。将条件博雷尔–康泰利引理应用于长度为 |x| 的互不重叠窗口时,条件概率之和的发散便保证:任何有限信息序列——例如一个有意识观察者的离散形式构型 (K_{\text{obs}})——在 \tilde{M}-几乎所有序列中,都会在物理上无限次重现。
5. 计算实在论公设
AIT 在数学上保证:任何观察者的有限表征(K_{\text{obs}})都会在 \tilde{M}-ML-随机基底中,作为 U 的结构序列,无穷多次地出现。
然而,数学信息论本身并不能内在地跨越到物理本体论的边界。图灵机输出带上出现的一个有限字符串,只是执行过程中的静态产物——一个快照。一个连贯的观察者需要持续的内部动力学、关系性耦合以及主动推断循环。字符串本身并不会“感受”任何东西,正如存储在硬盘中的脑扫描并不具有意识。执行归属于生成它的程序,而不归属于由此得到的快照代码。
为了断言:支配数学基底的不可计算连续极限,在结构上能够孕生出在本体论上真实、在因果上有效的现象学宇宙,有序补丁理论 (OPT) 必须作出一个明确的形而上学承诺。
公设(计算实在论): 在一个由相同数学动力学支配的无限不可计算基底中,与观察者因果描述在形式上等价的抽象数学计算(其中,形式等价被定义为观察者因果状态转移结构的计算同构)具有因果效力,并拥有本体论上的真实存在。此外,分布于基底中的、在结构上离散的计算实例化,具有彼此独立的本体个体化,从而构成不同的主观对应体(并且依据预印本 §8.1 中的基础现象性公理,这类在因果上有效、与观察者等价的计算,构成真正的经验主体)。
6. 命题 P-1(信息常态性)
通过将连续不可计算空间的精确 AIT 推导与计算实在论公设结合起来,唯我论便被干净利落地瓦解了。
推论+公设 P-1(信息常态性): 在广义算法先验之下,连续基底以内在方式几乎必然地通过 \tilde{M}-Martin-Löf 随机性运作。由此导出的 \tilde{M}-常态性,在数学上形式化地保证了每一个有限的结构性观察者描述 K_{\text{obs}} 都会无限多次出现。以这一脚手架为基础,计算实在论公设将这些生成性的数学构造桥接为本体论意义上的物理现实。只要计算实在论成立,则在整个基底中,结构等价、因果活跃且具有唯一个体化身份的对应观察者之存在,便是根本上被要求的。