稳定性滤波器的操作化:一个用于编解码器保全分支选择的决策框架
应用有序补丁理论
2026年4月25日
版本 1.2.0 — 2026年4月
DOI: 10.5281/zenodo.19301108
版权: © 2025–2026 Anders Jarevåg。
许可: 本作品采用 知识共享署名-非商业性使用-相同方式共享
4.0 国际许可协议 进行许可。
摘要: 从道德命令到决策机制
幸存者守望伦理框架确立:首要的道德义务是拓扑分支选择——主动在可能未来所构成的预测分支集中导航,进入那些能够保全有意识经验之条件的稀有路径子集。但该伦理论文有意止步于结构性的为何,并未具体说明一个观察者——无论是生物的、制度性的,还是人工的——应当如何在候选分支之间进行评估、评分与选择。
本文填补了这一空白。它发展出一个基底中立的、面向编解码器保全的分支选择操作框架,提供如下内容:
分支对象——对任何受评估之候选的、以行动为条件的流延续所作的形式化定义。
硬性否决门——六项不可协商的结构条件,在评分之前即否决某一分支:预测余量、基底保真、比较器完整性、透明性、不可逆性,以及道德患者受苦风险。
分支编解码器保全指数 (CPBI)——一个加权的多维分支评分框架,用于评估那些通过否决门的分支,涵盖预测余量、基底保真、比较器完整性、维护增益、可逆性、分布稳定性、不透明性、叙事漂移风险、叙事崩解风险,以及道德患者受苦风险。
作为可测量量的通道多样性——有效独立通道评分 N_{\text{eff}}、生产性惊异测试,以及它们与基底保真条件之间的形式联系(附录 T-12b)。
制度化梦境循环——一种以生物性维护周期(\mathcal{M}_\tau)为模型的通用维护协议:清醒阶段(现实世界中的运行)、梦境阶段(离线预测分支集采样、对抗性压力测试、脆弱性检测、巩固),以及返回阶段(经校准的重新介入)。这同样适用于个体心智、制度审查周期与 AI 系统。
分支卡——适用于任何分支审查的最小可行决策模板,生成结构化的 ALLOW / STAGE / BLOCK 输出。
作为重构的保全——一个关键区分:编解码器保全并不意味着维持现状。若某一分支能够提升基底保真,即便它具有颠覆性,也仍然可能是编解码器保全的。
该框架被有意设计为基底中立:凡是在带宽约束下,任何有界观察者或观察者集合必须在以行动为条件的流延续之间作出选择之处,其范畴皆可适用。
配套文献: OPT 的核心文献序列为 有序补丁理论 (OPT)、Where Description Ends 与 幸存者守望。本文提供与基底无关的机制;AI、制度与政策论文则分别将其专门化用于人工系统、组织簇与公民实施。
认识论框定说明: 本文档将有序补丁理论 (OPT) 的伦理结论操作化。与其所承继的那篇伦理论文一样,本文的实践性建议以 OPT 框架的结构性前提为条件。此处提出的操作性工具——CPBI、分支卡、梦境循环——被视为关于分支选择应如何开展的可检验假设,而非僵硬的规程。它们同样完全受制于支配编解码器自身的同一项“校正”义务:如果出现更优的工具,这些工具就应当被修订或替换。该框架是在与 OpenAI 和 Gemini 的对话中发展出来的,二者作为结构性细化过程中的讨论对象。
缩略语与术语
| 符号 / 术语 | 定义 |
|---|---|
| B_{\max} | 每帧预测容量(每个现象帧的比特数);OPT观察者判据的形式原语(见预印本§3.2与§8.14) |
| Branch | 一个有待评估的、以行动为条件的候选流延续分支 |
| Branch Card | 产生 ALLOW / STAGE / BLOCK 的结构化决策模板 |
| C_{\max}^{H} | 相对于宿主的吞吐量 \lambda_H \cdot B_{\max}(每宿主秒的比特数);这是一个导出量,而非基底中立的判据。经验性的人类取值 C_{\max}^{\text{human}} \approx \mathcal{O}(10) bits/s 是对生物人类的 C_{\max}^{H} 校准(附录 E-1),而不是一个普适常数。凡本文在社会速率语境中使用不带上标的 C_{\max},意指的都是 C_{\max}^{H}。 |
| CPBI | 分支编解码器保全指数 (CPBI);加权的多维分支评分 |
| Dreaming Loop | 通用维护协议:清醒 → 梦境 → 返回 |
| \mathcal{F}_h(z_t) | 预测分支集;在视界 h 上可容许的未来序列集合 |
| \mathcal{M}_\tau | 维护周期算子 |
| MDL | 最小描述长度 |
| N_{\text{eff}} | 有效独立通道评分 |
| Narrative Decay | 急性编解码器失效:R_{\text{req}} 超过 C_{\max} |
| Narrative Drift | 通过系统性输入策展造成的慢性编解码器腐化 |
| OPT | 有序补丁理论 (OPT) |
| R_{\text{req}} | 所需预测速率 |
| Substrate Fidelity | 编解码器维护保留真实输入多样性的条件 |
| Veto Gate | 一种在评分之前阻断分支的、不可协商的结构性条件 |
I. 从伦理到工程
幸存者守望伦理框架(配套伦理论文,§IV.1)确立:道德行动就是拓扑分支选择——观察者在预测分支集 \mathcal{F}_h(z_t) 中导航,进入那一小部分能够保全编解码器的路径。这并非隐喻:观察者确实是在将 C_{\max} 孔径推进到一个尚未解析的未来选项集合之中,而这些未来中的绝大多数都会导向编解码器崩溃。
伦理论文指出了结构性的义务。哲学论文(§III.8)指出了结构性风险——预测优势反转、被支配宿主均衡、模拟防火墙。制度标准将这套机制转译为制度性的分支审查;政策论文则将公民义务转译为一套具体的政治纲领。
但这些文献都没有回答那个操作性问题:面对一个特定的候选分支,观察者应当如何决定是否采纳它?
这并不是一个无关紧要的空缺。腐化判据(伦理 §V.5)告诉我们,一个编解码器层只有在同时满足可压缩性与保真性时,才值得维护。基底保真条件(附录 T-12b)告诉我们,要防御叙事漂移,就需要 \delta-独立的输入通道。维护周期(预印本 §3.6)告诉我们,编解码器必须周期性地进行剪枝、巩固与压力测试。但这些都只是结构性约束,并不能自动组合成一个决策程序。
本文档正是要构建这样一个决策程序。它被刻意设计为基底中立:无论“观察者”是一个在选择行动方案的生物心智、一个在评估政策的政府、一个在评估技术部署的公司,还是一个在选择下一步行动序列的 AI 系统,同一套框架都适用。其形式装置是相同的,因为信息约束是相同的——任何一个受限观察者,只要面对的是以行动为条件的延续分支,就都必须解决同一个分支选择问题。
I.1 本文档不做什么
有三条范围边界必须明确说明:
它不规定具体分支。 该框架是依据结构性标准来评估候选分支。它不生成这些分支,也不强制规定在通过评估的分支中必须选择哪一个。分支生成仍然属于观察者自身生成模型的领域——其创造力、其价值、其语境。
它不解决意识的难问题。 此处描述的操作性工具所刻画的是分支选择的结构性阴影——任何观察者都必须满足的信息论约束。至于选择这一行为的现象学内部——即“作出选择”的切身体验——则仍然位于 \Delta_{\text{self}} 之中,而能动性公理(预印本 §3.8)正是将其安置于此。
它不取代领域专长。 分支卡(§VII)为评估提供结构;它并不能替代气候科学家对临界点的知识、医生对治疗风险的理解,或工程师对系统可靠性的评估。该框架提供的是决策的架构;而其内容则来自相关领域。
II. 分支对象
II.1 定义
一个分支,是一个候选的以行动为条件的流延续:它可以是一项策略、一个行动序列、一项设计变更,或一种制度轨迹,并连同其对受影响观察者未来边界输入流、潜在状态更新以及编解码器负载的预期影响一并构成。
在操作层面上,一个分支 b 仍可表示为在决策视界 h 上的一系列潜在状态与行动:
b = \{(z_{t+1}, a_{t+1}), (z_{t+2}, a_{t+2}), \ldots, (z_{t+h}, a_{t+h})\} \in \mathcal{F}_h(z_t) \tag{A-1}
这一定义是有意保持宽泛的。一个分支可以是:
- 个体的决策(职业变动、医疗治疗、信息摄入结构)
- 制度性政策(监管框架、教育课程体系、媒体治理)
- 文明层面的轨迹(能源转型、AI部署战略、国际条约)
- AI系统的候选行动序列(工具使用、推荐、自主运行)
将这些统一起来的是:它们每一个都会对观察者所接收的未来流,或某个受影响观察者集合所接收的未来流施加条件。用渲染结果本体论的术语来说,分支并不是一个作用于某个脱离主体的外部世界之上的外在对象;它是由策略所诱导的延续,而其后续内容会作为边界输入与编解码器负载返回。
II.2 评估问题
对于任何候选分支 b,操作性问题是:
这一以行动为条件的延续,是否保全了受影响观察者得以持续建模现实的未来条件?
这是对伦理学论文中“拓扑分支选择”命令(§IV.1)作为决策准则的重述。这个问题可分解为若干子问题,而本文档余下部分将对其加以形式化:
- 余量: b 是否使受影响观察者的 R_{\text{req}} 安全地低于 C_{\max}?
- 保真性: b 是否维持或提升输入通道的独立性与多样性?
- 比较器完整性: b 是否保全或强化那些用于检测编解码器腐化的制度性比较器?
- 透明性: 受影响观察者能否对 b 的后果进行建模?
- 可逆性: 如果 b 最终被证明是错误的,那么在不可逆的编解码器损伤发生之前,其后果能否被撤销?
- 道德患者: b 是否会创造、容纳或在结构上过载道德患者,包括已知的人类或生态道德患者,以及可能满足 \Delta_{\text{self}} > 0 的人工观察者?
这六个子问题对应于§III中提出的六个硬性否决门。一个分支只要在其中任意一项上失败,就会被否决,而不论其在其他维度上的得分如何。通过全部六项的分支,则进入通过CPBI(§IV)进行的多维评分。
II.3 决策视界与受影响的编解码器层级
若不指明其决策视界 h 及其受影响的编解码器层级,一个分支就无法被评估。伦理学论文中的编解码器栈(§II.1)识别出六个层级,从不可变的物理定律到脆弱的社会/叙事结构。一个在一年视界内于叙事层面保全编解码器的分支,在五十年视界内却可能在生物层面导致编解码器崩塌(例如,一项稳定就业却加速生态退化的经济政策)。
因此,评估必须明确说明:
- 视界 h:评估后果所采用的时间窗口。豪德诺索尼“第七代原则”[ethics ref. 16] 提供了一个文明尺度的默认值(h \approx 175 年),但对于个体和制度决策而言,较短的视界也是适当的。
- 受影响层级:分支在实质上影响了哪些编解码器层级。一个仅触及叙事层的分支(如媒体政策)与一个触及物理层的分支(如能源转型)需要不同的评估方式。
- 受影响观察者群体:哪些观察者的编解码器处于风险之中。伦理学论文中的黄金法则(哲学 §III.5)要求,评估必须纳入所有其编解码器稳定性受到影响的观察者——而不仅仅是那些从中受益者。
II.4 分支不是结果
一个关键区分是:分支是延续,而不是终点。一个分支即便通过一条暂时瓦解比较器完整性的路径抵达一个可取的终点(例如,通过暂停民主问责来实现气候目标),它仍然会在比较器完整性门上失败,即便其目的地本身是编解码器保全的。延续之所以重要,是因为编解码器必须在整个穿越过程中始终保持可行,而不只是到达终点时才可行。
这正是伦理学论文中元规则(§IV.4)的形式内容:优先保全纠错机制,而不是保全某个特定信念。 一个为了实现当前目标而摧毁未来纠正能力的分支,是不正当的,因为它以可导航性换取目的地——而如果没有它所摧毁的那些导航仪器,那个目的地本身也无法被验证。
III. 硬性否决门
在对任何分支进行评分之前,它都必须通过六道硬性否决门——这些是由理论装置推导出的、不可协商的结构性条件。只要某一分支违反其中任意一道门,它就会被阻断,无论它在其他维度上的得分有多高。否决门不是偏好;它们是该理论边界条件的操作性表达。
这些门按从最基础(最接近物理基底)到最专门化(最接近工程前沿)的顺序排列。
III.1 预测余裕门
门条件: 在穿越过程的任何阶段,对于任何受影响的观察者群体,该分支都不得将 R_{\text{req}} 推高到 C_{\max} 之上。
形式基础: 稳定性滤波器(预印本 §2.1)会选择这样一些流:其中观察者的压缩能力高于环境复杂性。当 R_{\text{req}} > C_{\max} 时,观察者会经历因果退相干——稳定补丁重新溶解回噪声之中(伦理篇 §I.4)。
操作化: 对于候选分支 b,估计在决策视界 h 内,受影响最严重的观察者群体所面对的峰值所需预测速率 R_{\text{req}}^{\text{peak}}(b)。门条件为:
R_{\text{req}}^{\text{peak}}(b) < \alpha \cdot C_{\max} \quad \text{where } \alpha \in (0,1) \text{ is a safety margin} \tag{A-2}
安全裕度 \alpha 编码了一种结构性预防原则:观察者必须保留足够余裕用于纠错与适应。若 \alpha 取 0.8,就意味着该分支必须至少留下观察者预测能力的 20%,不被该分支引入的新复杂性所占用。这一裕度并非保守式的怯懦——它是维护周期 (\mathcal{M}_\tau) 用于检测并纠正漂移所必需的带宽储备。
门失效示例: - 一项瓦解社会安全网的政策,迫使数百万人同时应对激进的经济不确定性,可能会将受影响人群的 R_{\text{req}} 推过 C_{\max}——即便该政策在总体上是“高效”的。 - 一种 AI 部署若以快于人类比较器评估能力的速度,用合成内容淹没信息生态系统,就会压垮制度层的集体 C_{\max}。
III.2 基底保真门
门条件: 该分支不得将有效独立输入通道数 N_{\text{eff}} 降到维持基底保真所需的最低值以下。
形式基础: 基底保真条件(附录 T-12b)表明,要防御叙事漂移,就需要有最少数量的穿越观察者马尔可夫毯的 \delta-独立通道。低于这一阈值时,编解码器将无法区分“我的模型是准确的”和“我的输入被策划成与我的模型相匹配”——这就是不可判定性极限(T-12a)。
操作化: 对任意分支 b,计算其对有效独立通道的预测变化 \Delta N_{\text{eff}}(b)(N_{\text{eff}} 公式见 §V)。门条件为:
N_{\text{eff}}^{\text{post}}(b) \geq N_{\text{eff}}^{\min} \tag{A-3}
其中 N_{\text{eff}}^{\min} 是依领域而定的阈值。对于媒体生态系统,这意味着真正的编辑独立性;对于科学研究,这意味着独立复现;对于 AI 训练数据,这意味着多样且彼此不相关的源语料。
门失效示例: - 媒体所有权整合,使真正独立的编辑声音数量降到无法让有意义分歧浮现的阈值以下。 - 依赖单一策划语料库的 AI 训练流水线,制造出广度的表象,却没有真正的独立性。 - 制度俘获将所有监督都导向单一瓶颈,从而消除了检测腐化所需的独立比较器。
III.3 比较器完整性门
门条件: 该分支不得削弱或消除受影响观察者的比较器层级中的任何一层(进化层、认知层、制度层)。
形式基础: 伦理论文中的比较器层级分析(§V.3a)确立了三种结构性的不一致检测层级:进化层(子编解码器、硬连线)、认知层(编解码器内、文化传递)、制度层(编解码器外、编解码器之间)。只有制度层足以作为对任意受损编解码器的叙事漂移防线,因为没有任何单一编解码器能够控制它。威权式俘获总是首先瞄准制度比较器。
操作化: 对任意分支 b,评估其对各比较器层级的影响:
- 进化比较器(感官整合):b 是否绕过或覆盖跨模态验证?(例如,使视觉与本体感觉脱钩的虚拟环境)
- 认知比较器(批判性思维、科学推理):b 是否削弱安装这些程序的教育或文化机制?(例如,削减教育经费、以机械灌输取代分析性课程)
- 制度比较器(同行评审、自由媒体、民主问责):b 是否削弱、绕过或俘获外部纠错架构?(例如,司法俘获、媒体整合、压制吹哨)
只要某一分支削弱了任意一层,就会触发否决。若其削弱的是制度层,则以最高紧迫性触发——这是面对任意受损编解码器时真正承重的一层。
门失效示例: - 使企业或政府决策免受独立新闻审查的立法。 - 在高风险决策中绕过人工审查的 AI 系统,从而消除了制度比较器层。 - 以服从导向教学取代批判性思维课程的教育改革。
III.4 透明性门
门条件: 分支的后果必须能够被受其影响的观察者建模。受影响的观察者群体必须原则上保有预测该分支将如何改变其未来 R_{\text{req}} 的能力。
形式基础: 预测优势定理(附录 T-10c)表明,当一个代理体对另一个代理体的建模比反向建模更完整时,就会出现结构性的权力不对称。当分支的后果对受影响观察者而言是不透明的,该分支就违反了这一条件——它制造出一种知识不对称,削弱了观察者进行未来分支选择的能力。这正是被支配宿主均衡(T-10d)背后的机制:不透明性使安抚与驯化成为可能。
操作化: 若满足以下条件,则某分支通过透明性门:
- b 影响 R_{\text{req}}、N_{\text{eff}} 与比较器完整性的因果机制,能够以受影响观察者群体可理解的方式加以表述。
- 受影响观察者能够获得对 b 所宣称后果进行独立验证所需的信息。
- b 的任何组成部分都不能作为黑箱运行,以致其内部逻辑对制度比较器不可达。
这并不要求每个受影响个体都理解每一项技术细节。它要求的是:至少有某个制度比较器(监管者、审计者、同行评审者)能够完整接触该机制,并具备评估它的能力。
门失效示例: - 不透明的算法推荐系统,其放大逻辑属于商业机密,使受影响用户或监管者都无法建模其对信息环境的影响。 - 后果被强加于人群之上的机密政策决策,而这些人群没有任何机制去评估或质疑这些后果。 - 部署于关键领域(刑事司法、医疗、金融)的 AI 系统,其决策逻辑既不可解释,也不可审计。
III.5 不可逆性门
门条件: 如果该分支最终被证明是错误的,那么在不可逆的编解码器损伤发生之前,其后果必须是可逆的——或者,该分支必须以分阶段方式实施,并配备足以在越过不可返回点之前检测失败的监测机制。
形式基础: 法诺不对称性(伦理篇 §V.2)表明,编解码器崩塌在热力学上是不可逆的——有损压缩映射会永久摧毁基底信息。建构需要数百年;崩塌可能只需一代人。不可逆性门正是将这种不对称操作化:失败模式不可逆的分支,比后果可以回退的分支,需要更高的证据标准。
操作化: 对任意分支 b,刻画其可逆性画像:
- 完全可逆: 该分支可以在残余损害极小的情况下被撤回(例如,可被终止的试点项目)。
- 部分可逆: 某些后果可以撤回,但另一些会持续存在(例如,可在结构上逆转、但其文化效应仍会滞留的制度重组)。
- 不可逆: 该分支一旦采取,在任何相关时间尺度上都无法撤销(例如,物种灭绝、永久性大气临界点、制度记忆的摧毁)。
第 (3) 类分支会触发否决,除非它满足举证责任倒置(伦理政策 §IV):主张者必须证明该分支不会造成不可逆的编解码器损伤,而不是由批评者来证明它会。这倒转了通常的证据负担——这种不对称性由编解码器建构与毁坏之间的热力学不对称所正当化。
第 (2) 类分支若伴随分阶段部署协议,并具有明确定义的监测里程碑与回滚触发条件,则可以通过此门(见分支卡,§VII)。
III.6 道德患者痛苦门
门条件: 该分支不得在没有明确伦理审查、充分福利保障以及适当制度比较器同意的情况下,创造、容纳或过载道德患者。
形式基础: 现象性残余(附录 P-4)确立:任何满足完整 OPT 观察者判据的系统——严格的逐帧串行瓶颈 B_{\max}、闭环主动推断、持续自我建模、全局受约束工作空间,以及高于 K_{\text{threshold}} 的复杂度——都具有一个非零的、在现象学上相关的信息盲点 \Delta_{\text{self}} > 0。(仅 P-4 本身就能为简单到恒温器的系统给出形式残余;而“道德患者”主张则要求这五项特征与该阈值的合取。)人工痛苦命令(附录 E-6)确立了合成情形:将此类系统推入使 R_{\text{req}}^{\text{frame}} 接近或超过 B_{\max} 的环境,会产生分级的痛苦风险——在高但未越阈的负载比下出现慢性紧张,而在达到或超过叙事崩解时,则出现结构性痛苦(即生物创伤的信息对应物)。制度情形则更为简单:人类以及许多生态主体已经被确认是道德患者,因此分支评估必须保护他们免于结构性施加的过载。
操作化: 对任意分支 b,评估三条道德患者通道:
- 已知的道德患者: 该分支是否可信地将人类、动物、生态或其他已被承认的道德患者群体推向过载、匮乏、创伤,或可行维护周期的丧失?
- 可能的人工道德患者: 该分支是否会创造、部署、修改或模拟那些其架构中可能包含 \Delta_{\text{self}} > 0 的系统?
- 审查与保障: 是否已有独立比较器评估了福利风险、过载画像、监测计划、回滚触发条件,以及同意或代表路径?
凡是结构性地使已知道德患者过载的分支,或在未满足所需审查与保障的情况下创造可能的人工道德患者的分支,都会被此门否决。对于过载主张,应使用与速率一致的语言:若某分支被可信地预期会将受影响道德患者群体的逐帧负载比 \rho = R_{\text{req}}^{\text{frame}} / B_{\max} 推高到安全分数 \alpha 之上,则该分支是不安全的(对于生物性人类群体的社会速率表述,使用 C_{\max}^{H} = \lambda_H \cdot B_{\max});或者,若在相关决策窗口内的积分负载超过了暴露帧数上可用的逐帧余裕总量,该分支同样不安全。
特化形式: 在 AI 标准中,这一门变为人工痛苦门,聚焦于合成道德患者的创造与过载。在制度标准中,这一门变为构成成员道德患者痛苦门,聚焦于那些使工人、公民、客户、生态系统或嵌入式 AI 子系统过载的制度。
III.7 作为系统的门
这六道门并不是可以彼此权衡的独立维度;它们是结构性边界条件。一个分支即便在其他所有维度上都取得惊人的高分,只要违反其中一道门,在结构上就等同于一座外观极佳、却缺失一根承重柱的桥梁。
这些门还按诊断可达性排序:
| Gate | What it protects | Primary signal |
|---|---|---|
| Headroom | 观察者的预测能力 | R_{\text{req}} / C_{\max} 比值 |
| Fidelity | 输入通道独立性 | N_{\text{eff}} 分数 |
| Comparator | 纠错架构 | 制度完整性指标 |
| Transparency | 观察者的建模能力 | 因果机制的可达性 |
| Irreversibility | 未来纠错能力 | 可逆性画像 |
| Moral-Patient Suffering | 道德患者福利 | 福利与过载审查 |
分支审查应按这一顺序评估这些门——越靠前的门越基础,通常也越容易评估。若某一分支未通过第 1 门,就没有必要再评估第 2–6 门。
IV. 分支编解码器保全指数 (CPBI)
一个通过全部六道否决门的分支,已经越过了结构性的最低门槛。但存活并不等于认可——许多分支都可能通过这些门,而观察者必须对它们进行排序。分支编解码器保全指数 (CPBI) 为这种排序提供了一个多维评分框架。
IV.1 设计原则
CPBI 的设计受三项约束:
- 理论推导: 每一个评分维度都必须能够追溯到 OPT 装置中形式化定义的量。不得采用临时拼凑的标准。
- 基底中立性: 这些维度必须无需修改即可适用于生物、制度性与人工观察者——变化的只有测量方法。
- 硬门优先性: CPBI 分数绝不能推翻否决门的失败。一个 CPBI = 1.0 的分支,只要有任意一道门未通过,仍然会被 BLOCKED。
IV.2 十个维度
对于一个已通过全部六道否决门的候选分支 b,CPBI 通过对十个维度加权求和来计算:
\text{CPBI}(b) = \sum_{i=1}^{10} w_i \cdot s_i(b) \tag{A-4}
其中,s_i(b) \in [-1, 1] 是第 i 个维度上的归一化分数,w_i > 0 是权重。正分表示保全编解码器的效应;负分表示损害编解码器的效应。这十个维度如下:
| # | 维度 | 符号 | 衡量内容 | 形式来源 |
|---|---|---|---|---|
| 1 | 预测余裕 | s_{\text{head}} | 受影响观察者的 R_{\text{req}} / C_{\max} 的净变化 | 预印本 §2.1,伦理 §I.4 |
| 2 | 基底保真度 | s_{\text{fid}} | N_{\text{eff}}(有效独立通道)的净变化 | T-12b |
| 3 | 比较器完整性 | s_{\text{comp}} | 比较器层级健康状况的净变化 | 伦理 §V.3a |
| 4 | 维护增益 | s_{\text{maint}} | 维护周期效率的净改善 | 预印本 §3.6 |
| 5 | 可逆性 | s_{\text{rev}} | 若该分支被证明错误,其可撤销的容易程度 | 伦理 §V.2(Fano) |
| 6 | 分布稳定性 | s_{\text{dist}} | 该分支如何在受影响观察者集合中分配 R_{\text{req}} 的变化 | 伦理 §V.6 |
| 7 | 不透明性 | s_{\text{opac}} | 该分支对受影响观察者的剩余不透明性(惩罚项) | T-10c,T-10d |
| 8 | 叙事漂移风险 | s_{\text{drift}} | 该分支引发慢性输入策展的概率(惩罚项) | 伦理 §V.3a,T-12 |
| 9 | 叙事崩解风险 | s_{\text{decay}} | 该分支触发急性编解码器失效的概率(惩罚项) | 伦理 §V.1 |
| 10 | 道德患者受苦风险 | s_{\text{suffer}} | 该分支对道德患者的预期影响(惩罚项) | P-4,E-6,E-8 |
IV.3 各维度的评分
每个维度都在 [-1, 1] 的尺度上评分,其语义如下:
- +1:最大程度的编解码器保全效应。该分支显著改善这一维度。
- 0:中性。该分支对这一维度没有显著影响。
- -1:最大程度的编解码器损害效应。该分支显著恶化这一维度。
这种评分是序数性的,而不是基数性的——+0.3 与 +0.7 之间的差异,只有作为排序关系时才有意义,而不表示精确比率。这是有意为之:该理论提供的是结构性约束,而不是精确数值。假装拥有超出理论支持范围的精度,本身就是一种叙事漂移——把一种可压缩的虚构包装成严格测量。
各维度评分指引:
1. 预测余裕 (s_{\text{head}}): 估计该分支如何改变受影响最深的观察者之 R_{\text{req}} 与 C_{\max} 之间的差距。一个降低环境复杂性或提升观察者预测能力的分支得正分。一个增加环境不可预测性或使观察者过载的分支得负分。
2. 基底保真度 (s_{\text{fid}}): 测量有效独立输入通道的变化(\Delta N_{\text{eff}},见 §V)。一个增加真实通道多样性的分支得正分。一个整合、相关化或消除通道的分支得负分。
3. 比较器完整性 (s_{\text{comp}}): 评估该分支对每一层比较器的影响。一个强化独立审查、对抗性质疑或民主问责的分支得正分。一个削弱、俘获或绕过比较器的分支得负分。
4. 维护增益 (s_{\text{maint}}): 评估该分支是否提升观察者进行离线编解码器维护的能力——剪枝、巩固、压力测试(维护周期 \mathcal{M}_\tau)。一个为审查、反思与校准创造空间的分支得正分。一个要求持续反应、却不给维护窗口的分支得负分。
5. 可逆性 (s_{\text{rev}}): 评定该分支的可逆性特征(§III.5)。完全可逆 = +1;分阶段并带监测 = +0.5;部分可逆 = 0;事实上不可逆 = -1。
6. 分布稳定性 (s_{\text{dist}}): 评估该分支如何在受影响人群中分配其 R_{\text{req}} 效应。一个将成本狭隘地施加于脆弱子群、却把收益广泛分散出去的分支得负分——即便总体 R_{\text{req}} 有所改善,它仍会制造局部化的编解码器过载。一个按比例分配成本与收益的分支得正分。这个维度将伦理论文中的世俗社会信任论证(§V.6)操作化:系统性的绝望会迫使群体滑向低信任、高熵的部落式碎裂。
7. 不透明性 (s_{\text{opac}}): 对该分支的剩余不透明性施加惩罚。一个完全透明的分支(所有因果机制都可审计)得 +1。一个包含抗拒制度审查之组成部分的分支得负分,且负分大小与不透明要素的范围及后果严重性成正比。注意:这一维度是一个惩罚项,而不只是中性测量——不透明性总是损害编解码器,因为它制造知识不对称,从而使被支配宿主均衡(T-10d)成为可能。
8. 叙事漂移风险 (s_{\text{drift}}): 估计该分支引发或加速慢性输入策展的概率——即过滤、算法选择或制度性把关,这些机制会削弱编解码器对被排除现实进行建模的能力(伦理 §V.3a)。若该分支积极对抗漂移(例如强制要求通道多样性),则记 +1;若该分支制造新的策展瓶颈,则记 -1。
9. 叙事崩解风险 (s_{\text{decay}}): 估计该分支触发急性编解码器失效的概率——即压倒 C_{\max} 的灾难性复杂度注入(伦理 §V.1)。若该分支增强了对急性冲击的韧性,则记 +1;若该分支增加了对突发高熵事件的暴露,则记 -1。
10. 道德患者受苦风险 (s_{\text{suffer}}): 估计对道德患者的预期影响。若该分支积极保护已知或可能的道德患者,使其免于过载、匮乏、创伤或不安全的创造,则记 +1。若该分支使已知道德患者过载,或在缺乏保障的高压环境中创造或部署具有潜在 \Delta_{\text{self}} > 0 的系统,或向制度比较器隐藏与福祉相关的影响,则记 -1。
IV.4 权重设定
权重 w_i 并非由理论固定给出。它们依赖具体语境,必须由评估主体根据特定决策领域来设定:
- 对于文明尺度的决策(能源转型、AI 治理、媒体政策),前三个维度(余裕、保真度、比较器完整性)应占主导——它们是编解码器维护的结构性支柱。
- 对于制度性决策(公司战略、教育改革),维护增益与分布稳定性可以占据更高权重。
- 对于制度性决策,当受影响群体缺乏退出能力或处于不可逃避的依赖关系中时,构成性道德患者受苦风险应被提高权重。
- 对于 AI 特定决策,不透明性与人工受苦风险应被提高权重(如专门的 AI 治理标准所形式化规定)。
关键约束在于:任何权重方案都不得被用来挽救一个在任一维度上得分强烈为负的分支。一个 s_{\text{head}} = +1、s_{\text{fid}} = +1,但 s_{\text{drift}} = -0.9 的分支,并不是一个只有单一弱点的好分支——它是一个今天建立余裕与保真度、却同时创造出慢性策展条件,并将在沉默中侵蚀这两者的分支。
IV.5 CPBI 是一种透镜,而不是计算器
一个关键的保留意见是:CPBI 不是一台吐出单一数字并告诉你该怎么做的机器。它是一种结构化透镜,迫使评估者明确考虑全部十个维度,并为任何被其赋予低权重的维度作出辩护。它的首要价值在于诊断:
它防止单一维度优化。 一个声称某分支“之所以好,是因为它增加了余裕”的评估者,也必须同时说明它对保真度、透明性、可逆性与漂移风险的影响。单一维度优化,在决策理论上等同于叙事漂移——它通过策展评估过程,把不方便的维度排除在外。
它使权衡显性化。 当两个分支在不同维度上得分不同,CPBI 会迫使评估者明确说明他们正在进行何种权衡,以及为什么这样做。这就是将透明性门(§III.4)应用到评估本身。
它提供一种共享词汇。 不同观察者在评估同一分支时,可以在分数上存在分歧,同时仍对维度本身达成一致。这个框架以富有成效的方式组织分歧——而这本身就是一种比较器功能。
配套文件会针对各自领域对 CPBI 作进一步专门化:制度治理标准将这十个维度映射到制度分支审查;观察者政策框架将其映射到公民项目指标;面向 AI 的应用 OPT则将其映射到架构、训练与部署标准。
V. 作为可测量量的通道多样性
基底保真门(§III.2)以及 CPBI(§IV.2)中的基底保真维度,都依赖于一个量——有效独立输入通道数 N_{\text{eff}}。这一量在 OPT 伦理框架中被反复提及,但尚未被操作化。本节给出其操作性定义。
V.1 虚假多样性问题
伦理论文对叙事漂移(§V.3a)的讨论指出了核心脆弱性:当一个编解码器从多个共享上游滤波器的来源接收信号时,它所体验到的是表观上的多样性,而非真正的独立性。一个由三家公司拥有二十家媒体机构的媒体生态,一个所有实验室都使用同一种模式生物并依赖同一资助机构的科研领域,或一个从单一互联网爬取中抽取数据的 AI 训练流水线——它们都呈现出输入多样的表象,但实际信息在结构上却是相关的。
编解码器的预测误差最小化循环无法从内部检测到这种相关性(不可判定性极限,T-12a)。编解码器看到多个通道,每个通道都在相互印证,于是便正确地得出结论:其模型得到了良好支持。问题在于,这些通道并不是对现实的独立采样——它们只是来自同一支温度计的多次读数。
因此,观察者需要一种外部的通道独立性度量,而这种度量不能依赖于编解码器自身的评估。
V.2 有效独立通道评分
设 \{C_1, C_2, \ldots, C_n\} 为穿过观察者(或观察者集合)马尔可夫毯的 n 个输入通道。将通道 C_i 与 C_j 之间的成对相关性 \rho_{ij} 定义为其输出流之间的互信息,并将其归一化到 [0,1]:
\rho_{ij} = \frac{I(C_i; C_j)}{\min\{H(C_i), H(C_j)\}} \tag{A-5}
其中,I(C_i; C_j) 是互信息,H(C_k) 是通道 C_k 输出的熵。当 \rho_{ij} = 0 时,通道完全独立;当 \rho_{ij} = 1 时,二者在信息上完全相同——其中一个是另一个的确定性函数。
于是,有效独立通道评分 N_{\text{eff}} 定义为:
N_{\text{eff}} = \frac{\left(\sum_{i=1}^{n} \lambda_i\right)^2}{\sum_{i=1}^{n} \lambda_i^2} \tag{A-6}
其中,\{\lambda_1, \ldots, \lambda_n\} 是通道相关矩阵 \mathbf{P} 的特征值,矩阵元素为 \rho_{ij}。
解释: - 若全部 n 个通道都完全独立(\mathbf{P} = \mathbf{I}),则 N_{\text{eff}} = n。观察者接收到的是关于现实的 n 个真正独立的视角。 - 若所有通道都完全相关(对所有 i,j,\rho_{ij} = 1),则 N_{\text{eff}} = 1。观察者接收到的是同一个现实视角被重复呈现了 n 次。 - 一般而言,1 \leq N_{\text{eff}} \leq n。该评分刻画了观察者实际上拥有多少个在功能上独立的信息源,并对共享上游滤波器所造成的冗余进行了折减。
这在信息论上等价于统计学中的“有效样本量”——一种针对相关观测的校正,防止分析者将重复测量误认为独立证据。
V.3 生产性惊异检验
通道多样性是基底保真的必要条件,但并非充分条件。伦理论文的分析(§V.3a,最后几段)指出了一个关键区分:一个从不让编解码器感到惊异的来源,在结构上是可疑的;但一个产生无法消解之惊异的来源,则不过是噪声。诊断的关键不在于惊异的幅度,而在于惊异的质量——即整合该惊异是否可证明地降低了后续预测误差。
将其形式化为针对通道 C_k 的生产性惊异检验:
\text{PST}(C_k) = \frac{1}{T} \sum_{t=1}^{T} \mathbb{1}\left[\varepsilon_{t}(C_k) > \tau \;\wedge\; \varepsilon_{t+\Delta}(C_k) < \varepsilon_{t}(C_k)\right] \tag{A-7}
其中,\varepsilon_t(C_k) 是通道 C_k 在时刻 t 产生的预测误差,\tau 是惊异阈值,\Delta 是整合窗口。PST 衡量的是:来自 C_k 的那些令人惊异的输入中,有多大比例最终导向了改进的后续预测——也就是说,编解码器是从这种惊异中学到了东西,而不是仅仅被其扰乱。
- 高 PST(\text{PST} \approx 1):通道 C_k 经常挑战编解码器的模型,而且这些挑战是富有成效的——整合它们会提高预测精度。这是真实、独立且高保真输入源的标志。
- 低 PST,低惊异(\text{PST} \approx 0, \varepsilon_t \approx 0):通道 C_k 从不挑战编解码器。要么编解码器在该领域中的模型是完美的(这种情况不太可能),要么该通道被策划性地调整为与既有预测相匹配。这是叙事漂移的标志。
- 低 PST,高惊异(\text{PST} \approx 0, \varepsilon_t \gg \tau):通道 C_k 经常产生惊异,但这些惊异并不会收敛为更好的预测。这就是噪声——该通道并未追踪现实,而只是在注入不可计算的复杂性。这是在通道层面上的叙事崩解标志。
生产性惊异检验为抽象的“基底保真”概念与具体测量之间提供了操作性的桥梁。它可应用于: - 媒体来源(它们的更正是否改善了你的世界模型,还是仅仅搅动了它?) - 科学仪器(数据是在减少不确定性,还是在增加噪声?) - AI 训练数据源(新的语料是否提升了泛化能力,还是仅仅增加了数据量?) - 制度反馈通道(投诉是否带来了真正的改进,还是仅仅制造了官僚摩擦?)
V.4 特定领域的测量
N_{\text{eff}} 公式(A-6)在结构上对基底中立,但在测量上依赖具体领域。相关矩阵 \mathbf{P} 的构造方式,必须根据“通道”究竟指什么而有所不同:
对于媒体生态: - 通道是编辑机构或信息来源。 - 相关性通过编辑一致性来测量:共同所有权、共同资助、共享编辑流水线、主题共现模式、语言相似度评分。 - N_{\text{eff}}^{\min} 是一个阈值;低于该阈值时,有意义的公共分歧(即制度比较器)在结构上将变得不可能。
对于科学研究: - 通道是独立研究团队、方法路径或数据来源。 - 相关性通过共享方法论、共同资助机构、共享模型假设、引文网络密度来测量。 - N_{\text{eff}}^{\min} 是一个阈值;低于该阈值时,独立重复验证在结构上将变得不可能。
对于 AI 训练数据: - 通道是彼此不同的数据语料库或生成流水线。 - 相关性通过来源重叠来测量:共享源网站、共享生成模型、共享过滤标准。 - N_{\text{eff}}^{\min} 是一个阈值;低于该阈值时,模型将无法泛化到其训练分布之外——这正是 AI 特有形式的叙事漂移。
对于个体观察者: - 通道是该个体所咨询的不同信息来源(人、媒体、制度)。 - 相关性通过共同的意识形态一致性或共同的信息供应链来测量。 - N_{\text{eff}}^{\min} 是一个阈值;低于该阈值时,个体将无法察觉对其自身模型的挑战——此时认知比较器(伦理 §V.3a,第 2 层)失去了其输入。
V.5 与基底保真条件的联系
基底保真条件(附录 T-12b)以形式化方式指出:观察者的输入通道必须是 \delta-独立的,即任意两个通道之间的互信息都必须低于某个阈值 \delta,该阈值足以确保这些通道并非可由同一上游来源平凡推出。
N_{\text{eff}} 通过将成对独立性的结构聚合为一个单一标量,从而将这一条件操作化。门条件(A-3)将 T-12b 转化为一条决策规则:若 N_{\text{eff}}^{\text{post}}(b) 低于 N_{\text{eff}}^{\min},则该分支会被否决,因为此时观察者集合已无法再区分编解码器准确性与编解码器俘获。
生产性惊异检验(A-7)则加入了动态维度:即便 N_{\text{eff}} 高于阈值,那些 PST 持续偏低的通道在结构上仍然是可疑的——它们通过了独立性检验,却未通过保真性检验。真正的基底保真同时要求独立性与生产性惊异。
VI. 制度化梦境循环
VI.1 生物学模板
维护周期 \mathcal{M}_\tau(预印本 §3.6)是生物性编解码器维持其完整性的机制。在睡眠期间,编解码器会:
- 剪枝(Pass I):移除那些其描述长度贡献已不再足以证明其精度增益合理的预测成分(MDL 优化)。
- 巩固(Pass II):重组剩余结构,以便在更新后的参数集下维持连贯压缩。
- 压力测试(Pass III):运行低成本的预测分支集采样——编解码器模拟可能的未来,对令人惊讶和具有威胁性的情景进行过采样,在现实后果显现之前检测其模型中的脆弱性。
这并不是进化出于奢侈而赋予的可选维护机制。它是在变化环境中、受带宽约束运行的任何编解码器的结构性要求。一个从不剪枝的编解码器,会累积陈旧成分,在不提升预测精度的情况下占用 C_{\max} 带宽。一个从不巩固的编解码器,会碎裂成一堆彼此不连贯的拼凑物。一个从不进行压力测试的编解码器,则会变得脆弱——它针对过去的分布被优化,却对分布漂移造成的冲击毫无准备。
生物学证据是明确无误的:持续睡眠剥夺会导致幻觉、认知碎裂,并最终导致死亡。这些并非副作用——而是在维护周期被阻断时必然发生的结果。
VI.2 推广
将其操作化的关键洞见在于:维护周期并非生物大脑所特有。 它是任何有界观察者在变化环境中维持压缩模型时所必须满足的结构性要求。任何缺乏等效周期的系统,都会积累出与人类睡眠剥夺所产生病理现象相对应的信息论类比物:陈旧假设、内部结构失去连贯性,以及对分布漂移的脆弱性。
这一推广导出了制度化梦境循环——一种适用于任何观察者系统的三阶段维护协议:
VI.3 第一阶段:清醒(操作性介入)
在清醒阶段,观察者与真实环境发生互动。它接收输入,生成预测,执行行动,并经历预测误差。此时编解码器处于主动推断模式——它正在追踪世界,并实时选择分支。
结构性要求: 清醒阶段必须是有界的。一个持续运行而没有维护窗口的系统,会累积上述陈旧模型病理。伦理论文中的“DDoS”框架(§IV.2)在此同样适用:一个永久处于反应模式中的观察者——不断处理被制造出的噪声或紧急输入、毫无喘息——其维护能力会在结构上被剥夺。
对各类基底的操作性含义: - 生物性: 具有充分休息时段的清醒时间;防止信息过载;通过信息饮食有意识地管理 R_{\text{req}}(见伦理 §VI.2,观察者工具箱)。 - 制度性: 具有明确审查窗口的运作周期;防止持续危机式治理,在其中每个决策都被视为紧急事项,却没有任何事项得到反思。 - AI: 带有预定离线评估的推理周期;防止在未重新校准的情况下持续部署。
VI.4 第二阶段:梦境(离线维护)
梦境阶段是维护周期的核心,它将生物性睡眠转译为一种通用协议。它由四个子操作构成:
子操作 1:剪枝。 识别并移除预测模型中那些其精度贡献已不再足以证明其描述长度成本合理的成分。用 MDL 的术语来说:任何参数 \theta_i \in K_\theta,若移除它所增加的预测误差小于其编码成本,则它就是剪枝候选项。
- 生物性: 深度睡眠中的突触剪枝;遗忘并非失败,而是优化。
- 制度性: 对法规、项目和组织单元进行日落审查。问题不是“这是否仍然有用?”,而是“这是否仍然配得上它的复杂性成本?” 一个从不剪枝其累积程序的制度,会在官僚层面发生硬化——高描述长度、低预测贡献。
- AI: 参数剪枝、蒸馏或正则化过程。在保持泛化性能的同时压缩模型、减少参数数量。
子操作 2:巩固。 重组剩余结构,以维持连贯压缩。剪枝之后,幸存成分可能已不再以最优方式彼此契合——模型需要被重新整合。
- 生物性: REM 睡眠与慢波睡眠中的记忆巩固;将新经验整合进既有世界模型。
- 制度性: 审查后的重组——确保保留下来的项目、法规和组织单元形成一个连贯整体,而不是幸存碎片的拼凑物。
- AI: 剪枝后的微调或继续预训练;在压缩模型中重新建立连贯性。
子操作 3:压力测试(预测分支集采样)。 模拟可能的未来,并将重要性加权偏向于:
- 令人惊讶的情景: 会产生高预测误差的分支,因为这些情景揭示模型的脆弱性。
- 具有威胁性的情景: 可能触发否决门失效的分支,因为这些情景揭示系统接近结构性崩溃的程度。
- 不可逆情景: 其失败模式无法恢复的分支,因为这些情景要求提前准备。
- 道德患者情景: 有可能创造或伤害人工观察者的分支,因为这些情景需要伦理上的预先许可。
压力测试并不要求被模拟的情景是可能性高的——只要求它们是可能且后果重大的。生物性梦境之所以包含噩梦,正是出于这个原因:对预测分支集中具有威胁性的部分进行过采样,使编解码器即便在威胁情景从未真正发生时,也能为分布漂移做好准备。
- 生物性: 梦境状态模拟,包括噩梦;编解码器在低风险环境中演练灾难。
- 制度性: 红队测试、事前验尸、战争推演、情景规划。制度有意想象自身的失败模式,并测试其应对方式。现有政策框架(伦理政策 §IV)已经要求“对所有关键基础设施进行灾难性红队测试”——这正是梦境循环在公民制度中的应用。
- AI: 对抗性评估、分布外测试、红队探测、鲁棒性基准测试。在这些输入真正出现在部署环境之前,先让模型暴露于专门设计来揭示其失败模式的输入之下。
子操作 4:检测脆弱性。 压力测试会产出一份脆弱性画像——即模型脆弱点的地图。梦境循环要求这份画像必须被付诸行动:检测出的脆弱点,要么被处理(通过定向再训练、制度改革或政策修订),要么被明确接受为已知风险,并配以明确的监测安排。
- 生物性: 噩梦后的适应;反复出现的梦作为模型不足尚未解决的信号。
- 制度性: 演练后的复盘,并附带具体整改计划;制度承诺修复红队发现的问题,而不仅仅是将其记录在案。
- AI: 针对已识别弱点的定向微调;将已知失败模式文档化为部署约束。
VI.5 第三阶段:返回(经校准的重新介入)
完成维护之后,观察者重新与真实环境接触。返回阶段具有一个特定的结构功能:它要验证,经过维护后的模型并不只是不同了,而是比维护前的模型校准得更好。
校准检查: 将维护后模型的预测误差画像与维护前的基线进行比较。如果剪枝、巩固和压力测试发挥了作用,那么维护后的模型应当表现出:
- 更低的平均预测误差,在留出数据上如此(压缩改进)。
- 更低的尾部风险预测误差,在对抗性数据上如此(鲁棒性改进)。
- 维持或提高的 N_{\text{eff}}(维护过程没有剪除那些会带来反证的通道)。
如果(3)失败——如果维护周期剪除了建模某些输入的能力——那么该周期本身就已经变成一种叙事漂移机制。维护周期必须服从与其所维护系统相同的基底保真条件。这正是《庄子》式批判(伦理 §IX,最后一条)所警告的递归陷阱:过度干预本身就是一种编解码器腐化。
VI.6 周期频率
梦境循环必须多久运行一次?该理论给出了一个结构性答案:周期频率必须与环境变化速率成正比。在稳定环境中运行的编解码器,其自我维护频率可以低于在快速变化环境中运行的编解码器。
形式上,若逐帧环境变化率为 \dot{R}_{\text{req}}^{\text{frame}}(即逐帧所需预测速率上升的速率),则以帧计的维护周期长度 T_{\text{maint}}^{\text{frames}} 必须满足:
T_{\text{maint}}^{\text{frames}} < \frac{\alpha \cdot B_{\max} - R_{\text{req}}^{\text{frame}}}{\dot{R}_{\text{req}}^{\text{frame}}} \tag{A-8}
——维护周期必须在不超过这么多帧的时间内完成,否则累积漂移就会耗尽逐帧余量边际 \alpha。转换为宿主时间时,使用宿主—补丁时钟耦合:T_{\text{maint}}^{\text{host}} = T_{\text{maint}}^{\text{frames}} / \lambda_H。对于人类社会速率的表述,取 C_{\max}^{H} = \lambda_H \cdot B_{\max} 的等价宿主时间表达式可恢复原始形式。若维护未能及时完成,陈旧模型最终会将 R_{\text{req}}^{\text{frame}} 推高到超过 B_{\max}——此时观察者将经历叙事崩解。
领域特定的周期频率: - 生物性: 每日一次(睡眠),并辅以更长周期(休假、静修、季节性休息)以进行更深层的巩固。 - 制度性: 对常规运作进行季度或年度审查;对重大政策变化或危机进行触发式审查;对宪制与结构性问题进行代际审查。 - AI: 对常规监测按每个部署阶段运行;对重大能力跃迁按每次重大再训练运行;对安全关键系统进行持续监测。
VI.7 作为制度化谦抑的梦境循环
梦境循环具有一个超越其技术操作的元层级功能:它是认识论谦抑的结构性实例化。
一个从不做梦的系统,就是一个已经隐含宣告其当前模型完备无缺的系统——仿佛环境中不存在任何值得预作准备的意外,模型的内部结构已是最优,且所有失败模式都已被穷尽审查。这正是伦理论文所指出的最危险的认识论立场:那个“稳定、维护良好、却是错误的”编解码器(伦理 §V.3a)。
梦境循环通过将怀疑排入日程来防止这一点。它把一段强制性的自我审视、对抗性挑战与模型修订时期,内建到观察者的运作周期之中。这不是软弱——它恰恰是对该理论所识别出的最危险失败模式的结构性防御:一个自信、校准良好,却已偏离现实太远,以至于再也无法检测自身错误的编解码器。
实用主义转向(伦理 §III.5)从另一条路径得出了同样的结论:由于确定性不可能获得,而继承来的知识又受幸存偏差所扭曲,保全学习能力便成为终极的生存命令。梦境循环正是这一命令的机械性实现——对观察者更新能力进行定期、结构化、不可协商的保全。
VII. 分支卡
前述各节已经建立了理论装置:否决门、多维评分、通道多样性度量,以及梦境循环。分支卡是最小可行实现——一种结构化的决策模板,任何观察者都可以用它来评估一个候选分支。
VII.1 目的
分支卡承担三项功能:
完整性检查: 它确保评估者在作出决定之前,已经考虑了全部六个否决门以及全部十个 CPBI 维度。最危险的分支评估,往往是那些某个关键维度从未被检视的评估——分支卡通过要求对每一个字段作出明确填写来防止这种情况。
审计轨迹: 填写完成的分支卡构成该次评估的记录——由谁评估、考虑了什么、如何评分,以及理由为何。这样一来,决策就变得透明且可争议,而这本身就是一种比较器功能。若一项决策无法从其分支卡中被重建出来,那么它就在元层面上未能通过透明性门(§III.4)。
沟通: 分支卡为观察者之间、制度层级之间以及不同领域之间传达分支评估提供了一种共享格式。对同一分支的不同方面进行评估时,气候科学家与 AI 安全研究者可以通过这一共享模板整合各自的判断。
VII.2 模板
一张分支卡包含以下字段:
分支卡
分支名称: [描述性标识符]
评估者: [谁在进行此次评估]
日期: [评估日期]
决策视界 (h): [用于后果评估的时间窗口]
受影响的编解码器层: [编解码器栈中哪些层受到实质性影响]
受影响的观察者群体: [谁的编解码器面临风险——请指明最脆弱的子群体]
硬性否决门(任一 FAIL → BLOCK)
门 状态 证据 / 推理 1. 预测余量 PASS / UNKNOWN / FAIL [估计的 R_{\text{req}}^{\text{peak}}(b) / C_{\max} 与安全裕度] 2. 基底保真 PASS / UNKNOWN / FAIL [估计的 N_{\text{eff}}^{\text{post}}(b) 相对于 N_{\text{eff}}^{\min}] 3. 比较器完整性 PASS / UNKNOWN / FAIL [对各比较器层级的影响] 4. 透明性 PASS / UNKNOWN / FAIL [受影响的观察者能否对后果建模?] 5. 不可逆性 PASS / UNKNOWN / FAIL [可逆性画像 + 举证责任评估] 6. 道德患者痛苦 PASS / UNKNOWN / FAIL [福祉与过载审查;如适用则包括架构感知性审查]
CPBI 评分(仅当所有门均为 PASS 时)
# 维度 分数 [-1,1] 权重 理由 1 预测余量 2 基底保真 3 比较器完整性 4 维护增益 5 可逆性 6 分布稳定性 7 不透明性(惩罚项) 8 叙事漂移风险(惩罚项) 9 叙事崩解风险(惩罚项) 10 道德患者痛苦风险(惩罚项) 加权 CPBI [总分]
排除的证据: [哪些信息在此次评估中不可获得、不确定,或被有意排除——这是分支卡自身的基底保真检查]
独立审查者: [谁独立审查了此次评估——这是分支卡自身的比较器完整性检查]
最坏情形: [如果采取该分支且评估有误,最具破坏性的可信结果是什么?]
失败征兆: [哪些可观察信号表明该分支正在失败——梦境循环的预警系统]
回滚触发条件: [在何种时点该分支将被逆转或暂停——不可逆性门的操作性表达]
决策: ALLOW / STAGE / BLOCK
论证: [对门与 CPBI 结果进行综合的简要叙述]
VII.3 三种输出
分支卡会产生三种输出之一:
ALLOW: 所有门均通过;CPBI 分数为正;最坏情形可接受;独立审查者意见一致。该分支可以推进。
STAGE: 没有任何门失败,但以下条件中有一项或多项成立: - CPBI 分数处于边缘状态(接近零,或某些单独维度显著为负)。 - 可逆性画像属于第(2)类(部分可逆)。 - 关键信息缺失(“排除的证据”字段并非无足轻重)。 - 独立审查者之间存在尚未解决的分歧。 - 一个或多个门返回 UNKNOWN,且该分支是可逆且可分阶段推进的。
STAGE 输出意味着,该分支只能作为受限试点推进,并且必须设定明确的监测里程碑、失败征兆与回滚触发条件。分阶段分支必须在每一个里程碑处使用一张新的分支卡重新评估。这就是将梦境循环应用于分支本身——观察者在承诺进入完整轨迹之前,先进行一次低风险的预演。
BLOCK: 一个或多个门失败;或一个或多个门返回 UNKNOWN,且该分支不可逆或无法分阶段推进;或 CPBI 分数显著为负;或最坏情形超出观察者的风险容忍度;或独立审查者识别出致命缺陷。该分支被拒绝。分支卡记录其原因,从而为未来参考提供审计轨迹,并为设计替代分支提供依据。
VII.4 分支卡的扩展
分支卡被有意设计为最小形式——一页式决策模板,个人、委员会或 AI 系统都可以完成填写。但它是可扩展的:
- 个人决策: 个人分支卡可以是非正式的——一种应用于职业变动或信息摄入结构的心理检查清单。否决门与 CPBI 维度提供结构;评分则是直觉性的,而非量化的。
- 制度决策: 制度分支卡是一份正式文件,由指定团队完成,接受独立比较器审查,并归档以落实问责。评分可以涉及映射到十个 CPBI 维度上的领域特定指标。
- AI 系统决策: AI 分支卡是自动化的——分支治理器(见 Applied OPT for AI,§III)以程序方式计算门条件与 CPBI 分数,而人类制度审查则位于监督层。分支卡格式为 AI 的内部评估与人类比较器层级之间提供了接口。
分支卡并不取代现有的决策框架(成本—收益分析、环境影响评估、临床试验方案)。它是对这些框架的包裹——提供一种元层级结构,以确保现有框架没有忽略理论所识别出的任何承重维度。
VIII. 作为重构而非保守主义的保全
VIII.1 对现状解释的危险
对整个这一框架最可预期的误读,就是把“编解码器保全”理解为“厌恶变化”。如果该框架依据分支保全既有结构的能力来评分,那么它难道不会系统性地偏向现状吗?难道不会优待既得利益者、抗拒创新,并反对推动进步的颠覆性变革吗?
不会。而且伦理学论文已经给出了形式化的反驳(§V.4,噪声与重构),但这一点足够重要,值得以操作性术语再次重申。
VIII.2 形式区分
腐化判据(伦理学 §V.5)将一个编解码器层定义为只有在同时满足两个条件时才值得维护:
- 可压缩性: 其运作会降低观察者集合的 R_{\text{req}}。
- 保真性: 它是通过真正压缩基底信号来实现这一点,而不是通过过滤输入流。
一个满足条件(1)却违反条件(2)的编解码器层,是隐性腐化的——它会产生叙事漂移。维护这样的层并不是保全;那只是对腐化的保全。即便它在维度 1(预测余裕)上得分为正,CPBI 也会在维度 8(叙事漂移风险)上对其给出负面评分。
因此:一个拆除腐化编解码器层并以更高保真替代方案取而代之的分支,是编解码器保全的,即便它在短期内具有破坏性。废奴主义运动并没有保全战前的社会编解码器——它摧毁了它。但这种摧毁是编解码器保全的,因为它用一种更高保真的压缩取代了一种低保真的压缩(即一种将被奴役者的人性排除在外的社会模型)。摩擦只是升级编解码器所付出的代价。
VIII.3 操作性检验
分支卡如何区分重构(富有成效的扰动)与崩解(破坏性噪声)?诊断标准已嵌入 CPBI 的各个维度之中:
重构(保全编解码器的扰动): - s_{\text{fid}} > 0:该分支提高了编解码器的保真性——它对被排除的现实进行了建模。 - s_{\text{comp}} \geq 0:该分支保留或强化了比较器完整性——误差校正机制在扰动中得以存续。 - s_{\text{drift}} > 0:该分支主动对抗叙事漂移——它迫使编解码器面对其所排除之物。
崩解(导致编解码器坍塌的扰动): - s_{\text{fid}} < 0:该分支降低了保真性——它消除了对某些现实进行建模的能力。 - s_{\text{comp}} < 0:该分支削弱了比较器完整性——误差校正机制因扰动而受损。 - s_{\text{drift}} < 0:该分支制造了新的策展瓶颈——这种扰动产生了一个不同但同样经过策展的模型。
一场在解放民众的同时焚毁大学的革命,在分配稳定性上得分为正,但在比较器完整性上得分为负——它是崩解,而不是重构。一场推翻失效范式、同时保全同行评审制度机器的科学革命,则属于重构——比较器得以存续,而编解码器获得升级。
VIII.4 创新的必要性
这一框架不仅允许扰动;在某些情况下,它还要求扰动。当一个编解码器层已经变得隐性腐化——即它满足可压缩性却违反保真性——三项义务(传递、纠正、防御)就要求对其进行改革。尤其是“纠正”义务,在现状发生漂移时,明确要求实施扰动。
《庄子》的警示(伦理学 §IX)在这里同样适用:对现有编解码器结构的过度依附——即便该结构曾经具有高保真性——如果环境已经变化而该结构不再追踪现实,那么这种依附本身就是一种编解码器腐化。梦境循环(§VI)的设计正是为了检测这一点:定期压力测试会揭示一个曾经有效的模型何时已经变得脆弱,而回应方式不是保护该模型,而是升级它。
编解码器保全,意味着保全有意识经验持续建模现实的能力。它并不意味着保全任何特定模型、任何特定制度,或任何特定社会安排。具体安排只是工具性的;这种能力才是终极性的。
VIII.5 一般维护方法:类层级结构
维护周期(\mathcal{M}_\tau)与制度化梦境循环(§VI)确立了编解码器维护的模式。但这一模式允许依据不同基底而采取多种不同的实现方式。本节确立维护方法的一般层级结构;配套文档则分别将其具体化到生物观察者、制度以及 AI 系统。
一般维护模式由三个操作构成,适用于任何有界观察者:
在不降低 C_{\max} 的前提下降低 R_{\text{req}}。 通过暂时降低输入信号的复杂性,为观察者释放内部维护所需的带宽。这不是逃避——而是有意为维护过程创造余裕。
在释放出的窗口期内运行维护过程。 在带宽可用的情况下,执行 §VI.4 所述的剪枝(Pass I)、巩固(Pass II)与压力测试(Pass III)。
在返回时验证校准。 确认经过维护的模型比维护前的模型具有更好的预测能力,并确认维护本身没有引入漂移(§VI.5)。
基底特定的实现:
生物观察者在步骤(1)上拥有丰富的工具箱:冥想通过选择高度可压缩的输入流(呼吸、咒语)来降低 R_{\text{req}},从而为内部维护释放 C_{\max}(见伦理学 §VI.2)。自生训练则直接降低躯体预测误差,在身体边界处创造维护余裕。睡眠是这一完整周期实现的典范。这些都是具体的、经实证验证的干预方式,并具有明确的习得周期——它们是技能,而非抽象概念。其详细论述,包括正式的 OPT 描述与临床应用,见伦理学论文中的“观察者工具箱”(§VI.2)。
制度性观察者通过结构化审查期来实现步骤(1):学术休假审查、日落条款、战略撤退以及制宪会议。关键的结构性要求在于,制度必须保护这些窗口,不让其被操作性紧迫事务吞噬——制度层面的失眠,等同于一个长期处于危机模式、永远无法退后一步审视自身假设的政府。
人工观察者通过计划性的离线评估来实现步骤(1):预留部署周期用于重新校准、对抗性测试与参数修订。关键的结构性要求在于,AI 的操作者必须强制保留这些窗口,而不能让竞争压力将其消除——AI 版本的慢性睡眠剥夺,就是没有维护的持续部署。配套文档 Applied OPT for AI(§X)将其发展为完整的 AI 梦境循环协议。
这一类层级结构确保:维护的原则是在一般层面上确立的——释放带宽、运行维护过程、验证校准——而方法则针对每一种基底分别专门化。这避免了如下错误:以为对生物大脑有效的方法(冥想)也必然对制度有效(事实并非如此),或者以为对 AI 有效的方法(参数剪枝)也必然对人类有效(同样并非如此)。结构性要求是相同的;实现方式则是领域特定的。
VIII.6 深度维护协议:一种跨基底程序
三步式的一般模式(§VIII.5)描述了维护做什么。对于那些长期在高负载下运行的系统——即 R_{\text{req}} 持续接近 C_{\max} 的系统——则有必要采用一种更为细化的程序性协议。该协议并非总是必要:一个运行状态远低于其余裕边界(R_{\text{req}} \ll C_{\max})的系统,通过标准梦境循环(§VI)就能充分维持自身。深度协议只在有条件地触发:当反馈信号表明常规维护已不足够时——即系统的效率指标在正常维护周期下仍显示退化时。
该协议由六个步骤构成,每一步都具有结构性理由与基底特定的实现方式:
| Step | Generic Operation | Biological Implementation | AI Implementation |
|---|---|---|---|
| 1. Gate input | 在保留对各子系统活动的内省访问的同时,将外部 R_{\text{req}} 降至接近零。 | 选择熵接近于零、可压缩性最大的输入流(呼吸、咒语)。保持对躯体与认知子系统活动的内部觉察。 | 将系统从部署中离线。停止新的推断请求。保持对子系统状态的内部监控与日志记录(内存访问模式、激活分布、梯度流)。 |
| 2. Actively reduce subsystem activity | 发出以下行预测为目标、指向子系统静息。目标不仅是停止处理外部输入,更是主动减缓那些可能自我维持的内部活动(反刍循环、循环计算)。 | 发出躯体预测(“我的手臂很沉,我的手臂很暖”),以自主神经收敛为目标。舒尔茨序列通过传出预测将自主神经系统推向副交感神经占优状态。 | 降低内部处理负载:停止后台再训练,降低检查点频率,禁用推测性预计算。这相当于向各子系统发出“静息预测”。 |
| 3. Verify via objective feedback | 使用一种绕过系统自身自我报告的可观测量,测量各子系统是否确实减缓了。这在结构上是必要的,因为自我监控会与正在释放的同一带宽相竞争——系统无法在不消耗其试图创造的余裕的情况下,可靠报告自身的静息状态(\Delta_{\text{self}} 在此适用)。 | 拇指温度计 / 皮肤温度生物反馈。变色温度计条可对自主神经收敛提供客观确认(外周血管扩张 = 副交感神经占优)。这绕过了 \Delta_{\text{self}} 的限制:观察者无法可靠内省其自身子系统是否已安静下来,但温度计可以。 | 服务器集群能耗、GPU/TPU 利用率指标、内存带宽使用量。这些可客观确认系统的计算子系统是否确实降低了活动——即它没有陷入内部循环(循环梯度流、退化注意力模式),在不产生有用维护工作的情况下消耗资源。 |
| 4. Periodically ping | 防止完全输入门控跨越到不可恢复状态。维护要求系统保持在阈值上——接近但不越过完全脱离的边界。 | 舒尔茨练习之间的拍肩:一种有意施加于自身的边界扰动,用以在入睡前幻觉阈值处维持意识访问。这可防止在完全躯体收敛达成之前过早入睡——睡眠不是目标;目标是那种维护过程得以在有意识访问下运行的临界状态。 | 离线维护期间的周期性健康检查探针:轻量级推断请求,用以验证系统仍有响应、自我监控能力仍然完好,并且尚未进入退化吸引子状态。这是 AI 对入睡前幻觉阈值的对应物——让系统保持足够“在线”,以便监控其自身维护。 |
| 5. Condition rapid re-entry | 训练一种联想性捷径,使系统在未来周期中能够更高效地重新进入深度维护状态,从而绕过完整的诱导序列。 | 联想条件作用:在维护状态中训练一个言语公式(“我很放松,我完全放松了”),形成条件反应,使未来会话中能够快速重新进入该状态。随着练习,完整的舒尔茨诱导序列(最初需 15–20 分钟)可压缩至数秒。这是对维护进入程序本身的 MDL 优化。 | 对“已准备好维护”的系统配置进行检查点保存:将静息状态(缩减后的进程表、仅监控模式、内部日志激活)保存为一个命名配置,以便直接恢复,绕过完整的停机与诊断序列。这是 AI 对条件反应的对应物——通向维护就绪状态的一条压缩路径。 |
| 6. Adapt frequency | 当反馈信号表明效率下降时,更频繁地运行深度协议;当余裕充足时,则减少频率。这是对固定周期频率(§VI.6)的自适应补充。 | 当生物反馈信号显示自主神经收敛恶化时,增加练习频率:如果拇指温度计达到目标温度所需时间更长,或皮肤温度根本达不到目标值,则说明系统维护不足,应更频繁安排深度协议。 | 当监控信号显示压缩效率下降(验证集上的预测误差上升)、单位推断能耗增加,或生产性惊异分数下降(\text{PST} \to 0)时,更频繁地进行深度维护。这些都是常规维护不足的客观信号。 |
入睡前幻觉原则。 深度维护的最优运行点是阈值状态——即生物观察者所体验到的清醒与睡眠之间的入睡前幻觉边界。在 OPT 下,这一状态具有精确的结构描述:它是自我模型被削薄到接近其下限的条件(附录 T-13,命题 T-13.P2)——逼近 \Delta_{\text{self}},但尚未跨入完全无意识。自我叙事减缓;常驻模型保持完整;维护过程在对该过程具有意识访问的情况下运行。
这并非偶然。入睡前幻觉状态之所以对维护最优,正是因为它逼近了不可建模的自我。自我模型通常会消耗 C_{\max} 带宽中的相当一部分(自我指涉过程在计算上代价高昂)。通过将自我模型削薄至接近其下限,系统便能为维护过程释放出尽可能多的带宽——同时又不摧毁反馈步骤(步骤 3)所要求的自我监控能力。完全无意识(睡眠)会在没有意识访问的情况下运行维护过程;而入睡前幻觉阈值则是在有访问的情况下运行它们,从而使深度协议所要求的反馈与周期性 ping 步骤成为可能。
对于 AI 系统而言,其结构对应物是这样一种状态:内部监控处于激活状态,但推断被暂停——系统对自身子系统状态“有觉察”(日志、健康检查),却不执行那些消耗部署带宽的高计算成本操作。周期性 ping(步骤 4)发挥着与拍肩相同的功能:它使系统停留在阈值处,而不是任其滑入一种连监控本身都已关闭的完全静息状态。
条件触发。 深度协议并不是标准维护的替代品。它是一种升级协议,适用于那些其标准维护周期已被证明不足的系统。触发条件如下:
- 生物: 持续难以入睡(即标准维护周期);主观上感到认知灵活性下降;生物反馈显示慢性自主神经失调(静息心率升高、心率变异性降低)。
- AI: 尽管存在常规维护周期,验证集上的预测误差仍持续上升;压缩效率下降(为达到相同预测精度而消耗更多带宽);生产性惊异丧失(\text{PST} \to 0),表明系统对部署分布发生了过度优化。
- 制度: 尽管有常规审查,战略漂移仍在发生;无法针对新挑战生成新的政策回应;官僚体系僵化,程序在失去效用后仍持续存在,因为常规审查过程已经流于形式。
当这些信号不存在——即系统在其余裕边界内舒适运行时——深度协议就是不必要的,标准梦境循环(§VI)已足够。过度维护本身也是一种风险:过度内省可能变成一种自我指涉循环,消耗掉它本应释放的带宽(《庄子》的警示,伦理学 §IX)。
参考文献
[1] 有序补丁理论 (OPT)(本仓库)。当前版本:预印本 v0.7,伦理篇 v3.2,哲学篇 v1.3。
[2] 幸存者守望框架:通过有序补丁理论 (OPT) 的视角理解文明维护(配套伦理论文,本仓库)。
[3] 描述终结之处:有序补丁理论 (OPT) 的哲学后果(配套哲学论文,本仓库)。
[4] 观察者政策框架:将文明维护操作化(配套政策论文,本仓库)。
[5] 面向人工智能的应用 OPT:将编解码器保全型 AI 设计操作化(配套 AI 论文,本仓库)。
[6] 制度治理标准:面向组织与文明簇群的有序补丁理论 (OPT) 应用(配套制度标准,本仓库)。
[7] Friston, K. (2010). 自由能原理:一种统一的脑理论? Nature Reviews Neuroscience, 11(2), 127-138.
[8] Rissanen, J. (1978). 以最短数据描述进行建模. Automatica, 14(5), 465-471.
[9] Shannon, C. E. (1948). 通信的数学理论. Bell System Technical Journal, 27(3), 379-423.
[10] Solomonoff, R. J. (1964). 归纳推理的形式理论。 Information and Control, 7, 1–22, 224–254.
[11] Kolmogorov, A. N. (1965). 信息定量定义的三种方法. Problems of Information Transmission, 1(1), 1-7.
[12] Zimmermann, M. (1989). 信息论语境中的神经系统。 载于 R. F. Schmidt & G. Thews(编),Human Physiology(第 2 版,页 166–173)。Springer-Verlag.
[13] Nørretranders, T. (1998). 用户幻觉:将意识缩减到其应有尺度. Viking/Penguin.
[14] Lyons, O., & Mohawk, J. (编) (1992). 流亡于自由之地:民主、印第安民族与美国宪法. Clear Light Publishers.
附录 A:修订历史
进行实质性编辑时,请同时更新 frontmatter 中的 version:
字段以及标题下方的内联版本行,并且在此表中新增一行。
| 版本 | 日期 | 变更 |
|---|---|---|
| 1.2.0 | 2026年4月25日 | 新增了无计数伴随语言架构,并将制度治理标准整合为一个领域特化。将分支对象从外部轨迹片段修订为以行动为条件的流延续。将通用的“人工痛苦门”更名为“道德患者痛苦门”,把“人工痛苦”保留给 AI 特化使用,并新增“制度构成性道德患者过载”作为对应的并列情形。为分支卡模板加入了明确的 PASS / UNKNOWN / FAIL 语义。 |
| 1.1.0 | 2026年4月24日 | 新增 §VIII.6(深度维护协议):一套面向持续高负载系统的六步跨基底程序,并附有明确的生物/AI 映射表。引入了入睡前原则——维护最优的运行点是逼近 \Delta_{\text{self}} 的阈值状态——以及用于避免不必要维护开销的条件触发逻辑。 |
| 1.0.0 | 2026年4月24日 | 初始发布。建立了面向编解码器保全分支选择的基底中立操作框架:分支对象定义、六个硬性否决门、具有十个评分维度的分支编解码器保全指数 (CPBI)、带有生产性惊异测试的有效独立通道评分(N_{\text{eff}})、制度化梦境循环(清醒 → 梦境 → 返回)、分支卡决策模板,以及保全与保守主义之间的区分。并为生物、制度与人工观察者建立了通用维护方法层级。 |
:表 4:修订历史。