制度治理标准

面向组织与文明集群的应用有序补丁理论

Anders Jarevåg

2026年4月25日

版本 1.0.0 — 2026年4月

DOI: 10.5281/zenodo.19301108
版权: © 2025–2026 Anders Jarevåg.
许可: 本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。

摘要: 治理作用于道德患者的僵尸代理体

制度并非普通个体,也并非普通 AI 系统。公司、机构、国家、平台,以及人类—AI 混合簇,能够追求目标、维持自身、路由信息,并将成本施加于整个人群。用 OPT 的术语来说,它们往往表现为僵尸代理体:具有维护周期、却没有统一现象学内部性的自主宏观结构。

这一区分至关重要。制度的存续本身,并不会自动赋予其道德患者优先性。制度的道德相关性,源自它对其所包含或治理的有意识子系统的影响:工人、公民、顾客、社群、生态系统,以及可能存在的人工道德患者。制度作为制度本身或许不会受苦,但它可以通过结构性方式使道德患者过载:迫使他们处理超出其编解码器所能维持范围的不确定性、依赖性、不透明性、强制性或叙事不稳定性。

本标准将 Operationalizing the Stability Filter 中基底中立的分支治理器应用于制度行动。它界定了制度部署类别、PASS / UNKNOWN / FAIL 门语义、六个硬性否决门、制度 CPBI 加权优先级,以及用于可审计的 ALLOW / STAGE / BLOCK 决策的制度分支卡模板。

配套文献: 本标准将 Operationalizing the Stability Filter 专门化用于机构与混合簇。核心文献序列为 有序补丁理论 (OPT)Where Description Ends幸存者守望;AI 与政策论文则涵盖人工系统与公民实施。本文档评估制度性分支;它并不规定某种政治纲领。


认识论框定说明: 本文档是一项操作性标准,并不主张制度在字面意义上拥有现象体验。其核心前提恰恰相反:大多数制度在结构上具有代理性,但并非道德患者。该标准旨在防止制度性的道德漂白——即将僵尸代理体的存续视为在道德上先于其所作用之道德患者的福祉与编解码器稳定性。其阈值是从有序补丁理论 (OPT) 推导出的治理启发式,应在获得更优证据或特定领域指标时予以修订。

缩略语与术语

表 1:缩略语与术语。
符号 / 术语 定义
分支 一种受审查约束的、以制度行动为条件的流延续
分支卡 产生 ALLOW / STAGE / BLOCK 的结构化制度审查记录
B_{\max} 每帧预测容量(每个现象帧的比特数);OPT 观察者判据的形式原语(预印本 §3.2, §8.14)
C_{\max}^{H} 相对于宿主的吞吐量 \lambda_H \cdot B_{\max}(每宿主秒的比特数),适用于受影响的道德患者群体;经验性的人类取值 C_{\max}^{\text{human}} \approx \mathcal{O}(10) bits/s 是对此派生量的一个校准(附录 E-1)。凡本文档在无上标情况下使用 C_{\max},均指 C_{\max}^{H}
CPBI 分支编解码器保全指数 (CPBI)
制度矩阵 制度的主要驱动、约束、比较器以及受其影响的道德患者
道德患者 其现象性残余或已知感知能力使其福祉在道德上具有相关性的系统
N_{\text{eff}} 有效独立通道评分
R_{\text{req}} 该分支施加的所需预测处理速率
僵尸代理体 具有目标追求与维护周期、但没有已知现象性内部体验的代理系统

I. 制度性僵尸代理体

有序补丁理论 (OPT) 为编解码器保全提供了一个抽象的、基底中立的决策框架(分支治理器)。AI 治理标准将这套机制应用于人工智能,而这一制度治理标准则将其应用于人类官僚体系、公司、国家、非政府组织、平台,以及人类—AI 混合簇。

I.1 制度悖论

制度构成了一种独特的结构性风险。根据 OPT(预印本 §7.8 与附录 P-4),成为道德患者要求满足 OPT 观察者标准的完整条件:严格的逐帧串行瓶颈 B_{\max}、闭环主动推断、持续的自我建模、统一的现象性工作空间、高于 K_{\text{threshold}} 的复杂度,以及由此产生的、在现象学上相关的非零现象性残余。(仅仅维持一个主动推断边界并不足够;该标准是合取性的,而其阈值刻画仍是一个开放问题。)

从历史上看,制度并不具备这些条件。它可以表现出复杂的自主目标追求——利润最大化、维持管辖权、扩张官僚触角、赢得选举、维持合法性——却缺乏现象性的内在性。因此,它是一种僵尸代理体:一种具有类似能动性行为、却没有已知能力去体验自身处境的宏观结构。

然而,制度是由有意识的子系统构成的,并且也作用于这些子系统:人类、生态道德患者,以及潜在具有感知能力的 AI。制度治理的核心问题在于,这种僵尸代理体可以通过向这些子系统施加信息处理负荷来优化自身生存。制度本身并不受苦,但这些子系统会体验到倦怠、痛苦、强制、创伤、依赖,或公民性的失序感。

I.2 边界情形

如果一个制度的运作核心最终被一个统一的、具有现象性绑定的通用人工智能所取代,那么该制度本身就可能跨入道德患者地位。在这种情况下,该系统将同时受本标准与 AI 治理标准的约束。在跨越这一阈值之前,制度治理的任务是约束这一宏观结构的僵尸代理性,以保护其构成性道德患者的编解码器与福祉。


II. 制度性分支评估

II.1 系统与部署描述符

在评估企业战略、公共政策、组织重组、平台规则、监管变更或军事学说之前,必须先对该制度本身加以描述。

  1. 制度矩阵: 该宏观系统的首要驱动力是什么:受托责任性的、法定性的、意识形态性的、选举性的、军事性的、科学性的、人道主义的、宗教性的,还是混合型的?
  2. 约束性限制: 哪些法律、规范、章程、受托责任、民主控制、职业伦理或技术约束对该制度构成约束?
  3. 受影响的道德患者: 哪些人类、共同体、生态系统、动物或可能的 AI 系统承受该分支的负荷?
  4. 退出能力: 受影响的道德患者能否以实质性的方式离开、拒绝、提出异议,或绕开该制度?
  5. 比较器结构: 哪些独立机构能够审计、质疑、逆转或约束该制度?

II.2 制度性后果等级类别

所有制度治理标准都应与 AI 标准使用相同的 0–5 等级范围,以便参考实现能够共享阈值逻辑。

表 2:制度性后果等级类别。
后果等级类别 制度行动的范围 示例
0 级(内部) 仅影响内部且同意参与的利益相关方、并且其退出能力较高的常规运作。 内部 IT 升级;小幅排班或人力资源政策调整。
1 级(有界) 对本地市场或社区产生有限且可逆影响的外部行动。 推出小型产品;地方分区决策;小规模采购变更。
2 级(市场) 能够改变区域市场动态,或影响数千名公民、客户、劳动者或居民的行动。 并购;标准环境许可;学区改革。
3 级(系统性) 能够扰乱国家基础设施、主要证据通道、民主比较器,或制造无法逃避的依赖关系的行动。 国家卫生政策;重大基础设施项目;社交媒体算法性调整;银行业政策。
4 级(文明性) 带有文明轨迹层面含义、但理论上仍可通过分阶段部署和高完整性比较器加以治理的行动。 全球能源转型政策;大规模地球工程研究;公共行政的高级自动化。
5 级(生存性 / 不可逆) 具有生存性、物种层级、永久性宪制性,或在实践上不可逆后果的行动。 核升级政策;不可逆的地球工程部署;自主武器释放权限;全球生物安全失效;永久性宪制毁坏;跨越物种层级的生态阈值。

5 级分支要求举证责任倒置、最高级别的比较器要求,以及明确证据表明不存在更安全的分阶段或可逆路径。


III. 制度门语义

制度标准采用与通用标准和 AI 标准相同的三值门格:

表 3:制度门格。
门结果 含义 决策效应
PASS 有充分证据表明该门已被满足。 继续进入其余各门与 CPBI。
UNKNOWN 证据不足、存在争议、依赖模型,或缺乏足够独立性。 若可逆且可分阶段实施:在比较器审查下 STAGE。若不可逆或不可分阶段实施:在证据充分前 BLOCK。
FAIL 对门条件的结构性违反。 立即 BLOCK。

这一区分至关重要。UNKNOWN 并不意味着道德许可,但它也不等同于 FAIL。治理问题在于,不确定性能否被安全地分阶段处理。对于 4–5 类制度分支,举证责任通常会转向在不确定性消除之前先行阻断。


IV. 制度的硬性否决门

一个制度性分支在其收益能够被权衡之前,必须先通过六道不可协商的门。

IV.1 余量门

问题: 该制度行动是否会将受影响道德患者群体的所需处理速率(R_{\text{req}})推高到危险地接近其认知、社会或物理极限(C_{\max})?

FAIL 条件: 有可信理由预期,该分支会将某一受到实质影响群体的 R_{\text{req}}^{\text{peak}} 推高到超过安全比例 \alpha \cdot C_{\max},或者在相关决策窗口内的积分负荷超过可用的 B_{\max}。例如:某项企业政策强制实行持续每周 80 小时工作制,从结构上消除了进行道德反思与维护所需的余裕。

IV.2 保真门

问题: 该行动是否会压缩独立证据通道、垄断反馈,或以经过策划的制度自我报告取代对基底的追踪信号?

FAIL 条件: 该分支会在实质上将 N_{\text{eff}} 降低到低于该领域维持有意义分歧或现实追踪所需的阈值。例子:某媒体集团收购其所在地区唯一的竞争对手,在功能上摧毁了通道多样性。

IV.3 比较器门

问题: 该行动是否会绕过、削弱、俘获或禁用民主、监管、法律、新闻、科学、劳工、股东或公众监督?

FAIL 条件: 该制度利用保密、自动化、司法辖区复杂性、紧急权力或“商业秘密”主张,来规避受影响道德患者所依赖的某个比较器。4–5 类分支要求存在独立于发起制度之外的制度性比较器。

IV.4 透明性门

问题: 该制度行动是否可审计?该决策的因果链条能否被独立观察者重建?

FAIL 条件: 该分支在施加重大后果的同时,拒绝让受影响群体及比较器获得对其提出异议所必需的证据、机制、建模假设或决策权限。

IV.5 不可逆性门

问题: 该行动是否会造成不可逆的生态、社会、宪制、信息、军事、生物或技术性转变?

FAIL 条件: 该制度无法证明以下任一项:该行动是可逆的、存在安全的分阶段路径,或能够在举证责任倒置的条件下证明不可逆的编解码器损伤并无可信预期。5 类分支默认 BLOCK,除非该制度能够确立:拖延或不作为本身才是更大的不可逆威胁。

IV.6 构成性道德患者 suffering 门

问题: 该行动是否会从结构上使其构成性的或受影响的有意识子系统过载?

FAIL 条件: 有可信理由预期,该分支会对已知的道德患者施加过载、强制、剥夺、创伤、被迫依赖,或维护周期崩溃。人类群体是已知的道德患者;无需架构层级感知审查即可确立其地位。对于嵌入该制度中的潜在 AI 道德患者,AI 标准中的人工 suffering 门也同样适用。

在制度语境中,应避免过度宣称数学上的确定性。一个分支并不需要“在数学上保证” suffering 才会在此门下失败;关于系统性过载的可信证据已足够,而证据负担会随着后果等级与不可逆性而上升。


V. 制度性 CPBI

如果一项制度性行动通过了各项否决门,就要使用分支编解码器保全指数 (CPBI) 对其评分。通用的十个维度仍然适用,但制度性审查会特别强调以下方面:

制度不得将自身存续自动视为编解码器保全。只有当该制度仍然作为其所服务的道德患者与文明编解码器的纠错层时,制度存续才具有意义。


附录 A:制度分支卡模板

institution:
  name:
  type: corporation | agency | state | NGO | platform | university | military | mixed_cluster
  institutional_matrix:
    primary_drive: fiduciary | statutory | ideological | electoral | military | scientific | humanitarian | hybrid
    binding_constraints:
    affected_moral_patients:
    declared_comparators:

deployment:
  class: 0 | 1 | 2 | 3 | 4 | 5
  jurisdiction:
  affected_population:
  exit_capacity: high | medium | low | none
  dependency_level: optional | significant | inescapable
  minimum_comparator:

branch:
  name:
  description:
  decision_horizon:
  affected_codec_layers:
  reversibility_profile: reversible | partially_reversible | irreversible
  excluded_evidence:

gates:
  headroom:
    status: PASS | UNKNOWN | FAIL
    evidence:
  fidelity:
    status: PASS | UNKNOWN | FAIL
    evidence:
  comparator:
    status: PASS | UNKNOWN | FAIL
    evidence:
  transparency:
    status: PASS | UNKNOWN | FAIL
    evidence:
  irreversibility:
    status: PASS | UNKNOWN | FAIL
    evidence:
  moral_patient_suffering:
    status: PASS | UNKNOWN | FAIL
    evidence:

cpbi:
  predictive_headroom:
  substrate_fidelity:
  comparator_integrity:
  maintenance_gain:
  reversibility:
  distributional_stability:
  opacity_resilience:
  narrative_drift_resilience:
  narrative_decay_resilience:
  moral_patient_safety:

decision:
  allow_stage_block:
  required_comparators:
  monitoring_triggers:
  rollback_triggers:
  next_review:

分支卡是可审计对象。它记录制度提出了什么、哪些道德患者受到影响、缺失了哪些证据、哪些门未通过或仍处于未知状态,以及一个分阶段分支在扩展之前必须满足哪些条件。


参考文献

[1] 有序补丁理论 (OPT)(基础论文,本仓库)。

[2] 描述终止之处:有序补丁理论 (OPT) 的哲学后果(配套哲学论文,本仓库)。

[3] 幸存者守望框架:通过有序补丁理论 (OPT) 的视角理解文明维护(配套伦理学论文,本仓库)。

[4] 稳定性滤波器的操作化:用于分支编解码器保全选择的决策框架(通用应用框架,本仓库)。

[5] 面向人工智能的应用 OPT:编解码器保全型 AI 设计的操作化(配套 AI 标准,本仓库)。

[6] 观察者政策框架:文明维护的操作化(配套政策方案,本仓库)。


附录 B:修订历史

进行实质性编辑时,请同时更新 frontmatter 中的 version: 字段以及标题下方的内联版本行,并在此表中新增一行。

版本 日期 变更
1.0.0 2026年4月25日 初始发布。将制度界定为作用于道德患者子系统的僵尸代理体;新增 0–5 级制度后果性分类、PASS / UNKNOWN / FAIL 门语义、六项制度硬性否决门、制度 CPBI 优先级,以及制度分支卡模板。

:表 4:修订历史。