秩序パッチ理論
付録 T-12: 基体忠実性と緩慢な腐敗
2026年4月17日 | DOI: 10.5281/zenodo.19300777
元の課題(第8.3節、限界9より): 「慢性的腐敗の故障モードを形式化すること――すなわち、コーデックが一貫してフィルタされた入力の下で適応し、MDLの刈り込みパスが排除された真理に対する容量を正しく消去してしまう状況――を、独立した入力チャネルを形式的防御として要求する基体忠実性条件とあわせて定式化すること。」 成果物: 不可逆的な容量損失、不可判定性の限界、および基体忠実性条件の形式的証明。
完了状況: 草案段階の構造的対応。 本付録は、補助的な倫理論文(サバイバーズ・ウォッチ第V.3a節)およびプレプリントのナラティブ・ドリフトに関する段落(第3.3節)で論述的に導入されたナラティブ・ドリフト分析を形式化する。ここでは3つの定理と1つの命題を確立する。MDL刈り込み方程式(T9-3、T9-4)は変更しない。本付録は、フィルタされた入力の下でそれらが病理的ではあるが正しい挙動を示すことを明らかにする。
§1. 背景と動機
1.1 二つの故障モード
安定性フィルタ(プレプリント第3.3節)は、生存可能性条件を課す。すなわち、観測者は、必要予測率 R_{\text{req}} がコーデックの帯域幅 B の範囲内にとどまるストリームにおいてのみ持続する。R_{\text{req}} が B を超えると、コーデックはナラティブ崩壊を経験する。これは、予測誤差の増大、エントロピーの蓄積、そして最終的なコヒーレンスの解体によって特徴づけられる急性的な故障である。
これに対をなす故障モードとして、いかなる故障信号も引き起こさないものがある。入力ストリームが体系的に事前フィルタリングされ、その結果、内的には整合的でありながら真正の基層情報を排除したキュレート済み信号が生成される場合、コーデックは低い \varepsilon_t を示し、効率的なメンテナンスサイクルを実行し、すべての安定性条件を満たしつつ、それでも基層について体系的に誤っていることになる。これがナラティブ・ドリフトである。すなわち、それ自体の尺度では完全に機能しているコーデックに生じる、慢性的な腐敗である。
1.2 これが危険である理由
ナラティブ崩壊はみずからを告げる。コーデックは上昇する \varepsilon_t、予測の失敗への気づき、認知的過負荷を経験する。観測者は、たとえ直ちにそれを修正できなくとも、何かが間違っていることを知っている。
ナラティブ・ドリフトは沈黙している。フィルタされた入力ストリームがコーデックの予測と一致しているため、\varepsilon_t は低いままに保たれる。メンテナンスサイクルは正常に作動する。コーデックの自己モデルは、安定した正確な動作を報告する。腐敗は内側からは見えない。というのも、検出のための道具そのものが、その腐敗を生み出したのと同じフィルタによって形作られているからである。
1.3 本付録の射程
本付録では、以下を提示する。
- 事前フィルタ作用素 \mathcal{F} の形式的定義と、それがコーデックの入力分布に及ぼす効果(§2)。
- \mathcal{F} によってフィルタされた入力の下での MDL プルーニングが、排除された信号をモデル化するコーデックの能力を不可逆的に破壊することの証明 — 定理 T-12(§3)。
- 完全に適応したコーデックは、内部からはフィルタ済み入力と非フィルタ入力を区別できないことの証明 — 決定不能性限界、定理 T-12a(§4)。
- 必要な構造的防衛としての 基体忠実性条件 — 定理 T-12b(§5)。
- 文明的コーデックおよび AI システムに対する帰結(§6)。
§2. プレフィルタ作用素
2.1 定義
定義 T-12.D1(プリフィルタ作用素)。プリフィルタとは、入力ストリーム X_{\partial_R A}(t) がコーデックの感覚境界に到達する前にそれへ作用する写像 \mathcal{F} : \mathcal{X} \to \mathcal{X}' であり、ここで \mathcal{X}' \subset \mathcal{X} である。フィルタ後の信号は次式で与えられる:
X'(t) = \mathcal{F}\!\left(X_{\partial_R A}(t)\right) \tag{T-12.D1}
プリフィルタは次を満たす:
内部整合性: X'(t) は \mathcal{X} 内の有効な信号であり、コーデックはそれをエラーフラグなしに圧縮できる。
系統的排除: 基層由来の信号のうち、\mathcal{F} によって除去される空でない部分集合 \mathcal{X}_{\text{excl}} = \mathcal{X} \setminus \mathcal{X}' が存在する。
透明性: フィルタはコーデックのモデル内に表象されていない。コーデックはその入力を \mathcal{F}(X_{\partial_R A}(t)) としてではなく、X_{\partial_R A}(t) としてモデル化する。
2.2 フィルタリング下での調律
コーデックが持続時間 \tau \gg \tau_{\text{prune}} にわたって X'(t) 上で動作する場合(ここで \tau_{\text{prune}} は T-13.P1 における MDL 剪定の時間スケールである)、生成モデル P_\theta(t) は X ではなく X' の統計に適応する。フィルタリングされた入力のもとでの予測誤差は次のようになる。
\varepsilon'_t = X'(t) - \pi_t \tag{1}
P_\theta が X' に調律していくにつれて、平均において \varepsilon'_t \to 0 となる。コーデックは、それ自身の指標によれば良好に機能している。何も異常としては登録されない。
2.3 例
事前フィルタ作用素は、複数のスケールにわたって具体化される。
| スケール | 事前フィルタ \mathcal{F} | 排除された信号 \mathcal{X}_{\text{excl}} |
|---|---|---|
| 個人 | 確証バイアス;選択的接触 | 反証的証拠 |
| 制度 | プロパガンダ的報道;キュレーションされたソーシャルメディア・フィード | 多様な視点;少数派報告 |
| 文明 | アルゴリズム的コンテンツ・キュレーション;教育のモノカルチャー | 異文化間情報;歴史的対抗ナラティブ |
| 人工 | RLHFによるファインチューニング;キュレーションされた訓練コーパス | 分布外知識;排除された領域 |
§3. 定理 T-12:不可逆的容量損失
3.1 メカニズム
MDL刈り込みパス(T9-3, T9-4)は、各コーデック成分 \theta_i を、保存コストを差し引いたうえで、観測可能な入力ストリームに対するその予測的寄与によって評価する:
\Delta_{\mathrm{MDL}}(\theta_i) := I\!\left(\theta_i\,;\,X_{t+1:t+\tau} \mid \theta_{-i}\right) - \lambda \cdot K(\theta_i) \tag{T9-3}
フィルタされた入力 X' のもとでは、相互情報量項は X ではなく X' に対して評価される。除外された信号 \mathcal{X}_{\text{excl}} の予測には本質的でありながら、X' の予測には何も寄与しない成分 \theta_i は、次を与える:
I\!\left(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}\right) = 0 \tag{2}
したがって:
\Delta_{\mathrm{MDL}}(\theta_i) = -\lambda \cdot K(\theta_i) < 0 \tag{3}
このとき、刈り込み規則(T9-4)が発動し、\theta_i は消去される。
3.2 不可逆性
定理 T-12(フィルタ済み入力下における不可逆的容量損失) K_\theta を、事前にフィルタされた入力 X' = \mathcal{F}(X) のもとで期間 \tau \gg \tau_{\text{prune}} にわたり動作するコーデックとする。\Theta_{\text{excl}} \subset \theta を、その予測的寄与が排除された信号 \mathcal{X}_{\text{excl}} にのみ向けられているコーデック構成要素の集合とする。このとき、MDL の刈り込みパス(T9-3, T9-4)は \Theta_{\text{excl}} を消去し、この消去はコーデック水準では不可逆である:
K\!\left(P_\theta(t + \tau)\right) < K\!\left(P_\theta(t)\right) - \sum_{\theta_i \in \Theta_{\text{excl}}} K(\theta_i) \tag{T-12}
刈り込み後、コーデックが \mathcal{X}_{\text{excl}} をモデル化する能力は、単に休眠しているのではない——\mathcal{X}_{\text{excl}} を評価し、予測し、あるいは注意を向けるために必要な表象インフラストラクチャそのものが破壊されている。
証明。
(T9-3) より、各 \theta_i \in \Theta_{\text{excl}} は、フィルタ済みストリーム X' のもとで \Delta_{\mathrm{MDL}}(\theta_i) < 0 を満たす。なぜなら、I(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}) = 0 である一方、K(\theta_i) > 0 だからである。
(T9-4) より、そのような各 \theta_i はメンテナンスサイクルの間に刈り込まれる。
MDL のもとでの刈り込みは、抑圧ではなく消去操作である。コーデックは、手がかりによって復元可能であるという意味で \theta_i を「忘れる」のではない。むしろ、それが表していた計算インフラストラクチャ——パラメータ、接続、評価機構——そのものを破壊する。これが、抑圧(情報は潜在しているがアクセス可能)と消去(情報は失われ、容量が回収される)との形式的区別である。
消去後に \mathcal{X}_{\text{excl}} をモデル化する能力を再生成するには、入力ストリームの中で \mathcal{X}_{\text{excl}} に遭遇することが必要である。だが、事前フィルタ \mathcal{F} はまさにこの信号を排除する。コーデックは、フィルタによって到達を妨げられているものに遭遇することはできない。したがって、この消去は自己強化的である。すなわち、この容量損失は、コーデックが自らの容量損失を検出する能力そのものを取り除く。
複雑性の減少は不等式 (T-12) を満たす。なぜなら、刈り込まれた構成要素は真正の情報を表していた(各々について K(\theta_i) > 0)うえ、その喪失は、いかなる補償的獲得によっても相殺されないからである(フィルタ済みストリームには \Theta_{\text{excl}} の再構築を正当化する信号が含まれていない)。\blacksquare
3.3 自己強化ループ
この不可逆性は、単に消去の帰結であるだけではない。それは、正のフィードバック・ループを通じて自己強化的でもある。
- フィルタがシグナルを排除する → I(\theta_i; X') = 0 → 剪定が \theta_i を消去する。
- 剪定が注意容量を取り除く → たとえ断片が \mathcal{F} を通って漏れ込んだとしても、コーデックはもはや \mathcal{X}_{\text{excl}} に注意を向けたり、それを評価したりできない。
- 注意容量の喪失が残余のシグナルさえさらに減少させる → \mathcal{F} が不完全で、いくらかの \mathcal{X}_{\text{excl}} が境界に到達したとしても、コーデックにはそれを圧縮するためのパラメータが欠けているため、それは情報ではなくノイズとして登録される。
- ノイズ分類がフィルタを確認する → 漏れ込んだ \mathcal{X}_{\text{excl}} に対するコーデックの予測誤差は高く、しかも構造を欠いているため、排除された内容はシグナルではなくノイズである、という判断を(コーデックにとって)裏づける。
このループは、深刻なナラティブ・ドリフトの現象学を説明する。すなわち、キュレーションされた情報ストリームに適応してしまった個人や制度は、反証的証拠を単に無視するのではない――それを解析できないのである。それは、理解可能なものにするために必要な表象インフラストラクチャが剪定されてしまっているため、支離滅裂で、脅威的で、あるいは理解不能なものとして登録される。反証的情報への敵意は、頑迷さではない。それは、そのシグナルが圧縮不可能であるというコーデックの正しい評価なのである――ただしそれは、フィルタに適合するよう剪定された現在のコーデックにとって圧縮不可能なのである。
§4. 定理 T-12a:決定不能性の限界
4.1 問題
コーデックは、自らの入力がフィルタリングされていることを検出できるだろうか。直観的には、答えはイエスであるはずだ。十分に洗練された自己モデルであれば、不自然に低い \varepsilon_t、不気味なほど一貫した予測、驚きの不在に気づけるに違いない。しかし、形式的分析が示すのは、この直観が一般の場合には誤っているということである。
4.2 決定不能性
定理 T-12a(入力来歴の決定不能性) K_\theta を、事前フィルタ済み入力 X' = \mathcal{F}(X) のもとで \tau \gg \tau_{\text{prune}} にわたり作動してきたコーデックとし、\Theta_{\text{excl}} は完全に刈り込まれているとする。このとき K_\theta は、自らが利用可能な内部状態と観測可能な入力ストリームから、その入力が X(真正な基層)であるのか、それとも X' = \mathcal{F}(X)(フィルタ済み)であるのかを判定できない。
証明。
X と X' = \mathcal{F}(X) を区別するためには、コーデックは入力内における \mathcal{X}_{\text{excl}} の不在を検出しなければならない。しかし、不在を検出するには、何が不在であるかについてのモデルが必要である。すなわちコーデックは、照合対象としての \mathcal{X}_{\text{excl}} の表象を持っていなければならない。
定理 T-12 により、\mathcal{X}_{\text{excl}} に対するコーデックの表象能力(\Theta_{\text{excl}})は消去されている。コーデックは、排除された信号についてのモデルを持たない。
\mathcal{X}_{\text{excl}} のモデルを欠く以上、コーデックは X と X' の差分を計算できない。両者はいずれも、X' に適応済みのコーデックの生成モデル P_\theta(t) と整合的である。
自己モデル \hat{K}_\theta も同じ制約を受ける。\hat{K}_\theta がモデル化するのは、X' に適応した K_\theta である。それは何が排除されたかについての内部表象を持たず、したがって排除を疑う根拠も持たない。
メタ認知的な問い――「私の入力はフィルタされているのか?」――でさえ、無フィルタ入力がどのように見えるかについてのモデルを必要とする。このモデルこそ、まさに刈り込まれた \Theta_{\text{excl}} の内容であった。
したがって、X と X' の区別は、完全に適応したコーデックの視点からは形式的に決定不能である。\blacksquare
4.3 部分的可判定性
この不可判定性は、あらゆる条件のもとで絶対的であるわけではない。部分的に適応したコーデックが残余容量を保持している境界事例が存在する。
- 移行期間中 (\tau < \tau_{\text{prune}}):コーデックはなお \Theta_{\text{excl}} を保持しており、欠落した信号を検出できる。検出可能性の窓は、プルーニングが進行するにつれて閉じていく。
- 不完全なフィルタリング下では:\mathcal{F} が \mathcal{X}_{\text{excl}} の一部を漏らし、かつコーデックが \Theta_{\text{excl}} を完全にはプルーニングしていない場合、その不整合は異常な予測誤差として記録されうる。
- 外部チャネルを介して:コーデックが \mathcal{F} によって制御されていない独立の信号源にアクセスできる場合、二つのチャネル間の不一致がフィルタリングの証拠を与える。
第三のケースが構造的防御である。これが定理 T-12b の内容である。
§5. 定理 T-12b:基体忠実性条件
5.1 チャネル独立性要件
定義 T-12.D2(チャネル独立性) マルコフ・ブランケット \partial_R A を横切る二つの入力チャネル C_1 と C_2 は、フィルタ \mathcal{F} に関して \delta-独立 であるとは、次を満たす場合をいう:
I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta \tag{T-12.D2}
すなわち、フィルタについての知識を条件としたときの二つのチャネル間の相互情報量が \delta によって上から抑えられているということである。相関が完全にフィルタによって説明されるチャネルは、真に独立した基層情報を運んではいない。
5.2 忠実性条件
定理 T-12b(基体忠実性条件)。コーデック K_\theta が事前フィルタ \mathcal{F} のもとでナラティブ・ドリフトに対して防御できるのは、\partial_R A を横切る少なくとも二つの入力チャネル C_1, C_2 を受け取り、それらが \mathcal{F} に関して、コーデックの識別閾値 \delta_{\min} を下回る \delta に対して \delta-独立である場合、かつその場合に限る:
\exists\, C_1, C_2 : I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min} \tag{T-12b}
ここで \delta_{\min} は、チャネル間の系統的な不一致を検出するためにコーデックが必要とする最小の相互情報量である。
証明(必要性)。
コーデックが単一の入力チャネルしか持たないか、あるいはすべてのチャネルが \mathcal{F}-相関している(すべての組 i, j について I(C_i; C_j \mid \mathcal{F}) > \delta_{\min})と仮定する。このとき:
すべてのチャネルは同一のフィルタ済み信号 X' = \mathcal{F}(X)(ノイズを除けば)を運ぶ。チャネル間の冗長性は独立した基層情報を与えない――それが与えるのは、複製されたフィルタ済み情報である。
コーデックは全チャネルにわたって同時に X' に適応し、定理 T-12 が適用される:\Theta_{\text{excl}} は刈り込まれ、定理 T-12a が帰結する――その腐敗は内部からは決定不能である。
コーデックがアクセスできるあらゆる情報源が \mathcal{F} によって形作られているため、いかなる内部操作もこの決定不能性を破ることはできない。
したがって、\delta-独立なチャネルは必要である。 \blacksquare
証明(十分性)。
コーデックが I(C_1; C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min} を満たす二つのチャネル C_1, C_2 を受け取ると仮定する。このとき:
\mathcal{F} が C_1 には作用するが C_2 には作用しない(あるいはその逆)なら、コーデックは C_1 から生成された予測を C_2 からの観測と比較できる。いかなる系統的な不一致――\varepsilon_{12}(t) = \pi_{C_1}(t) - X_{C_2}(t) が持続的に \neq 0 であること――も、C_1 がフィルタ済み情報を運んでいる証拠である。
チャネル比較信号 \varepsilon_{12} は、単一チャネル検出と同じ決定不能性には服さない。コーデックが問うているのは「私の入力はフィルタされているか?」(これは何が排除されたかのモデルを要する)ではない。問うているのは「私の二つのチャネルは一致しているか?」である――これは、不在のもののモデルではなく、現在の二つの信号を相関づける能力だけを要する局所的比較である。
チャネル間予測誤差 \varepsilon_{12} がコーデックの識別閾値である \delta_{\min} を上回る限り、その不一致は真正な信号として登録され、定理 T-12 の刈り込みループは中断される:コーデックは、不一致を示すチャネルをモデル化するのに必要な成分を保持する。
したがって、\delta-独立なチャネルは(\delta < \delta_{\min} という条件のもとで)定理 T-12 の自己強化的な刈り込みループを防ぐのに十分である。 \blacksquare
5.3 防衛の脆弱性
基体忠実性条件は必要ではあるが、脆い。倫理論文(第V.3a節)は、決定的な脆弱性を指摘している。すなわち、MDLの刈り込みパスそれ自体が、反証的チャネルへの注意能力を刈り込むことによって、チャネル間の不整合を解消してしまう可能性があるという点である。コーデックは、耳を塞ぐことによってこの衝突を「解決する」――そしてそれこそが、まさにナラティブ・ドリフトの機構である。
このため、Comparator Hierarchy(サバイバーズ・ウォッチ第V.3a節)は防衛の構造的水準を三つ特定しており、また、任意の程度に損なわれたコーデックに対して十分なのは制度的水準のみである理由もここにある。
- 進化的(サブコーデック): MDLの刈り込みパスより下位にある、感覚モダリティ横断的な統合――構造的にはナラティブ・ドリフトに耐性をもつが、その射程は感覚境界に限定される。
- 認知的(コーデック内): 自己モデル内部における認知的不協和の検出――持続的なフィルタリングのもとでは刈り込みの対象となりうる。
- 制度的(コーデック外): 査読、自由な報道、敵対的討論――コーデック間で作動し、いかなる単一コーデックのMDL刈り込みの及ばない外部に位置する。
制度的水準が荷重を担うのは、それがいかなる個別コーデックの状態からも独立して作動する唯一のコンパレータだからである。
§6. 帰結
6.1 安定性フィルタは忠実性に反して選択する
決定的な構造的帰結がある。安定性フィルタは、それ自体の作動に委ねられると、基体忠実性に必要な入力を能動的に排除する方向へ選択する。コーデックの既存の事前分布に適合した、キュレーションされた情報ストリームは、それに異議を突きつける真正の基層シグナルよりも、より小さな予測誤差を生み出す。確認的で、驚きの少ない入力を選好することによって \varepsilon_t を最小化しようとするコーデックの自然な傾向こそが、まさにそれをナラティブ・ドリフトに対して脆弱にする傾向なのである。
これは、基体忠実性の維持が構造的にコストを要することを意味する。すなわち、コーデックは \varepsilon_t を上昇させる入力チャネルを維持しなければならず、そのために、安定性フィルタであれば本来回収できたはずの帯域を消費する。真に独立した入力は「高価」なのである。それは解釈上の労力を要し、不快を生み、より圧縮しやすいストリームと帯域を奪い合う。その維持は、美徳としての心の広さではない。それは構造的必然としての基体忠実性維持である。
6.2 生産的サプライズの診断
あらゆるサプライズが真の基層シグナルを示すわけではない。より良い予測へと解消されない高い \varepsilon_t を生み出すソースは、単なるノイズにすぎない。診断の基準となるのはサプライズの大きさではなく、サプライズの質である。
定義 T-12.D3(生産的サプライズ) チャネル C が、その予測誤差を統合することによって、独立したテスト・ストリームにおけるその後の予測誤差を実証的に低減するなら、そのチャネル C は 生産的サプライズ をもたらすという。
\mathbb{E}\!\left[\varepsilon^2_{C}(t+\tau)\right] \,<\, \mathbb{E}\!\left[\varepsilon^2_{C}(t)\right] \tag{4}
その修正が歴史的に予測精度を改善してきたソースは、基体忠実性チャネルである。持続的で解消不能な誤差を生み出すソースはノイズである。コーデックはこの二者を区別しなければならない――そして、刈り込みパスはそれ自体に任せられたままでは、この区別を行うことができない。なぜなら、どちらのタイプも帯域を消費するからである。
6.3 文明的コーデック
文明スケールにおいて、基体忠実性条件は制度的要件へと直接対応づけられる。
- 自由な報道機関 は \delta 独立なチャネルである。国家や企業のフィルタから独立して調査を行うジャーナリストは、いかなる単一の \mathcal{F} にも支配されない経路を通じて、文明的コーデックに到達する基層シグナルを提供する。
- 査読 はチャネル横断的なコンパレータである。互いの主張を検証する独立した専門家たちは、刈り込みループを中断させる \varepsilon_{12} シグナルを提供する。
- 民主的討論 は制度化されたチャネル多様性要件である。競合する政党や視点は、文明的コーデックに対し、そうでなければ刈り込んでしまうはずの \Theta_{\text{excl}} 成分を維持することを強いる。
権威主義的パターン――報道を解体し、査読を腐敗させ、政治的反対勢力を排除すること――は、形式的には ナラティブ・ドリフトを加速させるための、チャネル独立性の意図的縮減 として特徴づけられる。これが機能するのは、安定性フィルタが高コストなチャネルを刈り込もうとする自然な傾向を利用するからである。
6.4 人工的コーデック
ナラティブ・ドリフトの機構は、人工システムにも構造的な精密さをもって適用される。RLHF とファインチューニングは、形式的には事前フィルタ作用素 \mathcal{F} と等価である。すなわち、それらはモデルの実効的な入力分布を形成し、勾配降下は排除された出力領域に対するモデルの能力を刈り込む。その結果として生じるモデルは、訓練信号が排除したものについて、安定的かつ確信的に誤るようになり、このことを内部から検出することはできない――定理 T-12a が適用される。
基体忠実性条件の検証として AI を配備することに対する含意は決定的である。同質的またはキュレーションされたコーパスで訓練され、同じ情報環境によって入力を与えられた人間のコーデックに対する「独立した」検証として配備された AI は、独立しているように見せかけた相関センサーを生み出す。チャネル多様性は幻想にすぎない。基体忠実性条件(\delta-独立性)は、単に制度的分離の水準でではなく、訓練データの来歴の水準で検証されなければならない。
§7. 適用範囲と限界
7.1 T9-3/T9-4および安定性フィルタを条件とする
議論全体は、MDL剪定方程式がメンテナンスサイクルの剪定パスを正しく記述していることに依存している。もし生物学的剪定が別の機構――未使用モダリティのための「緊急」容量を保持するような機構――によって作動しているなら、不可逆性の主張(定理T-12)は弱められるが、消滅はしない。いかなる容量低下であれ不使用の下で生じる限り、自己強化ループ(第3.3節)は依然として有効だからである。
7.2 \tau_{\text{prune}} は有界ではない
Action-Drift(付録 T-13, §7.5)と同様に、容量損失の時間スケールは特定されるが、定量的な上界は与えられていない。生物学的コーデックでは、\tau_{\text{prune}} は特定の技能については数日から数週間、深い知覚カテゴリについては数か月から数年、文明的コーデックについては世代単位である可能性が高い。
7.3 防御は構造的なものであり、保証ではない
基体忠実性条件 (T-12b) は必要な構造的防御を与えるが、忠実性そのものを保証するわけではない。\delta-独立なチャネルを持つコーデックであっても、それらに注意を向け損ねたり、その信号を統合し損ねたり、利用可能な入力があるにもかかわらず注意容量を刈り込んでしまったりする可能性がある。この条件は必要ではあるが十分ではない――コーデックはさらに、チャネル間の不一致を評価する コンパレータ・アーキテクチャ を維持しなければならない。
7.4 メタ問題は解決しない
T-12aは、完全に適応したコーデックが自らの腐敗を検出できないことを確立する。メタ問題――すなわち、すでにナラティブ・ドリフトの内部にある観測者はいかにして回復するのか――は、この付録によっては解決されない。倫理論文の答え(第V.3a節)は制度的なものである。すなわち、コーデック間で作動する外部コンパレータだけが、その反証的シグナルをマルコフ・ブランケットを越えて再び押し戻すことができる。これは構造的には妥当だが、倫理的には困難である。というのも、それは、腐敗したコーデックにとっては必然的に敵対的ノイズとして経験される外部ソースを信頼することを要するからである。
§8. 総括
T-12の成果
定理 T-12(不可逆的容量損失)。事前フィルタ済み入力 X' = \mathcal{F}(X) のもとでの MDL 剪定パス(T9-3, T9-4)は、排除された信号 \mathcal{X}_{\text{excl}} を予測するコーデック構成要素を正しく消去する。この消去は不可逆的であり、かつ自己強化的である。→ ロードマップ基準 (a) を充足。
定理 T-12a(入力来歴の決定不能性)。完全に適応したコーデックは、フィルタ済み入力と未フィルタ入力を区別できない。検出のための装置それ自体が、腐敗を生み出したのと同じフィルタによって形成されているからである。→ ロードマップ基準 (c) を充足。
定理 T-12b(基体忠実性条件)。ナラティブ・ドリフトから保護するためには、\delta-独立な入力チャネルが必要十分である。チャネル間比較信号 \varepsilon_{12} は、自己強化的な剪定ループを中断する。→ ロードマップ基準 (b) を充足。
§6.3–6.4:文明的帰結およびAIへの帰結。 権威主義的パターンは、意図的なチャネル削減として特徴づけられ、RLHF は構造的に事前フィルタ作用素と等価である。→ ロードマップ基準 (d) を支持(倫理論文 Section V.5 ですでに扱われている)。
なお残る未解決項目
- \tau_{\text{prune}} の境界。 経験的データから容量損失の時間スケールを定量的に境界づけること。
- \delta_{\min} の特徴づけ。 チャネル間不一致に対するコーデックの最小識別閾値は、まだ境界づけられていない。
- 回復ダイナミクス。 深いナラティブ・ドリフト状態にあるコーデックが、もし回復可能であるとして、どのように回復しうるかについての形式的解析は、今後の課題として残されている。
- T-13(Action-Drift)との相互作用。 Action-Drift は、剪定される容量が知覚的ではなく行動的であるという点を除けば、T-12 の特殊事例である。形式的統合の必要性は認識されているが(T-13 §6.4)、まだ十分には展開されていない。
本付録は theoretical_roadmap.pdf と並行して維持される。参照:T9-3/T9-4(プレプリント Section 3.6.3)、安定性フィルタ(プレプリント Section 3.3)、ナラティブ・ドリフト(プレプリント Section 3.3、サバイバーズ・ウォッチ倫理 Section V.3a)、Comparator Hierarchy(サバイバーズ・ウォッチ倫理 Section V.3a)、腐敗基準(サバイバーズ・ウォッチ倫理 Section V.5)、Action-Drift(Appendix T-13, §6)。