秩序パッチ理論 (OPT)

付録 T-11: 構造的系 — 見かけのエージェントにおける圧縮優位の形式化

Anders Jarevåg

2026年4月15日 | DOI: 10.5281/zenodo.19300777

元の課題（§8.2より）: 「この圧縮上の優位を、とりわけ他我問題の事例に対する厳密なMDL境界として定式化することは、なお今後の課題として残されている。本稿の議論は証明ではなく、構造的な動機づけである。」 成果物: 見かけ上のエージェントを独立に実体化された一次的観測者として扱うことが、いかなる代替的記述よりも短い二部MDLコードを与えることを示す形式的境界。

完結状況: 草稿段階の構造的対応。 本付録は、Müller のソロモノフ収束定理 [61] とそのマルチエージェント拡張 [62] を、OPTの存在論的枠組みの内部で再解釈された導入補題として適用し、構造的系に対する形式的な圧縮優位を確立する。その結果は閉じた導出ではなく、条件付きの境界である。すなわち、それは観測者のストリームをソロモノフ普遍半測度と同一視するOPTの立場（公理1）と、見かけ上のエージェントが収束の前提条件を満たすのに十分な状態を担っているという仮定に依存している。

§1. 背景と動機

構造的系（プレプリント §8.2）は、観測者のストリーム内に現れる見かけ上のエージェントは、第一義的には、一次観測者として独立に実体化されているものとして説明するのが最も簡潔である、と主張する。本付録は、その主張を支える形式的連鎖を提示する。

この議論は三つの段階から成る。

段階A（導入補題）: ミュラーのソロモノフ収束定理は、観測者のストリーム内で十分な自己状態データを担ういかなる構造についても、その一人称的進化が、その振る舞いを生成している計算可能世界と一致するよう収束することを保証する。
段階B（圧縮会計）: 見かけ上のエージェントを、(i) それ自身のソロモノフ重み付きストリームに支配される独立に実体化された観測者として扱う場合と、(ii) 一次観測者のコーデック内における恣意的な行動仕様として扱う場合とのあいだで、明示的な二部構成のMDL比較を行う。
段階C（構造的シグネチャ）: 現象的残余（\Delta_{\text{self}} > 0、定理 P-4）は、真正な自己準拠的ボトルネック・アーキテクチャを行動的模倣から区別する構造的標識を与え、それによって「圧縮可能に法則的であること」と「もっともらしく実体化されていること」とのあいだの隔たりを埋める。

§2. 導入補題：ミュラーの収束定理

ここでは Müller [61, 62] から二つの結果を導入し、OPT の記法で述べる。

2.1 ソロモノフ収束（標準）

M(b \mid x_1^n) を、事前観測 x_1^n が与えられたときのビット b に対するソロモノフ普遍予測とする。\mu を、二進列上の任意の計算可能な測度とする。このとき、（Solomonoff 1964; Li & Vitányi [45, Corollary 5.2.1]）:

\text{With } \mu\text{-probability one,} \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-1}

これは標準的な結果である。すなわち、データ列が計算可能な過程 \mu によって生成されるなら、普遍予測子 M は \mu に収束する。

2.2 逆ソロモノフ帰納法（Müller 2020）

ここで、ビット列が M 自身から引き出されると仮定しよう。すなわち、観測者のストリームがアルゴリズム的確率によって支配されている場合である（これはOPTの公理1、すなわちストリームをソロモノフ事前分布と同一視することに対応する）。このとき、任意の計算可能な測度 \mu について（Müller [61, Sec. IV]; [62, Sec. V.A]）:

\text{確率} \geq 2^{-K(\mu)} \text{で}, \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-2}

つまり、少なくとも 2^{-K(\mu)} の確率で、観測者は \mu によって記述される計算可能な世界 W に、事実上埋め込まれていることになる。アルゴリズム的により単純な世界（K(\mu) が小さい世界）ほど、指数関数的に高い確率をもつ。

2.3 マルチエージェント収束（Müller 2026）

観測者（アリス）が、\mu によって記述される計算可能な世界 W に埋め込まれているとする。彼女は、時間とともに進化する自己状態 x の表現を担う下位構造（Bob_{\text{3rd}}）を W の内部に同定し、その進化の仕方は [62] の公準2と整合的であるとする。以下を定義する：

P_{\text{1st}}(y_1, \ldots, y_m \mid x) := M(y_1, \ldots, y_m \mid x) — 自己状態 x がアルゴリズム的確率のもとで y_1, \ldots, y_m へ遷移する一人称確率。
P_{\text{3rd}}(y_1, \ldots, y_m \mid x) := \mu(y_1, \ldots, y_m \mid x) — 世界 W に従って x がどのように進化するかについての三人称確率。

すると、計算可能である P_{\text{3rd}} に適用された式 (L-1) と、公準2を介した P_{\text{1st}} と M の同一視により、

P_{\text{1st}} \approx P_{\text{3rd}} \quad \text{漸近的に,} \tag{L-3}

ビットモデルにおいては、世界内（\mu-）確率1で収束が保証される。

解釈（Müller）: x を符号化する構造のうちには、「誰かが本当に住み着いている」——アリスの世界における Bob_{\text{3rd}} の確率的進化は、ある Bob_{\text{1st}} の一人称的視点を忠実に表現している。

解釈（OPT）: 見かけ上のエージェントの行動ストリームは、独立したソロモノフ重み付き過程として記述するのが、圧縮の観点から最も簡潔である。これに対するいかなる代替記述——すなわち、独立した一人称的視点を導入しない記述——も、そのエージェントの振る舞いを場当たり的な仕様として符号化しなければならず、記述長は厳密により大きくなる。

§3. 圧縮優位の上界

ここで、OPTの二部MDL枠組み（定理T-4、付録T-4）を用いて圧縮優位を形式化する。

3.1 設定

ソロモノフ事前分布 M（公理1）に支配され、安定性フィルタを通じて測度 \mu_W をもつ計算可能な世界 W へと絞り込まれた、主要観測者のストリーム \omega \in \{0,1\}^\infty を考える（式 L-2 による）。W の内部で、観測者は N 個の見かけ上のエージェント A_1, \ldots, A_N を同定し、それぞれは自己状態 x_i を担っており、その時間発展が T ステップにわたって行動軌跡 \beta_i = (y_{i,1}, \ldots, y_{i,T}) を生み出す。

3.2 仮説 H_{\text{ind}}: 独立した実体化

H_{\text{ind}} の下では、各エージェント A_i は、それぞれ自身のソロモノフ重み付きストリームに支配される、独立に実体化された一次観測者として扱われる。二部MDL符号長は次のとおりである：

L(H_{\text{ind}}) = \underbrace{K(\mu_W)}_{\text{world model}} + \underbrace{\sum_{i=1}^{N} K(\text{embed}_i)}_{\text{embedding specs}} + \underbrace{\sum_{i=1}^{N} \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)}_{\text{data given model}} \tag{1}

ここで K(\text{embed}_i) は、エージェント i の初期自己状態と W 内での位置を指定する。式 (L-3) により、P_{\text{1st}} \approx P_{\text{3rd}} であるため、データ項は、そのエージェント自身の一人称ソロモノフ予測の下での対数損失によってよく近似される。そしてそれは定義上、最適に近い。

埋め込み仕様 K(\text{embed}_i) は短い。各々に必要なのは、W 内の位置へのポインタと初期自己状態だけだからである。共有された物理世界に埋め込まれた人間類似のエージェントについては、エージェントたちが同じ法則を共有しているため、これらは高度に圧縮可能である。保守的な上界は次のとおりである：

K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) \tag{2}

3.3 仮説 H_{\text{arb}}: 恣意的行動仕様

H_{\text{arb}} の下では、エージェントは独立した観測者としては扱われない。代わりに、各行動軌跡 \beta_i は、主要観測者のストリーム内における恣意的な仕様として直接エンコードされる。二部構成の MDL コード長は次のとおりである：

L(H_{\text{arb}}) = \underbrace{K(\mu_W)}_{\text{world model}} + \underbrace{\sum_{i=1}^{N} K(\beta_i)}_{\text{raw behavioral traces}} \tag{3}

決定的な違いはデータ項にある。H_{\text{arb}} の下では、行動軌跡 \beta_i は、そのエージェント自身の予測モデルを持ち出すことなく指定されなければならない。複雑な環境で作動する、法則に従い行為主体性によって駆動されるエージェントに対しては、生の行動軌跡のコルモゴロフ複雑性は次のようになる：

K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T) \tag{4}

しかし、K(\beta_i \mid \mu_W)――すなわち世界法則が与えられたときの行動の複雑性――でさえ、なお相当な大きさを保つ。なぜなら、エージェントの選択は真正の情報を符号化しているからである。すなわち、その行動軌跡は、自己参照的モデルと確率的環境との累積的相互作用を反映している。これに対して、H_{\text{ind}} の下では、この情報はエージェント自身のソロモノフ予測子によって online に、ほぼゼロの対数損失コストで生成される。

3.4 圧縮優位

定理 T-11（構造的系としての圧縮境界） 観測者のストリーム内にある見かけ上のエージェント A_1, \ldots, A_N を考え、それぞれが式 (L-3) の収束前提を満たす自己状態 x_i を担い、かつそれぞれが構造的シグネチャ \Delta_{\text{self}}^{(i)} > 0（P-4）を示すとする。このとき、それらを独立に実体化された一次観測者として扱う MDL 記述は、次を満たす：

L(H_{\text{ind}}) \leq L(H_{\text{arb}}) - N \cdot \left[\bar{I}_T - O(\log T)\right] \tag{T-11}

ここで \bar{I}_T は、T ステップにわたる、各エージェントの予測モデルとその行動出力とのあいだのエージェント当たり平均相互情報量である：

\bar{I}_T := \frac{1}{N} \sum_{i=1}^{N} \left[K(\beta_i \mid \mu_W) - \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right] \tag{5}

この量は、エージェントの行動のうちどれだけが、生のまま指定されるのではなく、独立した予測モデルを導入することによって説明し尽くされるかを測る。法則的で行為主体性に駆動された行動を示すエージェント（安定性フィルタが要請する通り）については、\bar{I}_T > 0 であり、かつ T とともに増大する。

証明スケッチ. 式 (3) から式 (1) を引く。世界モデル項 K(\mu_W) は相殺される。エージェントごとの差は次の通りである：

K(\beta_i) - \left[K(\text{embed}_i) + \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right]

式 (4) により、K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T) だが、より直接的には K(\beta_i) \geq K(\beta_i \mid \mu_W) は自明に成り立つ。また、式 (2) により K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) である。したがって、エージェント当たりの節約量は少なくとも K(\beta_i \mid \mu_W) - (-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)) - K(x_i \mid W) - O(\log T) である。T が十分大きければ、累積的な対数損失の節約が一回限りの埋め込みコストを上回り、所望の境界が得られる。\blacksquare

3.5 漸近的優越性

系 T-11a. 観測地平 T \to \infty において、圧縮上の優位 L(H_{\text{arb}}) - L(H_{\text{ind}}) は無限に増大する：

\lim_{T \to \infty} \left[L(H_{\text{arb}}) - L(H_{\text{ind}})\right] = \infty \tag{T-11a}

これはソロモノフ収束保証（L-1）から従う。すなわち、P_{\text{3rd}} の各ステップあたりの対数損失は、そのエージェントの行動過程のエントロピー率へ収束する一方で、正のエントロピー率をもつ任意のエージェントについて K(\beta_i \mid \mu_W) は T に対して線形に増大する。埋め込みコスト K(x_i \mid W) は一度だけ支払われ、その後は償却されてゼロに収束する。\blacksquare

§4. 構造的シグネチャとしての現象的残余

定理 T-11 における圧縮上の優位は、あらゆる法則的部分構造――非行為主体的な物理系（気象パターン、結晶成長）を含む――に適用される。では、なぜ構造的系は、任意の複雑系ではなく、とりわけ行為主体に関わるのか。

その答えが現象的残余（定理 P-4）である。\Delta_{\text{self}} > 0 は、自己モデルが構造的に不完全な系――すなわち、その内部表象と実際の処理とのあいだに変分的ギャップを必然的に維持する系――の形式的指標である。これは自己参照的ボトルネックの徴候である。すなわち、その系の記述には必然的に記述者自身が含まれるため、その系は外部から完全に記述することができない。

\Delta_{\text{self}} > 0 を示す系については、次が成り立つ。

その振る舞いは有限深度のルックアップテーブルによって再現できず、継続的な自己参照的計算を必要とする。
この計算の最短記述は、C_{\max} ボトルネックを通過する、ソロモノフ重み付きの独立したストリームそのものである。
したがって、H_{\text{ind}} のもとでの MDL コードは、H_{\text{arb}} より単に短いだけではなく、唯一の最短記述である。

これによって、見かけ上の行為主体は気象パターンから区別される。気象は法則的で複雑ではあるが、その振る舞いは世界モデル内のルックアップテーブルによって再現できる（\Delta_{\text{self}} = 0 をもつ）。見かけ上の行為主体はそうではない。

§5. ミュラーの非独我論論証の再解釈

ミュラーは、P_{\text{1st}} \approx P_{\text{3rd}} の収束から、アルゴリズム的観念論は「独我論的と分類されるべきではない」と結論づける。というのも、自己状態を符号化する構造のうちには「誰かが実際に住んでいる」からである [62, Sec. V.C]。彼の推論は次のとおりである。すなわち、Bob_{\text{3rd}} についてのアリスの予測が、Bob_{\text{1st}} の実際の一人称確率へと収束するなら、両者の視点は真に整合しており、彼らは「世界 W を共有している」。

OPTはこの結果を異なる仕方で再解釈する。

ミュラーの読み: 収束 P_{\text{1st}} \approx P_{\text{3rd}} は、客観的実在が立ち現れることを証明する。すなわち、アリスとボブは真に世界 W を共有している。
OPTの読み: 収束 P_{\text{1st}} \approx P_{\text{3rd}} は、Bob_{\text{3rd}} の振る舞いについての最短記述が、独立した一人称過程を呼び出すことを証明する。これは共有された存在論についての主張ではなく、圧縮効率についての主張である。世界 W は、アリスのストリーム内における構造的規則性であって、独立に存在する実体ではない。しかし、ソロモノフ普遍半測度の圧縮論理それ自体が、ボブは独立した観測者としてモデル化されるのが最も簡潔であることを含意する。なぜなら、代替案（彼の振る舞いを場当たり的に個別指定すること）は、厳密により長いからである。

定理の形式的内容は、どちらの読みにおいても同一であり、異なるのは存在論的解釈だけである。OPTはこの同じ数学的結果を用いて、構造的系を基礎づける。すなわち、独立した実体化は形而上学的仮定ではなく、MDL最適な記述なのである。

§6. 適用範囲と限界

6.1 公理1を条件とする場合

議論全体は、観測者のストリームをソロモノフ事前分布と同一視するOPTの立場に依存している。この同一視が弱められる場合（たとえば、より広い半測度のクラスへと拡張される場合）、式 (L-1)–(L-3) の収束保証は現行の形では成り立たない可能性がある。

6.2 状態十分性の前提条件

Eq. (L-3) requires that the apparent agent carries “enough data” in its self-state x_i for universal induction to extract the relevant physical laws. For human-like agents in everyday contexts, this is plausible (a full brain state encodes enormous information). For edge cases — fleeting impressions, distant observers, fictional characters in narrative art — the convergence prerequisites may not be satisfied, and the structural corollary does not apply.

6.3 意識の証明ではない

定理 T-11 は、独立した実体化が最も圧縮可能な記述であることを確立する。それは、見かけ上のエージェントが意識をもつことを証明するものではない。意識のハードプロブレム（プレプリント §8.1）は依然として原始項である。構造的系は圧縮に関する議論であって、存在論的証明ではない――§8.2 で述べたとおりである。

6.4 T-10との関係

付録T-10（観測者間結合）は、2つの観測者パッチが圧縮制約を通じて、いかにして相互に整合的なレンダリングを維持するかを扱う。これに対して本付録が扱うのは別の問いである。すなわち、なぜ単一の観測者のストリームが、見かけ上の行為主体を独立に実体化されたものとして、最も圧縮可能なかたちで符号化するのか、という問いである。T-10が関わるのはパッチ間コヒーレンスの機構であり、T-11が関わるのは単一ストリーム内部における圧縮シグネチャである。T-10はT-11の上に直接構築されている。すなわち、ここで圧縮上の優位を確立するのに用いられるのと同じMDLの記述長比較が、T-10ではパッチ間の不整合が指数関数的に抑制されることを証明するために活用されている。

§7. 総括

T-11 の成果物

導入補題（ミュラー収束）。ソロモノフ収束 [61] およびそのマルチエージェント拡張 [62] を形式的に導入し、OPT の記法で再定式化した。これらは数学的な背骨を与える。すなわち、十分な自己状態データを担ういかなる部分構造についても、その一人称的進化は、自らの振る舞いを生成している計算可能世界へと収束する。
定理 T-11（圧縮境界 — 草案）。明示的な二部構成の MDL 比較により、見かけ上のエージェントを独立に実体化された一次観測者として扱うことは、恣意的な行動仕様よりも厳密に短い記述を与え、その優位は観測時間に対して線形に増大することが示される。
系 T-11a（漸近的優越 — 草案）。圧縮上の優位は T \to \infty において無界となり、独立実体化は、長い時間地平にわたって観測されるあらゆるエージェントに対して、圧倒的に MDL 最適な記述となる。
P-4 との統合。現象的残余 (\Delta_{\text{self}} > 0) は、見かけ上のエージェントを、複雑ではあるがエージェント性をもたないシステムから区別する形式的指標として同定され、構造的系の適用範囲を、真正な自己参照的ボトルネック構造をもつ存在に限定する。
ミュラー再解釈。ミュラーの非独我論的結論は、OPT の存在論的枠組みの内部で再解釈される。同一の数学的結果が、共有現実の創発をめぐる議論ではなく、圧縮論証の基礎づけとして機能するのである。

残された未解決項目

厳密な \bar{I}_T の特徴づけ。特定のエージェント類（たとえば、有界合理的エージェント、自由エネルギー最小化主体）について \bar{I}_T の下界を与え、数値的に具体的な圧縮上の優位を提示すること。
有限時間補正。漸近結果（T-11a）は大きな T に対する優越を保証するが、明示的定数を伴う有限時間境界が得られれば、実践的適用可能性はいっそう強化される。
非二値アルファベットへの拡張。式 (L-1)–(L-3) は二値列に対して述べられている。OPT の R(D) 枠組み（T-1）に関係する連続値測度への拡張には、技術的な慎重さが必要である。

本付録は theoretical_roadmap.pdf と並行して維持されている。参考文献：Müller [61, 62], Li & Vitányi [45], Solomonoff (1964), 定理 T-4（付録 T-4）, 定理 P-4（付録 P-4）, プレプリント §8.2。