Teorie uspořádaného patche

Dodatek T-11: Strukturální korolár — formalizace kompresní výhody zdánlivých agentů

Anders Jarevåg

15. dubna 2026 | DOI: 10.5281/zenodo.19300777

Původní úkol (z §8.2): „Formalizace této kompresní výhody jako rigorózní meze MDL specificky pro případ druhých myslí zůstává úkolem budoucí práce; předložený argument je strukturální motivací, nikoli důkazem.“ Výstup: Formální mez ukazující, že zacházet se zdánlivými agenty jako s nezávisle instanciovanými primárními pozorovateli vede ke kratšímu dvoudílnému kódu MDL než jakýkoli alternativní popis.

Stav uzavření: NÁVRH STRUKTURÁLNÍ KORESPONDENCE. Tento dodatek přebírá jako importovaná lemmata Müllerovu Solomonoffovu větu o konvergenci [61] a její multiagentní rozšíření [62], reinterpretovaná v ontologickém rámci OPT, aby stanovil formální kompresní výhodu pro strukturální korolár. Výsledek je podmíněnou mezí, nikoli uzavřeným odvozením: závisí na tom, že OPT ztotožňuje proud pozorovatele se Solomonoffovou apriorní pravděpodobností (Axiom 1), a na předpokladu, že zdánliví agenti nesou dostatečný stav ke splnění předpokladů konvergence.

§1. Pozadí a motivace

Strukturální korolár (preprint §8.2) tvrdí, že zdánlivé agenty uvnitř proudu pozorovatele lze nejúsporněji vysvětlit jejich nezávislou instanciací jako primárních pozorovatelů. Tento dodatek předkládá formální řetězec argumentů, který toto tvrzení podpírá.

Argument má tři fáze:

Fáze A (importované lemma): Müllerova věta o Solomonoffově konvergenci zaručuje, že jakákoli struktura v proudu pozorovatele, která nese dostatek dat o vlastním stavu, bude mít svůj vývoj z perspektivy první osoby konvergující tak, aby odpovídal vypočitatelnému světu generujícímu její chování.
Fáze B (účtování komprese): Provádíme explicitní dvousložkové srovnání MDL mezi tím, když se se zdánlivým agentem zachází jako s (i) nezávisle instanciovaným pozorovatelem řízeným vlastním proudem váženým Solomonoffovou univerzální semimírou, oproti (ii) libovolné behaviorální specifikaci uvnitř kodeku primárního pozorovatele.
Fáze C (strukturální signatura): Fenomenální reziduum (\Delta_{\text{self}} > 0, Věta P-4) poskytuje strukturální marker, který odlišuje skutečnou sebereferenční architekturu úzkého hrdla od behaviorální mimikry, a tím uzavírá mezeru mezi „kompresně zákonitým“ a „věrohodně instanciovaným“.

§2. Převzaté lemma: Müllerova věta o konvergenci

Přebíráme dva výsledky od Müllera [61, 62], zde vyjádřené v notaci OPT.

2.1 Solomonoffova konvergence (standardní)

Nechť M(b \mid x_1^n) označuje Solomonoffovu univerzální predikci pro bit b při daných předchozích pozorováních x_1^n. Nechť \mu je libovolná vyčíslitelná míra na binárních posloupnostech. Pak platí (Solomonoff 1964; Li & Vitányi [45, Corollary 5.2.1]):

\text{S } \mu\text{-pravděpodobností jedna platí,} \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-1}

Jde o standardní výsledek: je-li datový proud generován vyčíslitelným procesem \mu, univerzální prediktor M konverguje k \mu.

2.2 Inverzní Solomonoffova indukce (Müller 2020)

Nyní předpokládejme, že bity jsou generovány samotným M — tj. že proud pozorovatele je řízen algoritmickou pravděpodobností (to odpovídá Axiomu 1 OPT: ztotožnění proudu se Solomonoffovým priorem). Pak pro každou vyčíslitelnou míru \mu (Müller [61, Sec. IV]; [62, Sec. V.A]) platí:

\text{S pravděpodobností} \geq 2^{-K(\mu)}, \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-2}

To znamená, že s pravděpodobností alespoň 2^{-K(\mu)} se pozorovatel ocitne fakticky vnořen do vyčíslitelného světa W popsaného mírou \mu. Algoritmicky jednodušší světy (s nižším K(\mu)) jsou exponenciálně pravděpodobnější.

2.3 Konvergence více agentů (Müller 2026)

Předpokládejme, že se pozorovatelka (Alice) ocitá vnořena do vyčíslitelného světa W popsaného pomocí \mu. V rámci W identifikuje substrukturu (Bob_{\text{3rd}}), která nese reprezentaci vlastního stavu x, jenž se v čase vyvíjí způsobem slučitelným s postulátem 2 v [62]. Definujme:

P_{\text{1st}}(y_1, \ldots, y_m \mid x) := M(y_1, \ldots, y_m \mid x) — pravděpodobnost z první osoby, že vlastní stav x přejde na y_1, \ldots, y_m podle algoritmické pravděpodobnosti.
P_{\text{3rd}}(y_1, \ldots, y_m \mid x) := \mu(y_1, \ldots, y_m \mid x) — pravděpodobnost z třetí osoby toho, jak se x vyvíjí podle světa W.

Pak podle rovnice (L-1) aplikované na P_{\text{3rd}} (které je vyčíslitelné) a ztotožnění P_{\text{1st}} s M prostřednictvím postulátu 2 platí:

P_{\text{1st}} \approx P_{\text{3rd}} \quad \text{asymptotically,} \tag{L-3}

přičemž konvergence je v bitovém modelu zaručena s jednotkovou světskou (\mu-) pravděpodobností.

Interpretace (Müller): „Někdo je v této struktuře skutečně doma“ — pravděpodobnostní vývoj Bob_{\text{3rd}} v Alicině světě věrně reprezentuje perspektivu z první osoby nějakého Bob_{\text{1st}}.

Interpretace (OPT): Behaviorální proud zdánlivého agenta je nejúsporněji popsán jako nezávislý proces vážený Solomonoffovou univerzální semimírou. Jakýkoli alternativní popis — takový, který nevyvolává nezávislou perspektivu z první osoby — musí chování agenta zakódovat jako ad hoc specifikaci, při striktně větší délce popisu.

§3. Mez kompresní výhody

Nyní formalizujeme kompresní výhodu pomocí dvoudílného rámce MDL OPT (teorém T-4, dodatek T-4).

3.1 Nastavení

Uvažujme proud primárního pozorovatele \omega \in \{0,1\}^\infty, řízený Solomonoffovým priorem M (Axiom 1) a filtrovaný přes Filtr stability do vypočitatelného světa W s mírou \mu_W (podle rovnice L-2). V rámci W pozorovatel identifikuje N zdánlivých agentů A_1, \ldots, A_N, z nichž každý nese vlastní stav x_i, jehož časový vývoj během T kroků vytváří behaviorální stopu \beta_i = (y_{i,1}, \ldots, y_{i,T}).

3.2 Hypotéza H_{\text{ind}}: Nezávislá instanciace

Za předpokladu H_{\text{ind}} je každý agent A_i chápán jako nezávisle instanciovaný primární pozorovatel řízený vlastním proudem váženým Solomonoffovou univerzální semimírou. Dvoudílná délka MDL kódu je:

L(H_{\text{ind}}) = \underbrace{K(\mu_W)}_{\text{model světa}} + \underbrace{\sum_{i=1}^{N} K(\text{embed}_i)}_{\text{specifikace vložení}} + \underbrace{\sum_{i=1}^{N} \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)}_{\text{data daná modelem}} \tag{1}

kde K(\text{embed}_i) určuje počáteční vlastní stav agenta i a jeho pozici v rámci W. Podle rovnice (L-3) platí P_{\text{1st}} \approx P_{\text{3rd}}, takže datový člen je dobře aproximován logaritmickou ztrátou podle agentových vlastních prvoosobních Solomonoffových predikcí — které jsou z definice blízké optimu.

Specifikace vložení K(\text{embed}_i) jsou krátké: každá vyžaduje pouze ukazatel na lokaci v W plus počáteční vlastní stav. U agentů podobných lidem, vložených do sdíleného fyzikálního světa, jsou tyto specifikace vysoce komprimovatelné, protože agenti sdílejí tytéž zákony. Konzervativní odhad:

K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) \tag{2}

3.3 Hypotéza H_{\text{arb}}: Libovolná behaviorální specifikace

V rámci H_{\text{arb}} nejsou agenti chápáni jako nezávislí pozorovatelé. Místo toho je každá behaviorální stopa \beta_i zakódována přímo jako libovolná specifikace uvnitř proudu primárního pozorovatele. Dvoudílná délka kódu MDL je:

L(H_{\text{arb}}) = \underbrace{K(\mu_W)}_{\text{model světa}} + \underbrace{\sum_{i=1}^{N} K(\beta_i)}_{\text{surové behaviorální stopy}} \tag{3}

Kritický rozdíl spočívá v datovém členu. V rámci H_{\text{arb}} musí být behaviorální stopa \beta_i specifikována bez odvolání na vlastní prediktivní model agenta. U zákonitě se chovajícího, agentivitou řízeného agenta operujícího v komplexním prostředí je Kolmogorovova komplexita surové behaviorální stopy:

K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T) \tag{4}

Avšak i K(\beta_i \mid \mu_W) — tedy komplexita chování za daných zákonů světa — zůstává značná, protože volby agenta nesou skutečnou informaci: jeho behaviorální stopa odráží akumulovanou interakci sebereferenčního modelu se stochastickým prostředím. Naproti tomu v rámci H_{\text{ind}} je tato informace generována online vlastním Solomonoffovým prediktorem agenta při téměř nulových nákladech log-loss.

3.4 Výhoda komprese

Věta T-11 (Strukturální korolár: mez komprese). Nechť A_1, \ldots, A_N jsou zdánliví agenti v rámci proudu pozorovatele, přičemž každý nese vlastní stav x_i splňující předpoklady konvergence z rovnice (L-3) a každý vykazuje strukturální signaturu \Delta_{\text{self}}^{(i)} > 0 (P-4). Pak MDL popis, který s nimi zachází jako s nezávisle instanciovanými primárními pozorovateli, splňuje:

L(H_{\text{ind}}) \leq L(H_{\text{arb}}) - N \cdot \left[\bar{I}_T - O(\log T)\right] \tag{T-11}

kde \bar{I}_T je průměrná vzájemná informace na agenta mezi prediktivním modelem agenta a jeho behaviorálním výstupem v průběhu T kroků:

\bar{I}_T := \frac{1}{N} \sum_{i=1}^{N} \left[K(\beta_i \mid \mu_W) - \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right] \tag{5}

Tato veličina měří, jak velká část chování agenta je vysvětlena tím, že předpokládáme nezávislý prediktivní model, namísto toho, abychom je specifikovali přímo v surové podobě. U agentů vykazujících zákonité, agentivitou řízené chování (jak vyžaduje Filtr stability) platí, že \bar{I}_T > 0 a roste s T.

Náčrt důkazu. Odečtěte rovnici (1) od rovnice (3). Členy světového modelu K(\mu_W) se vyruší. Rozdíl na agenta je:

K(\beta_i) - \left[K(\text{embed}_i) + \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right]

Podle rovnice (4) platí K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T), ale ještě přímočařeji: K(\beta_i) \geq K(\beta_i \mid \mu_W) triviálně. A K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) podle rovnice (2). Úspora na agenta je tedy přinejmenším K(\beta_i \mid \mu_W) - (-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)) - K(x_i \mid W) - O(\log T). Pro dostatečně velké T kumulativní úspory v log-loss převáží jednorázové náklady na vložení, čímž vzniká daná mez. \blacksquare

3.5 Asymptotická dominance

Korolár T-11a. Jak se horizont pozorování T \to \infty, kompresní výhoda L(H_{\text{arb}}) - L(H_{\text{ind}}) roste bez omezení:

\lim_{T \to \infty} \left[L(H_{\text{arb}}) - L(H_{\text{ind}})\right] = \infty \tag{T-11a}

To plyne ze Solomonoffovy garance konvergence (L-1): logaritmická ztráta na krok u P_{\text{3rd}} konverguje k entropické míře behaviorálního procesu agenta, zatímco K(\beta_i \mid \mu_W) roste lineárně s T u každého agenta s kladnou entropickou mírou. Náklad na vnoření K(x_i \mid W) se platí jednou a jeho amortizace klesá k nule. \blacksquare

§4. Fenomenální reziduum jako strukturální signatura

Výhoda komprese v teorému T-11 se vztahuje na jakoukoli zákonitou substrukturu — včetně neagentních fyzikálních systémů (meteorologické vzorce, růst krystalů). Proč se strukturální korolár týká specificky agentů spíše než libovolných komplexních systémů?

Odpovědí je Fenomenální reziduum (teorém P-4). \Delta_{\text{self}} > 0 je formální marker systému, jehož self-model je strukturálně neúplný — tj. systému, který nutně udržuje variační mezeru mezi svou interní reprezentací a svým skutečným zpracováním. To je charakteristický znak sebereferenčního úzkého hrdla: systém nemůže být plně popsán zvnějšku, protože jeho popis nutně zahrnuje popisujícího.

Pro systém vykazující \Delta_{\text{self}} > 0 platí:

Jeho chování nelze reprodukovat pomocí lookup tabulky konečné hloubky — vyžaduje průběžný sebereferenční výpočet.
Nejkratší popis tohoto výpočtu je nezávislý proud vážený Solomonoffovou univerzální semimírou, procházející úzkým hrdlem C_{\max}.
Proto kód MDL pod H_{\text{ind}} není pouze kratší než H_{\text{arb}} — je to jediný nejkratší popis.

Tím se zdánliví agenti odlišují od meteorologických vzorců: počasí je zákonité a komplexní, ale jeho chování lze reprodukovat lookup tabulkou v rámci modelu světa (má \Delta_{\text{self}} = 0). Zdánliví agenti to nedokážou.

§5. Reinterpretace Müllerova argumentu proti solipsismu

Müller z konvergence P_{\text{1st}} \approx P_{\text{3rd}} vyvozuje, že algoritmický idealismus „by neměl být klasifikován jako solipsistický“, protože ve struktuře kódující stav já „je někdo skutečně doma“ [62, Sec. V.C]. Jeho úvaha je následující: pokud se Aliciny predikce o Bobovi_{\text{3rd}} sbíhají se skutečnými pravděpodobnostmi z první osoby u Boba_{\text{1st}}, pak jsou jejich perspektivy skutečně sladěné — „sdílejí svět W“.

OPT tento výsledek reinterpretují odlišně:

Müllerovo čtení: Konvergence P_{\text{1st}} \approx P_{\text{3rd}} dokazuje, že se vynořuje objektivní realita — Alice a Bob skutečně sdílejí svět W.
Čtení OPT: Konvergence P_{\text{1st}} \approx P_{\text{3rd}} dokazuje, že nejkratší popis Bobova_{\text{3rd}} chování předpokládá nezávislý proces první osoby. Jde o tvrzení o efektivitě komprese, nikoli o sdílené ontologii. Svět W je strukturální regularitou uvnitř Alicina proudu, nikoli nezávisle existující entitou. Avšak samotná kompresní logika Solomonoffovy apriorní semimíry sama implikuje, že Bob je nejúsporněji modelován jako nezávislý pozorovatel — protože alternativa (specifikovat jeho chování ad hoc) je striktně delší.

Formální obsah věty je při obou čteních totožný; liší se pouze ontologická interpretace. OPT používá tentýž matematický výsledek k odvození Strukturálního koroláru: nezávislá instanciace je MDL-optimálním popisem, nikoli metafyzickým předpokladem.

§6. Rozsah a omezení

6.1 Podmíněno axiomem 1

Celý argument závisí na tom, že OPT ztotožňuje proud pozorovatele se Solomonoffovým priorem. Pokud je toto ztotožnění oslabeno (např. na širší třídu semiměr), záruky konvergence rovnic (L-1)–(L-3) nemusí v současné podobě platit.

6.2 Předpoklad dostatečnosti stavu

Rovnice (L-3) vyžaduje, aby zdánlivý agent nesl ve svém vlastním stavu x_i „dostatek dat“, aby z něj univerzální indukce mohla extrahovat relevantní fyzikální zákony. U lidsky podobných agentů v každodenních kontextech je to plausibilní (úplný stav mozku kóduje obrovské množství informací). U hraničních případů — letmých dojmů, vzdálených pozorovatelů, fiktivních postav v narativním umění — nemusí být předpoklady konvergence splněny a strukturální korolár se neuplatní.

6.3 Není to důkaz vědomí

Věta T-11 stanovuje, že nezávislá instanciace je nejkomprimovatelnějším popisem. Nedokazuje, že zdánliví agenti jsou vědomí. Těžký problém (preprint §8.1) zůstává primitivem. Strukturální korolár je kompresní argument, nikoli ontologický důkaz — jak je uvedeno v §8.2.

6.4 Vztah k T-10

Dodatek T-10 (Mezi-pozorovatelská vazba) se zabývá tím, jak si dva pozorovatelské patche udržují vzájemně konzistentní rendery prostřednictvím kompresních omezení. Tento dodatek se zabývá jinou otázkou: proč proud jediného pozorovatele nejúsporněji kóduje zdánlivé agenty jako nezávisle instanciované. T-10 se týká mechanismu koherence mezi patchemi; T-11 se týká kompresní signatury uvnitř jediného proudu. T-10 přímo staví na T-11: totéž porovnání délek popisu v rámci MDL, které zde zakládá kompresní výhodu, je v T-10 využito k důkazu, že nekonzistence mezi patchemi je exponenciálně potlačena.

§7. Shrnutí závěru

Výstupy T-11

Importované lemma (Müllerova konvergence). Solomonoffova konvergence [61] a její multi-agentní rozšíření [62] jsou formálně převzaty a přepsány v notaci OPT. Poskytují matematickou páteř: jakákoli substruktura nesoucí dostatečná data o vlastním stavu má evoluci z perspektivy první osoby konvergující k vypočitatelnému světu, který generuje její chování.
Věta T-11 (Kompresní mez — NÁVRH). Explicitní dvoudílné srovnání MDL ukazuje, že zacházet se zdánlivými agenty jako s nezávisle instanciovanými primárními pozorovateli vede ke striktně kratšímu popisu než libovolná behaviorální specifikace, přičemž tato výhoda roste lineárně s dobou pozorování.
Korolár T-11a (Asymptotická dominance — NÁVRH). Kompresní výhoda je neomezená, když T \to \infty, takže nezávislá instanciace se stává jednoznačně MDL-optimálním popisem pro jakéhokoli agenta pozorovaného v dlouhém časovém horizontu.
Integrace P-4. Fenomenální reziduum (\Delta_{\text{self}} > 0) je identifikováno jako formální marker odlišující zdánlivé agenty od komplexních, avšak ne-agentních systémů, čímž omezuje strukturální korolár na entity se skutečnou sebereferenční architekturou úzkého hrdla.
Müllerova reinterpretace. Müllerův závěr o ne-solipsismu je reinterpretován v rámci ontologického rámce OPT: tentýž matematický výsledek zde zakládá argument komprese, nikoli argument vzniku sdílené reality.

Zbývající otevřené body

Přesná charakterizace \bar{I}_T. Odvození dolní meze pro \bar{I}_T u specifických tříd agentů (např. omezeně racionálních agentů, minimalizátorů volné energie), aby bylo možné stanovit numericky konkrétní kompresní výhody.
Korekce pro konečný čas. Asymptotický výsledek (T-11a) zaručuje dominanci pro velká T, avšak meze pro konečný čas s explicitními konstantami by posílily praktickou použitelnost.
Rozšíření na nebinární abecedu. Rovnice (L-1)–(L-3) jsou formulovány pro binární posloupnosti. Rozšíření na spojitě hodnotové míry relevantní pro rámec Rate-Distortion v OPT (T-1) vyžaduje technickou pečlivost.

Tato příloha je udržována souběžně s theoretical_roadmap.pdf. Reference: Müller [61, 62], Li & Vitányi [45], Solomonoff (1964), Věta T-4 (Příloha T-4), Věta P-4 (Příloha P-4), preprint §8.2.