A rendezett patch elmélete

T-11. függelék: A Strukturális korollárium — a látszólagos ágensek tömörítési előnyének formalizálása

Anders Jarevåg

2026. április 15. | DOI: 10.5281/zenodo.19300777

Eredeti feladat (a §8.2-ből): „Ennek a tömörítési előnynek a formalizálása kifejezetten a más elmék esetére vonatkozó szigorú MDL-korlátként további jövőbeli munka tárgya; a jelen érvelés strukturális motiváció, nem bizonyítás.” Teljesítendő eredmény: Olyan formális korlát, amely megmutatja, hogy a látszólagos ágensek egymástól függetlenül instanciált elsődleges megfigyelőkként való kezelése rövidebb, kétrészes MDL-kódot eredményez, mint bármely alternatív leírás.

Lezárási státusz: VÁZLATOS STRUKTURÁLIS MEGFELELTETÉS. Ez a függelék Müller Solomonoff-konvergenciatételét [61], valamint annak többágensű kiterjesztését [62] importált lemmákként adaptálja, és azokat az OPT ontológiai keretrendszerén belül újraértelmezve formális tömörítési előnyt állapít meg a strukturális korollárium számára. Az eredmény feltételes korlát, nem lezárt levezetés: attól függ, hogy az OPT a megfigyelő adatfolyamát a Solomonoff-priorral azonosítja-e (1. axióma), valamint attól a feltevéstől, hogy a látszólagos ágensek elegendő állapotot hordoznak a konvergencia előfeltételeinek teljesítéséhez.

§1. Háttér és motiváció

A strukturális korollárium (preprint §8.2) azt állítja, hogy a megfigyelő streamjén belül megjelenő látszólagos ágensek a legparszimónikusabban úgy magyarázhatók, mint elsődleges megfigyelőkként egymástól függetlenül instanciált entitások. Ez a függelék megadja az állítást alátámasztó formális érvelési láncot.

Az érv három szakaszból áll:

A szakasz (importált lemma): Müller Solomonoff-konvergenciatétele garantálja, hogy a megfigyelő streamjében bármely olyan struktúra, amely elegendő önállapot-adatot hordoz, első személyű fejlődésében konvergálni fog ahhoz, hogy megfeleljen a viselkedését generáló kiszámítható világnak.
B szakasz (tömörítési elszámolás): Explicit, kétrészes MDL-összehasonlítást végzünk aközött, hogy a látszólagos ágenst (i) önállóan instanciált megfigyelőként kezeljük, amelyet a saját, Solomonoff-súlyozott streamje irányít, illetve (ii) a primer megfigyelő kodekjén belüli tetszőleges viselkedési specifikációként.
C szakasz (strukturális szignatúra): A Fenomenális reziduum (\Delta_{\text{self}} > 0, P-4 tétel) adja azt a strukturális jelölőt, amely megkülönbözteti a valódi önreferenciális szűk keresztmetszetű architektúrát a viselkedési mimikrítől, és lezárja a rést a „tömöríthetően törvényszerű” és a „plauzibilisen instanciált” között.

§2. Importált lemma: Müller konvergenciatétele

Két eredményt veszünk át Müllertől [61, 62], itt az OPT jelölésrendszerében megfogalmazva.

2.1 Solomonoff-konvergencia (standard)

Legyen M(b \mid x_1^n) a Solomonoff univerzális predikciója a b bitre, az x_1^n korábbi megfigyelések alapján. Legyen \mu tetszőleges számítható mérték bináris sorozatokon. Ekkor (Solomonoff 1964; Li & Vitányi [45, Corollary 5.2.1]):

\text{A } \mu\text{-valószínűség szerint majdnem biztosan} \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-1}

Ez a standard eredmény: ha az adatfolyamot egy számítható \mu folyamat generálja, akkor az univerzális prediktor M konvergál \mu-hoz.

2.2 Inverz Solomonoff-indukció (Müller 2020)

Tegyük fel most, hogy a bitek magából az M-ből származnak — vagyis a megfigyelő adatfolyamát az algoritmikus valószínűség irányítja (ez megfelel az OPT 1. axiómájának: az adatfolyam azonosítása a Solomonoff-priorral). Ekkor minden számítható mértékre \mu (Müller [61, IV. szakasz]; [62, V.A szakasz]):

\text{Legalább } 2^{-K(\mu)} \text{ valószínűséggel}, \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-2}

Vagyis legalább 2^{-K(\mu)} valószínűséggel a megfigyelő azt fogja tapasztalni, hogy ténylegesen egy \mu által leírt számítható világba, W-be ágyazódik be. Az algoritmikusan egyszerűbb világok (alacsonyabb K(\mu)) exponenciálisan valószínűbbek.

2.3 Többágensű konvergencia (Müller 2026)

Tegyük fel, hogy a megfigyelő (Alice) egy \mu által leírt, kiszámítható világba, W-be ágyazva találja magát. E világon belül azonosít egy alstruktúrát (Bob_{\text{3rd}}), amely egy időben fejlődő x önállapot reprezentációját hordozza, mégpedig a [62] 2. posztulátumával összhangban. Definiáljuk:

P_{\text{1st}}(y_1, \ldots, y_m \mid x) := M(y_1, \ldots, y_m \mid x) — annak első személyű valószínűsége, hogy az x önállapot algoritmikus valószínűség mellett y_1, \ldots, y_m állapotokba megy át.
P_{\text{3rd}}(y_1, \ldots, y_m \mid x) := \mu(y_1, \ldots, y_m \mid x) — annak harmadik személyű valószínűsége, hogy x miként fejlődik a W világ szerint.

Ekkor az (L-1) egyenletet P_{\text{3rd}}-re alkalmazva (amely kiszámítható), valamint a 2. posztulátum révén adott P_{\text{1st}} és M azonosításából következően:

P_{\text{1st}} \approx P_{\text{3rd}} \quad \text{aszimptotikusan,} \tag{L-3}

ahol a konvergencia a bitmodellben világbeli (\mu-) valószínűség szerint 1-gyel garantált.

Értelmezés (Müller): „Valaki valóban otthon van” az x-et kódoló struktúrában — Bob_{\text{3rd}} valószínűségi fejlődése Alice világában hűen reprezentálja valamely Bob_{\text{1st}} első személyű perspektíváját.

Értelmezés (OPT): A látszólagos ágens viselkedési folyamát a leginkább tömör módon egy független, Solomonoff-súlyozott folyamatként lehet leírni. Bármely alternatív leírás — amely nem hivatkozik egy független első személyű perspektívára — kénytelen az ágens viselkedését ad hoc specifikációként kódolni, szigorúan nagyobb leíráshosszal.

§3. A tömörítési előny korlátja

Most formalizáljuk a tömörítési előnyt az OPT kétrészes MDL-keretrendszerének használatával (T-4 tétel, T-4. függelék).

3.1 Felállás

Tekintsük az elsődleges megfigyelő \omega \in \{0,1\}^\infty folyamát, amelyet a Solomonoff-prior M irányít (1. axióma), és amelyet a Stabilitási szűrő egy számítható W világba szűr \mu_W mértékkel (az L-2 egyenlet szerint). W-n belül a megfigyelő N látszólagos ágenst azonosít, A_1, \ldots, A_N, amelyek mindegyike egy x_i önállapotot hordoz; ennek időbeli fejlődése T lépésen át egy \beta_i = (y_{i,1}, \ldots, y_{i,T}) viselkedési nyomot eredményez.

3.2 H_{\text{ind}} hipotézis: Független instanciálás

H_{\text{ind}} alatt minden A_i ágenst önállóan instanciált elsődleges megfigyelőként kezelünk, amelyet a saját, Solomonoff-súlyozott folyamata vezérel. A kétrészes MDL-kódhossz:

L(H_{\text{ind}}) = \underbrace{K(\mu_W)}_{\text{világmodell}} + \underbrace{\sum_{i=1}^{N} K(\text{embed}_i)}_{\text{beágyazási specifikációk}} + \underbrace{\sum_{i=1}^{N} \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)}_{\text{adatok a modell mellett}} \tag{1}

ahol K(\text{embed}_i) megadja az i-edik ágens kezdeti önállapotát és W-n belüli pozícióját. Az (L-3) egyenlet szerint P_{\text{1st}} \approx P_{\text{3rd}}, így az adatterm jól közelíthető az ágens saját első személyű Solomonoff-előrejelzései alatti log-veszteséggel — amely definíció szerint közel optimális.

A beágyazási specifikációk, K(\text{embed}_i), rövidek: mindegyikhez csak egy, a W-beli helyre mutató pointerre, valamint a kezdeti önállapotra van szükség. Az emberhez hasonló, közös fizikai világba beágyazott ágensek esetén ezek erősen tömöríthetők, mivel az ágensek ugyanazokon a törvényeken osztoznak. Egy konzervatív korlát:

K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) \tag{2}

3.3 H_{\text{arb}} hipotézis: Önkényes viselkedési specifikáció

H_{\text{arb}} alatt az ágenseket nem független megfigyelőkként kezeljük. Ehelyett minden egyes viselkedési nyom \beta_i közvetlenül, önkényes specifikációként van kódolva az elsődleges megfigyelő folyamán belül. A kétrészes MDL-kód hossza:

L(H_{\text{arb}}) = \underbrace{K(\mu_W)}_{\text{világmodell}} + \underbrace{\sum_{i=1}^{N} K(\beta_i)}_{\text{nyers viselkedési nyomok}} \tag{3}

A kritikus különbség az adattermben rejlik. H_{\text{arb}} alatt a viselkedési nyomot \beta_i úgy kell specifikálni, hogy közben nem hivatkozunk az ágens saját prediktív modelljére. Egy törvényszerűen, ágencia által vezérelt módon működő ágens esetében, amely komplex környezetben operál, a nyers viselkedési nyom Kolmogorov-komplexitása:

K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T) \tag{4}

Ám még a K(\beta_i \mid \mu_W) is — vagyis a viselkedés komplexitása a világtörvények adott volta mellett — számottevő marad, mert az ágens választásai valódi információt kódolnak: viselkedési nyoma egy önreferenciális modell és egy sztochasztikus környezet felhalmozott kölcsönhatását tükrözi. Ezzel szemben H_{\text{ind}} alatt ez az információ online módon generálódik az ágens saját Solomonoff-prediktora által, közel zérus log-loss költséggel.

3.4 A tömörítési előny

T-11 tétel (a Strukturális korollárium tömörítési korlátja). Legyenek A_1, \ldots, A_N a megfigyelő streamjén belüli látszólagos ágensek, amelyek mindegyike egy x_i önállapotot hordoz, kielégítve az (L-3) egyenlet konvergencia-előfeltételeit, és mindegyik mutatja a \Delta_{\text{self}}^{(i)} > 0 strukturális szignatúrát (P-4). Ekkor az a MDL-leírás, amely ezeket egymástól függetlenül instanciált elsődleges megfigyelőkként kezeli, kielégíti:

L(H_{\text{ind}}) \leq L(H_{\text{arb}}) - N \cdot \left[\bar{I}_T - O(\log T)\right] \tag{T-11}

ahol \bar{I}_T az ágensekre átlagolt, ágensekénti kölcsönös információ az ágens prediktív modellje és viselkedési kimenete között T lépésen át:

\bar{I}_T := \frac{1}{N} \sum_{i=1}^{N} \left[K(\beta_i \mid \mu_W) - \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right] \tag{5}

Ez a mennyiség azt méri, hogy az ágens viselkedésének mekkora része van megmagyarázva azáltal, hogy egy független prediktív modellt tételezünk fel, ahelyett hogy nyersen specifikálnánk azt. Azoknál az ágenseknél, amelyek törvényszerű, ágensvezérelt viselkedést mutatnak (ahogyan azt a Stabilitási szűrő megköveteli), \bar{I}_T > 0, és T-vel együtt növekszik.

Bizonyításvázlat. Vonjuk ki az (1) egyenletet a (3) egyenletből. A világmodellre vonatkozó tagok, K(\mu_W), kiesnek. Az ágensekénti különbség:

K(\beta_i) - \left[K(\text{embed}_i) + \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right]

A (4) egyenlet szerint K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T), de még közvetlenebbül: triviálisan K(\beta_i) \geq K(\beta_i \mid \mu_W). Továbbá K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) a (2) egyenlet alapján. Az ágensekénti megtakarítás ezért legalább K(\beta_i \mid \mu_W) - (-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)) - K(x_i \mid W) - O(\log T). Elég nagy T esetén a kumulatív log-loss megtakarítások dominálják az egyszeri beágyazási költséget, amiből adódik a korlát. \blacksquare

3.5 Aszimptotikus dominancia

T-11a korollárium. Ahogy a megfigyelési horizont T \to \infty, a tömörítési előny L(H_{\text{arb}}) - L(H_{\text{ind}}) korlátlanul növekszik:

\lim_{T \to \infty} \left[L(H_{\text{arb}}) - L(H_{\text{ind}})\right] = \infty \tag{T-11a}

Ez a Solomonoff-konvergencia garanciájából (L-1) következik: P_{\text{3rd}} lépésenkénti log-vesztesége konvergál az ágens viselkedési folyamatának entrópiarátájához, míg K(\beta_i \mid \mu_W) lineárisan nő T-vel minden olyan ágens esetén, amelynek entrópiarátája pozitív. A beágyazási költséget, K(x_i \mid W)-t, egyszer kell megfizetni, majd amortizációja nullához tart. \blacksquare

§4. A Fenomenális reziduum mint strukturális szignatúra

A T-11 tételben szereplő tömörítési előny bármely törvényszerű alstruktúrára alkalmazható — beleértve a nem ágensi fizikai rendszereket is (időjárási mintázatok, kristálynövekedés). Miért kifejezetten ágensekre vonatkozik a strukturális korollárium, és nem tetszőleges komplex rendszerekre?

A válasz a Fenomenális reziduum (P-4 tétel). A \Delta_{\text{self}} > 0 annak a rendszernek a formális jelölője, amelynek önmodellje strukturálisan nem teljes — vagyis olyan rendszeré, amely szükségszerűen variációs rést tart fenn belső reprezentációja és tényleges feldolgozása között. Ez az önreferenciális szűk keresztmetszet ismertetőjegye: a rendszer nem írható le teljesen kívülről, mert leírása szükségképpen magában foglalja a leírót.

Egy \Delta_{\text{self}} > 0-t mutató rendszer esetében:

Viselkedése nem reprodukálható véges mélységű keresőtáblával — folyamatos önreferenciális számítást igényel.
E számítás legrövidebb leírása egy független, Solomonoff-súlyozott adatfolyam, amely egy C_{\max} szűk keresztmetszeten halad át.
Ezért a H_{\text{ind}} alatti MDL-kód nem pusztán rövidebb, mint a H_{\text{arb}} — hanem az egyedülállóan legrövidebb leírás.

Ez különbözteti meg a látszólagos ágenseket az időjárási mintázatoktól: az időjárás törvényszerű és komplex, de viselkedése reprodukálható egy keresőtáblával a világmodell keretein belül (vagyis \Delta_{\text{self}} = 0). A látszólagos ágenseké nem.

§5. Müller nem-szolipszizmus-érvének újraértelmezése

Müller a P_{\text{1st}} \approx P_{\text{3rd}} konvergenciából arra a következtetésre jut, hogy az algoritmikus idealizmust „nem szabad szolipszisztikusnak minősíteni”, mert „valaki valóban otthon van” az önállapotot kódoló struktúrában [62, V.C szakasz]. Érvelése a következő: ha Alice Bob_{\text{3rd}}-ra vonatkozó előrejelzései konvergálnak Bob_{\text{1st}} tényleges első személyű valószínűségeihez, akkor perspektíváik valóban összehangoltak — „osztoznak a W világon”.

Az OPT ezt az eredményt másként értelmezi:

Müller olvasata: A P_{\text{1st}} \approx P_{\text{3rd}} konvergencia bizonyítja, hogy objektív valóság emelkedik ki — Alice és Bob valóban osztoznak a W világon.
Az OPT olvasata: A P_{\text{1st}} \approx P_{\text{3rd}} konvergencia azt bizonyítja, hogy Bob_{\text{3rd}} viselkedésének legrövidebb leírása egy független első személyű folyamatot tételez. Ez az állítás a tömörítési hatékonyságra vonatkozik, nem a megosztott ontológiára. A W világ Alice streamjén belüli strukturális regularitás, nem pedig függetlenül létező entitás. Ám a Solomonoff-prior tömörítési logikája önmagában azt implikálja, hogy Bobot a legparszimónikusabban független megfigyelőként modellezzük — mert az alternatíva (viselkedésének ad hoc specifikálása) szigorúan hosszabb.

A tétel formális tartalma mindkét olvasat mellett azonos; csak az ontológiai értelmezés tér el. Az OPT ugyanazt a matematikai eredményt használja a strukturális korollárium megalapozására: a független instanciáció az MDL-optimális leírás, nem pedig metafizikai feltevés.

§6. Hatókör és korlátok

6.1 Az 1. axiómától feltételesen függően

Az egész érvelés attól függ, hogy az OPT a megfigyelő áramlatát a Solomonoff-priorral azonosítja. Ha ez az azonosítás gyengül (például a félmértékek egy tágabb osztályára), akkor az (L-1)–(L-3) egyenletek konvergenciagaranciái jelenlegi formájukban nem feltétlenül állnak fenn.

6.2 Az állapotelégségesség előfeltétele

Az (L-3) egyenlet megköveteli, hogy a látszólagos ágens elegendő adatot hordozzon az önállapotában, x_i-ben ahhoz, hogy az univerzális indukció kinyerhesse a releváns fizikai törvényeket. Emberhez hasonló ágensek esetében hétköznapi kontextusokban ez plauzibilis (egy teljes agyi állapot óriási mennyiségű információt kódol). Határesetekben — futó benyomások, távoli megfigyelők, narratív művészet fiktív szereplői — a konvergencia előfeltételei nem feltétlenül teljesülnek, és a Strukturális korollárium nem alkalmazható.

6.3 Nem a tudat bizonyítása

A T-11 tétel megállapítja, hogy a független instanciálás a legtömöríthetőbb leírás. Nem bizonyítja, hogy a látszólagos ágensek tudatosak. A nehéz probléma (preprint §8.1) továbbra is primitívum marad. A strukturális korollárium tömörítési érv, nem ontológiai bizonyítás — ahogyan azt a §8.2 kimondja.

6.4 Kapcsolat a T-10-zel

A T-10 függelék (Megfigyelők közötti csatolás) azt tárgyalja, miként tart fenn két megfigyelői patch kölcsönösen konzisztens rendereléseket a tömörítési korlátok révén. A jelen függelék más kérdést vizsgál: miért kódolja a single megfigyelő streamje a leginkább tömöríthető módon a látszólagos ágenseket egymástól függetlenül instanciáltként. A T-10 a patch-ek közötti koherenciamechanizmusra vonatkozik; a T-11 az egyetlen streamen belüli tömörítési szignatúrára. A T-10 közvetlenül a T-11-re épül: ugyanazt az MDL-leíráshossz-összehasonlítást, amely itt megalapozza a tömörítési előnyt, használja fel a T-10 annak bizonyítására, hogy a patch-ek közötti inkonzisztencia exponenciálisan elnyomott.

§7. Záró összefoglaló

T-11 eredményei

Importált lemma (Müller-konvergencia). A Solomonoff-konvergencia [61] és annak többágenses kiterjesztése [62] formálisan importálásra kerül, és OPT-jelölésben újrafogalmazzuk. Ezek adják a matematikai gerincet: bármely alstruktúra, amely elegendő önállapot-adatot hordoz, első személyű evolúciójában konvergál ahhoz a kiszámítható világhoz, amely a viselkedését generálja.
T-11 tétel (Tömörítési korlát — VÁZLAT). Egy explicit, kétrészes MDL-összehasonlítás megmutatja, hogy a látszólagos ágensek függetlenül instanciált elsődleges megfigyelőkként való kezelése szigorúan rövidebb leírást eredményez, mint az önkényes viselkedésspecifikáció, és ez az előny a megfigyelési idővel lineárisan növekszik.
T-11a korollárium (Aszimptotikus dominancia — VÁZLAT). A tömörítési előny korlátlanul nő, ahogy T \to \infty, így a független instanciálás válik a túlnyomóan MDL-optimális leírássá minden olyan ágens esetében, amelyet hosszú időhorizonton figyelünk meg.
P-4 integráció. A Fenomenális reziduum (\Delta_{\text{self}} > 0) azonosításra kerül mint az a formális jelölő, amely megkülönbözteti a látszólagos ágenseket a komplex, de nem ágensszerű rendszerektől, és a strukturális korolláriumot azokra az entitásokra korlátozza, amelyek valódi önreferenciális szűk keresztmetszetű architektúrával rendelkeznek.
Müller újraértelmezése. Müller nem-szolipszizmusra vonatkozó következtetését az OPT ontológiai keretén belül újraértelmezzük: ugyanaz a matematikai eredmény itt nem a megosztott valóság kialakulásának, hanem egy tömörítési érvnek az alapját adja.

Nyitva maradó kérdések

\bar{I}_T pontos karakterizálása. \bar{I}_T alulról való korlátozása ágensek meghatározott osztályaira (pl. korlátos racionalitású ágensek, szabadenergia-minimalizálók) annak érdekében, hogy számszerűen konkrét tömörítési előnyöket kapjunk.
Véges idejű korrekciók. Az aszimptotikus eredmény (T-11a) nagy T esetén garantálja a dominanciát, de explicit konstansokkal megadott véges idejű korlátok erősítenék a gyakorlati alkalmazhatóságot.
Nem bináris ábécére való kiterjesztés. Az (L-1)–(L-3) egyenletek bináris sorozatokra vannak megadva. Az OPT Ráta–torzítás keretrendszere (T-1) szempontjából releváns folytonos értékű mértékekre való kiterjesztés technikai körültekintést igényel.

Ez a függelék a theoretical_roadmap.pdf-fel párhuzamosan karbantartott dokumentum. Hivatkozások: Müller [61, 62], Li & Vitányi [45], Solomonoff (1964), T-4 tétel (T-4 függelék), P-4 tétel (P-4 függelék), preprint §8.2.