Korrastatud patch’i teooria

Lisa T-11: Struktuurne järeldus — näiliste agentide pakkimiseelise formaliseerimine

Anders Jarevåg

15. aprill 2026 | DOI: 10.5281/zenodo.19300777

Algne ülesanne (punktist §8.2): “Selle pakkimiseelise formaliseerimine range MDL-piiranguna just teiste teadvuste juhtumi jaoks jääb edasise töö ülesandeks; käesolev argument on struktuurne motivatsioon, mitte tõestus.” Tulemus: Formaalne piirang, mis näitab, et näivate agentide käsitlemine sõltumatult instantsieeritud primaarsete vaatlejatena annab lühema kaheosalise MDL-koodi kui ükskõik milline alternatiivne kirjeldus.

Lõpetatuse staatus: STRUKTUURSE VASTAVUSE MUSTAND. See lisa kohandab Mülleri Solomonoffi koondumisteoreemi [61] ja selle mitmeagendilist laiendust [62] imporditud lemmadena, tõlgendatuna ümber OPT ontoloogilise raamistiku sees, et kehtestada struktuurse järelduse jaoks formaalne pakkimiseelis. Tulemus on tingimuslik piirang, mitte suletud tuletus: see sõltub OPT samastusest vaatleja voo ja Solomonoffi priori vahel (aksioom 1) ning eeldusest, et näivad agendid kannavad piisavat olekut, et täita koondumise eeltingimused.

§1. Taust ja motivatsioon

Struktuurne järeldus (eeltrükk §8.2) väidab, et vaatleja voo sees ilmnevaid näivaid agente seletab kõige ökonoomsemalt nende sõltumatu instantsieerimine primaarsete vaatlejatena. Käesolev lisa esitab seda väidet toetava formaalse arutlusahela.

Argumendil on kolm etappi:

Etapp A (imporditud lemma): Mülleri Solomonoffi koondumisteoreem garanteerib, et mis tahes struktuuri puhul vaatleja voos, mis kannab piisavalt andmeid omaenese seisundi kohta, koondub selle esimese isiku evolutsioon vastavusse arvutatava maailmaga, mis genereerib tema käitumise.
Etapp B (pakkimise arvestus): Teostame eksplitsiitse kaheosalise MDL-võrdluse selle vahel, kas käsitleda näivat agenti kui (i) sõltumatult instantsieeritud vaatlejat, mida juhib tema enda Solomonoffi-kaalutud voog, või kui (ii) meelevaldset käitumuslikku spetsifikatsiooni primaarse vaatleja koodekis.
Etapp C (struktuurne signatuur): Fenomenaalne jääk (\Delta_{\text{self}} > 0, teoreem P-4) annab struktuurse markeri, mis eristab ehtsat eneseviitelist pudelikaela-arhitektuuri käitumuslikust mimikrist, sulgedes lõhe „kokkusurutavalt seaduspärase” ja „usutavalt instantsieeritud” vahel.

§2. Imporditud lemma: Mülleri koondumisteoreem

Toome sisse kaks tulemust Müllerilt [61, 62], esitatuna siin OPT tähistuses.

2.1 Solomonoffi koondumine (standardne)

Olgu M(b \mid x_1^n) Solomonoffi universaalne ennustus biti b jaoks, tingituna eelnevatest vaatlustest x_1^n. Olgu \mu suvaline arvutatav mõõt binaarjadade üle. Siis (Solomonoff 1964; Li & Vitányi [45, Corollary 5.2.1]):

\text{Tõenäosusega üks mõõdu } \mu \text{ suhtes,} \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-1}

See on standardne tulemus: kui andmevoog on genereeritud arvutatava protsessi \mu poolt, siis universaalne ennustaja M koondub mõõdule \mu.

2.2 Pöörd-Solomonoffi induktsioon (Müller 2020)

Oletagem nüüd, et bitid pärinevad M-ist endast — s.t vaatleja voogu juhib algoritmiline tõenäosus (see vastab OPT Aksioomile 1: voo samastamine Solomonoffi eeljaotusega). Siis iga arvutatava mõõdu \mu korral (Müller [61, Sec. IV]; [62, Sec. V.A]):

\text{Tõenäosusega} \geq 2^{-K(\mu)}, \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-2}

See tähendab, et tõenäosusega vähemalt 2^{-K(\mu)} leiab vaatleja end faktiliselt olevat põimitud arvutatavasse maailma W, mida kirjeldab \mu. Algoritmiliselt lihtsamad maailmad (väiksem K(\mu)) on eksponentsiaalselt tõenäolisemad.

2.3 Mitme agendi konvergents (Müller 2026)

Oletame, et vaatleja (Alice) leiab end olevat põimitud arvutatavasse maailma W, mida kirjeldab \mu. Ta tuvastab W sees alastruktuuri (Bob_{\text{3rd}}), mis kannab eneseseisundi x representatsiooni, mis ajas areneb viisil, mis on kooskõlas [62] postulaadiga 2. Defineerime:

P_{\text{1st}}(y_1, \ldots, y_m \mid x) := M(y_1, \ldots, y_m \mid x) — esimese isiku tõenäosus, et eneseseisund x siirdub algoritmilise tõenäosuse alusel olekutesse y_1, \ldots, y_m.
P_{\text{3rd}}(y_1, \ldots, y_m \mid x) := \mu(y_1, \ldots, y_m \mid x) — kolmanda isiku tõenäosus sellele, kuidas x maailma W järgi areneb.

Siis, rakendades võrrandit (L-1) suurusele P_{\text{3rd}} (mis on arvutatav) ning samastades Postulaadi 2 kaudu P_{\text{1st}} ja M:

P_{\text{1st}} \approx P_{\text{3rd}} \quad \text{asümptootiliselt,} \tag{L-3}

kusjuures bitimudelis on konvergents garanteeritud maailma-sisese (\mu-) tõenäosusega üks.

Tõlgendus (Müller): struktuuris, mis kodeerib x-i, on “keegi tõepoolest kodus” — Bob_{\text{3rd}} tõenäosuslik areng Alice’i maailmas esitab ustavalt mingi Bob_{\text{1st}} esimese isiku perspektiivi.

Tõlgendus (OPT): Näiva agendi käitumuslikku voogu kirjeldab kõige kokkusurutavamalt sõltumatu Solomonoffi-kaalutud protsess. Iga alternatiivne kirjeldus — selline, mis ei eelda sõltumatut esimese isiku perspektiivi — peab agendi käitumise kodeerima ad hoc spetsifikatsioonina, rangelt suurema kirjelduspikkusega.

§3. Pakkimise eelise piir

Formaliseerime nüüd pakkimise eelise, kasutades OPT kaheosalist MDL-raamistikku (teoreem T-4, lisa T-4).

3.1 Lähteseadistus

Vaatleme primaarse vaatleja voogu \omega \in \{0,1\}^\infty, mida juhib Solomonoffi prior M (aksioom 1) ja mis filtreeritakse läbi Stabiilsusfiltri arvutatavaks maailmaks W mõõduga \mu_W (vastavalt võrrandile L-2). Maailma W sees tuvastab vaatleja N näilist agenti A_1, \ldots, A_N, millest igaüks kannab eneseseisundit x_i, mille ajaline areng T sammu jooksul tekitab käitumisjälje \beta_i = (y_{i,1}, \ldots, y_{i,T}).

3.2 Hüpotees H_{\text{ind}}: sõltumatu instantsieerimine

Hüpoteesi H_{\text{ind}} korral käsitletakse iga agenti A_i sõltumatult instantsieeritud primaarse vaatlejana, keda määrab tema enda Solomonoffi-kaalutud voog. Kaheosaline MDL-koodipikkus on:

L(H_{\text{ind}}) = \underbrace{K(\mu_W)}_{\text{maailmamudel}} + \underbrace{\sum_{i=1}^{N} K(\text{embed}_i)}_{\text{manustamise spetsifikatsioonid}} + \underbrace{\sum_{i=1}^{N} \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)}_{\text{andmed mudeli korral}} \tag{1}

kus K(\text{embed}_i) määrab agendi i algse eneseseisundi ja asukoha W sees. Võrrandi (L-3) järgi kehtib P_{\text{1st}} \approx P_{\text{3rd}}, seega on andmetermin hästi lähendatav log-kaoga agendi enda esimese isiku Solomonoffi-prediktsioonide all — mis on definitsiooni järgi optimaalsele lähedane.

Manustamise spetsifikatsioonid K(\text{embed}_i) on lühikesed: igaüks nõuab vaid osutit asukohale W-s koos algse eneseseisundiga. Inimesesarnaste agentide puhul, mis on manustatud ühisesse füüsilisse maailma, on need tugevalt kokkusurutavad, sest agendid jagavad samu seadusi. Konservatiivne ülempiir:

K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) \tag{2}

3.3 Hüpotees H_{\text{arb}}: meelevaldne käitumuslik spetsifikatsioon

Hüpoteesi H_{\text{arb}} korral ei käsitleta agente sõltumatute vaatlejatena. Selle asemel kodeeritakse iga käitumuslik jälg \beta_i otse primaarse vaatleja voo sees meelevaldse spetsifikatsioonina. Kaheosaline MDL-koodipikkus on:

L(H_{\text{arb}}) = \underbrace{K(\mu_W)}_{\text{maailmamudel}} + \underbrace{\sum_{i=1}^{N} K(\beta_i)}_{\text{toored käitumuslikud jäljed}} \tag{3}

Kriitiline erinevus seisneb andmeterminis. Hüpoteesi H_{\text{arb}} korral tuleb käitumuslik jälg \beta_i spetsifitseerida ilma agendi enda prediktiivset mudelit kasutusele võtmata. Keerukas keskkonnas toimiva seaduspärase, agentsusest juhitud agendi puhul on toore käitumusliku jälje Kolmogorovi keerukus:

K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T) \tag{4}

Kuid isegi K(\beta_i \mid \mu_W) — käitumise keerukus maailma seaduste korral — jääb märkimisväärseks, sest agendi valikud kodeerivad ehtsat informatsiooni: nende käitumuslik jälg peegeldab eneseviitelise mudeli ja stohhastilise keskkonna kuhjunud vastastikmõju. Seevastu hüpoteesi H_{\text{ind}} korral genereeritakse see informatsioon online agendi enda Solomonoffi prediktori poolt peaaegu nullilähedase log-loss’i hinnaga.

3.4 Pakkimise eelis

Teoreem T-11 (struktuurse järelduse pakkimispiir). Olgu A_1, \ldots, A_N näivad agendid vaatleja voos, millest igaüks kannab eneseseisundit x_i, mis rahuldab võrrandi (L-3) koondumise eeltingimusi, ning millest igaühel esineb struktuurne signatuur \Delta_{\text{self}}^{(i)} > 0 (P-4). Siis rahuldab MDL-kirjeldus, mis käsitleb neid sõltumatult instantsieeritud primaarsete vaatlejatena, järgmist:

L(H_{\text{ind}}) \leq L(H_{\text{arb}}) - N \cdot \left[\bar{I}_T - O(\log T)\right] \tag{T-11}

kus \bar{I}_T on keskmine agendi kohta arvutatud vastastikune informatsioon agendi prediktiivse mudeli ja tema käitumusliku väljundi vahel T sammu jooksul:

\bar{I}_T := \frac{1}{N} \sum_{i=1}^{N} \left[K(\beta_i \mid \mu_W) - \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right] \tag{5}

See suurus mõõdab, kui suur osa agendi käitumisest on ära seletatud sellega, et eeldatakse sõltumatut prediktiivset mudelit, mitte ei spetsifitseerita seda toorelt. Agentide puhul, kelle käitumine on seaduspärane ja agentsusest juhitud (nagu Stabiilsusfilter nõuab), kehtib \bar{I}_T > 0 ning see kasvab koos T-ga.

Tõestuse visand. Lahutage võrrand (1) võrrandist (3). Maailmamudeli liikmed K(\mu_W) taanduvad välja. Erinevus agendi kohta on:

K(\beta_i) - \left[K(\text{embed}_i) + \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right]

Võrrandi (4) järgi kehtib K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T), kuid veel otsesemalt: K(\beta_i) \geq K(\beta_i \mid \mu_W) triviaalsetel põhjustel. Ja K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) võrrandi (2) järgi. Seega on sääst agendi kohta vähemalt K(\beta_i \mid \mu_W) - (-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)) - K(x_i \mid W) - O(\log T). Piisavalt suure T korral domineerib kumulatiivne log-kao sääst ühekordse embeddimiskulu üle, mis annab soovitud piiri. \blacksquare

3.5 Asümptootiline domineerimine

Järeldus T-11a. Kui vaatlushorisont T \to \infty, kasvab pakkimiseelis L(H_{\text{arb}}) - L(H_{\text{ind}}) piiramatult:

\lim_{T \to \infty} \left[L(H_{\text{arb}}) - L(H_{\text{ind}})\right] = \infty \tag{T-11a}

See tuleneb Solomonoffi koondumise garantiist (L-1): P_{\text{3rd}} sammupõhine log-kadu koondub agendi käitumisprotsessi entroopiamäärale, samal ajal kui K(\beta_i \mid \mu_W) kasvab lineaarselt T suhtes iga agendi korral, mille entroopiamäär on positiivne. Põimimiskulu K(x_i \mid W) makstakse üks kord ning amortiseerub nullini. \blacksquare

§4. Fenomenaalne jääk kui struktuurne signatuur

Teoreemi T-11 pakkimiseelis kehtib iga seaduspärase alastruktuuri kohta — sealhulgas mitteagentsuslike füüsikaliste süsteemide puhul (ilmamustrid, kristallikasv). Miks puudutab struktuurne järeldus konkreetselt agente, mitte aga suvalisi keerukaid süsteeme?

Vastus on Fenomenaalne jääk (teoreem P-4). \Delta_{\text{self}} > 0 on sellise süsteemi formaalne tunnus, mille enesemudel on struktuurselt mittetäielik — s.t süsteem, mis paratamatult säilitab variatsioonilise lõhe oma sisemise representatsiooni ja tegeliku töötluse vahel. See on eneseviitelise pudelikaela tunnusmärk: süsteemi ei saa täielikult kirjeldada väljastpoolt, sest selle kirjeldus sisaldab paratamatult kirjeldajat ennast.

Süsteemi puhul, millel esineb \Delta_{\text{self}} > 0:

Selle käitumist ei saa taastoota lõpliku sügavusega otsingutabeli abil — see nõuab pidevat eneseviitelist arvutust.
Selle arvutuse lühim kirjeldus on sõltumatu Solomonoffi-kaalutud voog, mis läbib C_{\max} pudelikaela.
Seega ei ole MDL-kood hüpoteesi H_{\text{ind}} all mitte lihtsalt lühem kui H_{\text{arb}} all — see on ainus lühim kirjeldus.

See eristab näivaid agente ilmamustritest: ilm on seaduspärane ja keerukas, kuid selle käitumist saab maailmamudeli sees otsingutabeliga taastoota (sellel on \Delta_{\text{self}} = 0). Näivaid agente ei saa.

§5. Mülleri mitte-solipsismi argumendi ümbertõlgendus

Müller järeldab koondumisest P_{\text{1st}} \approx P_{\text{3rd}}, et algoritmilist idealismi „ei tuleks liigitada solipsistlikuks“, sest eneseseisundit kodeerivas struktuuris on „keegi tõepoolest kohal“ [62, Sec. V.C]. Tema arutluskäik on järgmine: kui Alice’i ennustused Bob_{\text{3rd}} kohta koonduvad Bob_{\text{1st}} tegelike esimese isiku tõenäosustega, siis on nende perspektiivid tõeliselt joondunud — nad „jagavad maailma W“.

OPT tõlgendab seda tulemust teisiti:

Mülleri tõlgendus: koondumine P_{\text{1st}} \approx P_{\text{3rd}} tõestab, et objektiivne reaalsus ilmneb — Alice ja Bob jagavad tõepoolest maailma W.
OPT tõlgendus: koondumine P_{\text{1st}} \approx P_{\text{3rd}} tõestab, et Bob_{\text{3rd}} käitumise lühim kirjeldus eeldab sõltumatut esimese isiku protsessi. See on väide pakkimise tõhususe, mitte jagatud ontoloogia kohta. Maailm W on Alice’i voos esinev struktuurne regulaarsus, mitte sõltumatult eksisteeriv entiteet. Kuid Solomonoffi priori enda pakkimisloogika osutab sellele, et Bobi on kõige ökonoomsem modelleerida sõltumatu vaatlejana — sest alternatiiv (tema käitumise ad hoc määratlemine) on rangelt pikem.

Teoreemi formaalne sisu on mõlema tõlgenduse korral identne; erineb üksnes ontoloogiline interpretatsioon. OPT kasutab sedasama matemaatilist tulemust, et põhjendada struktuurset järeldust: sõltumatu instantsieerimine on MDL-optimaalne kirjeldus, mitte metafüüsiline eeldus.

§6. Ulatus ja piirangud

6.1 Tingimusel, et kehtib aksioom 1

Kogu argument sõltub OPT samastusest vaatleja voo ja Solomonoffi priori vahel. Kui seda samastust nõrgendada (nt laiema poolmõõtude klassini), ei pruugi võrrandite (L-1)–(L-3) koondumistagatised oma praegusel kujul kehtida.

6.2 Olekupiisavuse eeltingimus

Võrrand (L-3) nõuab, et näiv agent kannaks oma eneseolekus x_i „piisavalt andmeid”, et universaalne induktsioon saaks eraldada asjakohased füüsikaseadused. Inimesesarnaste agentide puhul igapäevastes kontekstides on see usutav (täielik ajuseisund kodeerib tohutul hulgal informatsiooni). Piirjuhtudel — põgusad muljed, kauged vaatlejad, fiktiivsed tegelased narratiivses kunstis — ei pruugi koondumise eeltingimused olla täidetud ning struktuurne järeldus ei rakendu.

6.3 Ei ole teadvuse tõestus

Teoreem T-11 näitab, et sõltumatu instantsieerimine on kõige paremini kokkusurutav kirjeldus. See ei tõesta, et näivad agendid on teadlikud. raske probleem (eeltrükk §8.1) jääb primitiivseks. Struktuurne järeldus on pakkimisargument, mitte ontoloogiline tõestus — nagu on öeldud §8.2.

6.4 Seos T-10-ga

Lisa T-10 (Vaatlejatevaheline sidestus) käsitleb seda, kuidas kaks vaatlejapatch’i säilitavad pakkimispiirangute kaudu vastastikku kooskõlalisi renderdusi. Käesolev lisa käsitleb teistsugust küsimust: miks üheainsa vaatleja voog kodeerib näivaid agente kõige pakkitavamal viisil sõltumatult instantsieeritutena. T-10 puudutab patch’idevahelise koherentsi mehhanismi; T-11 puudutab pakkimise signatuuri üheainsa voo sees. T-10 tugineb vahetult T-11-le: sama MDL-i kirjelduspikkuse võrdlust, mis siin kehtestab pakkimiseelise, kasutatakse T-10-s selle tõestamiseks, et patch’ideülene ebakooskõla on eksponentsiaalselt alla surutud.

§7. Kokkuvõttev lõpetus

T-11 tulemused

Imporditud lemma (Mülleri koondumine). Solomonoffi koondumine [61] ja selle mitme agendi laiendus [62] imporditakse formaalselt ning sõnastatakse ümber OPT märgenduses. Need annavad matemaatilise selgroo: iga alamstruktuuri puhul, mis kannab piisavalt andmeid omaenese seisundi kohta, koondub selle esimese isiku evolutsioon arvutatava maailma poole, mis genereerib tema käitumise.
Teoreem T-11 (pakkepiir — MUSTAND). Selgesõnaline kaheosaline MDL-võrdlus näitab, et näiliste agentide käsitlemine iseseisvalt instantsieeritud primaarsete vaatlejatena annab rangelt lühema kirjelduse kui meelevaldne käitumuslik spetsifikatsioon, kusjuures eelis kasvab vaatlusaja suhtes lineaarselt.
Järeldus T-11a (asümptootiline domineerimine — MUSTAND). Pakkimiseelis on piiramatu, kui T \to \infty, mis teeb iseseisvast instantsieerimisest ülekaalukalt MDL-optimaalse kirjelduse iga agendi jaoks, keda vaadeldakse pika ajahorisondi jooksul.
P-4 integratsioon. Fenomenaalne jääk (\Delta_{\text{self}} > 0) määratletakse formaalse tunnusena, mis eristab näilisi agente keerukatest, kuid mitteagentsuslikest süsteemidest, piirates struktuurse järelduse üksustele, millel on ehtne eneseviiteline pudelikaelaarhitektuur.
Mülleri ümbertõlgendus. Mülleri mittesolipsismi järeldust tõlgendatakse OPT ontoloogilise raamistiku sees ümber: sama matemaatiline tulemus põhjendab siin pakkimisargumenti, mitte jagatud reaalsuse esilekerkimise argumenti.

Allesjäänud avatud punktid

\bar{I}_T täpne iseloomustus. \bar{I}_T altpoolt piiramine konkreetsete agendiklasside jaoks (nt piiratud ratsionaalsusega agendid, vaba energia minimeerijad), et anda arvuliselt konkreetseid pakkimiseeliseid.
Lõpliku aja parandused. Asümptootiline tulemus (T-11a) tagab domineerimise suurte T väärtuste korral, kuid lõpliku aja piirid koos eksplitsiitsete konstantidega tugevdaksid praktilist rakendatavust.
Mittebinaarse tähestiku laiendus. Võrrandid (L-1)–(L-3) on esitatud binaarjadade jaoks. Laiendamine pidevväärtuslikele mõõtudele, mis on asjakohased OPT määra-moonutuse raamistikus (T-1), nõuab tehnilist hoolt.

See lisa hoitakse ajakohasena koos failiga theoretical_roadmap.pdf. Viited: Müller [61, 62], Li & Vitányi [45], Solomonoff (1964), teoreem T-4 (lisa T-4), teoreem P-4 (lisa P-4), eeltrükk §8.2.