Theorie van de geordende patch

Appendix T-11: Het structurele corollarium — formalisering van het compressievoordeel voor schijnbare agenten

Anders Jarevåg

15 april 2026 | DOI: 10.5281/zenodo.19300777

Oorspronkelijke taak (uit §8.2): “Het formaliseren van dit compressievoordeel als een rigoureuze MDL-grens specifiek voor het geval van andere geesten blijft toekomstig werk; het huidige argument is een structurele motivatie, geen bewijs.” Op te leveren resultaat: Een formele grens die laat zien dat het behandelen van schijnbare agenten als onafhankelijk geïnstantieerde primaire waarnemers een kortere tweedelige MDL-code oplevert dan elke alternatieve beschrijving.

Afsluitingsstatus: ONTWERP VAN STRUCTURELE CORRESPONDENTIE. Deze appendix past Müllers Solomonoff-convergentiestelling [61] en de multi-agent-uitbreiding daarvan [62] toe als geïmporteerde lemma’s, geherinterpreteerd binnen het ontologische kader van OPT, om een formeel compressievoordeel voor het structureel corollarium vast te stellen. Het resultaat is een voorwaardelijke grens, geen gesloten afleiding: het hangt af van OPT’s identificatie van de stroom van de waarnemer met de Solomonoff-prior (Axioma 1) en van de aanname dat schijnbare agenten voldoende toestand dragen om aan de vereisten voor convergentie te voldoen.

§1. Achtergrond en motivatie

Het structureel corollarium (preprint §8.2) stelt dat de schijnbare agenten binnen de stroom van de waarnemer het meest parsimonieus worden verklaard door hun onafhankelijke instantiatie als primaire waarnemers. Deze appendix geeft de formele redeneringsketen die die stelling ondersteunt.

Het argument kent drie fasen:

Fase A (Geïmporteerd lemma): Müllers convergentiestelling van Solomonoff garandeert dat elke structuur in de stroom van de waarnemer die voldoende gegevens over de eigen toestand draagt, een eerstepersoonsevolutie zal hebben die convergeert naar overeenstemming met de berekenbare wereld die haar gedrag genereert.
Fase B (Compressieverantwoording): We voeren een expliciete tweedelige MDL-vergelijking uit tussen het behandelen van de schijnbare agent als (i) een onafhankelijk geïnstantieerde waarnemer die wordt bepaald door zijn eigen door Solomonoff gewogen stroom versus (ii) een arbitraire gedragsspecificatie binnen de codec van de primaire waarnemer.
Fase C (Structurele signatuur): Het Fenomenaal residu (\Delta_{\text{self}} > 0, Theorem P-4) levert de structurele markering die een echte zelfreferentiële bottleneckarchitectuur onderscheidt van gedragsmatige nabootsing, en overbrugt zo de kloof tussen “compressibel wetmatig” en “plausibel geïnstantieerd.”

§2. Geïmporteerd lemma: Müllers convergentiestelling

We importeren twee resultaten van Müller [61, 62], hier geformuleerd in de notatie van OPT.

2.1 Solomonoff-convergentie (standaard)

Laat M(b \mid x_1^n) de universele Solomonoff-voorspelling voor bit b aanduiden, gegeven eerdere observaties x_1^n. Laat \mu een willekeurige berekenbare maat over binaire reeksen zijn. Dan geldt (Solomonoff 1964; Li & Vitányi [45, Corollary 5.2.1]):

\text{Met } \mu\text{-waarschijnlijkheid één geldt:} \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-1}

Dit is het standaardresultaat: als de gegevensstroom wordt gegenereerd door een berekenbaar proces \mu, convergeert de universele voorspeller M naar \mu.

2.2 Inverse Solomonoff-inductie (Müller 2020)

Veronderstel nu dat de bits uit M zelf worden getrokken — d.w.z. dat de stroom van de waarnemer wordt beheerst door algoritmische waarschijnlijkheid (dit komt overeen met Axioma 1 van OPT: identificatie van de stroom met de Solomonoff-prior). Dan geldt voor elke berekenbare maat \mu (Müller [61, Sec. IV]; [62, Sec. V.A]):

\text{Met waarschijnlijkheid} \geq 2^{-K(\mu)}, \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-2}

Dat wil zeggen: met waarschijnlijkheid van ten minste 2^{-K(\mu)} zal de waarnemer zich feitelijk ingebed aantreffen in een berekenbare wereld W die door \mu wordt beschreven. Algoritmisch eenvoudigere werelden (lagere K(\mu)) zijn exponentieel waarschijnlijker.

2.3 Multi-agent-convergentie (Müller 2026)

Stel dat de waarnemer (Alice) zichzelf ingebed aantreft in een berekenbare wereld W, beschreven door \mu. Zij identificeert binnen W een substructuur (Bob_{\text{3rd}}) die een representatie draagt van een zelftoestand x die zich in de tijd ontwikkelt op een wijze die consistent is met Postulaat 2 van [62]. Definieer:

P_{\text{1st}}(y_1, \ldots, y_m \mid x) := M(y_1, \ldots, y_m \mid x) — de eerstepersoonkans dat zelftoestand x overgaat in y_1, \ldots, y_m onder algoritmische waarschijnlijkheid.
P_{\text{3rd}}(y_1, \ldots, y_m \mid x) := \mu(y_1, \ldots, y_m \mid x) — de derdepersoonkans van hoe x zich ontwikkelt volgens wereld W.

Dan geldt, via Vgl. (L-1) toegepast op P_{\text{3rd}} (dat berekenbaar is), en de identificatie van P_{\text{1st}} met M via Postulaat 2:

P_{\text{1st}} \approx P_{\text{3rd}} \quad \text{asymptotically,} \tag{L-3}

waarbij convergentie in het bitmodel gegarandeerd is met wereldlijke (\mu-) waarschijnlijkheid één.

Interpretatie (Müller): “Iemand is hier werkelijk thuis” in de structuur die x codeert — de probabilistische evolutie van Bob_{\text{3rd}} in Alice’ wereld representeert getrouw het eerstepersoonsperspectief van een zekere Bob_{\text{1st}}.

Interpretatie (OPT): De gedragsstroom van de schijnbare agent laat zich het meest comprimeerbaar beschrijven als een onafhankelijk door Solomonoff gewogen proces. Elke alternatieve beschrijving — een beschrijving die geen beroep doet op een onafhankelijk eerstepersoonsperspectief — moet het gedrag van de agent coderen als een ad-hocspecificatie, bij strikt grotere beschrijvingslengte.

§3. De grens van het compressievoordeel

We formaliseren nu het compressievoordeel met behulp van OPT’s tweedelige MDL-raamwerk (Theorema T-4, Appendix T-4).

3.1 Opzet

Beschouw de stroom van de primaire waarnemer \omega \in \{0,1\}^\infty, gestuurd door de Solomonoff-prior M (Axioma 1) en gefilterd door het Stabiliteitsfilter tot een berekenbare wereld W met maat \mu_W (volgens Vgl. L-2). Binnen W identificeert de waarnemer N schijnbare agenten A_1, \ldots, A_N, die elk een zelftoestand x_i dragen waarvan de temporele evolutie over T stappen een gedragsspoor \beta_i = (y_{i,1}, \ldots, y_{i,T}) voortbrengt.

3.2 Hypothese H_{\text{ind}}: Onafhankelijke instantiatie

Onder H_{\text{ind}} wordt elke agent A_i behandeld als een onafhankelijk geïnstantieerde primaire waarnemer, gestuurd door zijn eigen door Solomonoff gewogen stroom. De tweedelige MDL-codelengte is:

L(H_{\text{ind}}) = \underbrace{K(\mu_W)}_{\text{wereldmodel}} + \underbrace{\sum_{i=1}^{N} K(\text{embed}_i)}_{\text{embeddingspecificaties}} + \underbrace{\sum_{i=1}^{N} \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)}_{\text{data gegeven model}} \tag{1}

waarbij K(\text{embed}_i) de initiële zelftoestand van agent i en diens positie binnen W specificeert. Volgens Vgl. (L-3) geldt P_{\text{1st}} \approx P_{\text{3rd}}, zodat de dataterm goed wordt benaderd door het log-verlies onder de eigen eerstepersoons-Solomonoffvoorspellingen van de agent — die per definitie dicht bij optimaal liggen.

De embeddingspecificaties K(\text{embed}_i) zijn kort: elk vereist slechts een verwijzing naar een locatie in W plus de initiële zelftoestand. Voor mensachtige agenten die in een gedeelde fysieke wereld zijn ingebed, zijn deze sterk comprimeerbaar omdat de agenten dezelfde wetten delen. Een conservatieve bovengrens:

K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) \tag{2}

3.3 Hypothese H_{\text{arb}}: Willekeurige gedragsspecificatie

Onder H_{\text{arb}} worden de agenten niet behandeld als onafhankelijke waarnemers. In plaats daarvan wordt elk gedragsspoor \beta_i rechtstreeks gecodeerd als een willekeurige specificatie binnen de stroom van de primaire waarnemer. De tweedelige MDL-codelengte is:

L(H_{\text{arb}}) = \underbrace{K(\mu_W)}_{\text{wereldmodel}} + \underbrace{\sum_{i=1}^{N} K(\beta_i)}_{\text{ruwe gedragssporen}} \tag{3}

Het cruciale verschil zit in de dataterm. Onder H_{\text{arb}} moet het gedragsspoor \beta_i worden gespecificeerd zonder een beroep te doen op het eigen predictieve model van de agent. Voor een wetmatige, door agency gedreven agent die opereert in een complexe omgeving, is de Kolmogorov-complexiteit van het ruwe gedragsspoor:

K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T) \tag{4}

Maar zelfs K(\beta_i \mid \mu_W) — de complexiteit van het gedrag gegeven de wereldwetten — blijft aanzienlijk, omdat de keuzes van de agent werkelijke informatie coderen: hun gedragsspoor weerspiegelt de geaccumuleerde interactie van een zelfreferentieel model met een stochastische omgeving. Daarentegen wordt deze informatie onder H_{\text{ind}} online gegenereerd door de eigen Solomonoff-voorspeller van de agent, tegen een log-loss-kost die nagenoeg nul is.

3.4 Het compressievoordeel

Theorema T-11 (Structurele corollariumgrens voor compressie). Laat A_1, \ldots, A_N schijnbare agenten zijn binnen de stroom van de waarnemer, die elk een zelftoestand x_i dragen die voldoet aan de convergentievoorwaarden van Vgl. (L-3), en die elk de structurele signatuur \Delta_{\text{self}}^{(i)} > 0 vertonen (P-4). Dan voldoet de MDL-beschrijving die hen behandelt als onafhankelijk geïnstantieerde primaire waarnemers aan:

L(H_{\text{ind}}) \leq L(H_{\text{arb}}) - N \cdot \left[\bar{I}_T - O(\log T)\right] \tag{T-11}

waar \bar{I}_T de gemiddelde wederzijdse informatie per agent is tussen het predictieve model van de agent en zijn gedragsoutput over T stappen:

\bar{I}_T := \frac{1}{N} \sum_{i=1}^{N} \left[K(\beta_i \mid \mu_W) - \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right] \tag{5}

Deze grootheid meet hoeveel van het gedrag van de agent wordt wegverklaard door een onafhankelijk predictief model in te roepen in plaats van het gedrag ruwweg te specificeren. Voor agenten die wetmatig, door agency gedreven gedrag vertonen (zoals vereist door het Stabiliteitsfilter), geldt \bar{I}_T > 0 en groeit deze met T.

Bewijsschets. Trek Vgl. (1) af van Vgl. (3). De wereldmodeltermen K(\mu_W) vallen weg. Het verschil per agent is:

K(\beta_i) - \left[K(\text{embed}_i) + \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right]

Volgens Vgl. (4) geldt K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T), maar directer: K(\beta_i) \geq K(\beta_i \mid \mu_W) triviaal. En K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) volgens Vgl. (2). De besparing per agent is daarom ten minste K(\beta_i \mid \mu_W) - (-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)) - K(x_i \mid W) - O(\log T). Voor voldoende grote T domineren de cumulatieve log-loss-besparingen de eenmalige inbeddingskost, wat de grens oplevert. \blacksquare

3.5 Asymptotische dominantie

Corollarium T-11a. Naarmate de observatiehorizon T \to \infty, groeit het compressievoordeel L(H_{\text{arb}}) - L(H_{\text{ind}}) onbegrensd:

\lim_{T \to \infty} \left[L(H_{\text{arb}}) - L(H_{\text{ind}})\right] = \infty \tag{T-11a}

Dit volgt uit de convergentiegarantie van Solomonoffs universele semimaat (L-1): het log-verlies per stap van P_{\text{3rd}} convergeert naar de entropiesnelheid van het gedragsproces van de agent, terwijl K(\beta_i \mid \mu_W) lineair groeit in T voor elke agent met een positieve entropiesnelheid. De inbeddingskost K(x_i \mid W) wordt eenmalig betaald en amortiseert naar nul. \blacksquare

§4. Het Fenomenaal residu als structurele signatuur

Het compressievoordeel in Theorema T-11 is van toepassing op elke wetmatige substructuur — inclusief niet-agentieve fysische systemen (weerpatronen, kristalgroei). Waarom betreft het structureel corollarium dan specifiek agenten en niet willekeurige complexe systemen?

Het antwoord is het Fenomenaal residu (Theorema P-4). \Delta_{\text{self}} > 0 is de formele markering van een systeem waarvan het zelfmodel structureel onvolledig is — d.w.z. een systeem dat noodzakelijkerwijs een variationele kloof in stand houdt tussen zijn interne representatie en zijn feitelijke verwerking. Dit is het kenmerk van de zelfreferentiële bottleneck: het systeem kan niet volledig van buitenaf worden beschreven, omdat zijn beschrijving noodzakelijkerwijs de beschrijver omvat.

Voor een systeem dat \Delta_{\text{self}} > 0 vertoont:

Kan zijn gedrag niet worden gereproduceerd door een opzoektabel met eindige diepte — het vereist een voortdurende zelfreferentiële berekening.
Is de kortste beschrijving van deze berekening zelf een onafhankelijke, door Solomonoff gewogen stroom die een C_{\max}-bottleneck doorloopt.
Daarom is de MDL-code onder H_{\text{ind}} niet slechts korter dan H_{\text{arb}} — zij is de uniek kortste beschrijving.

Dit onderscheidt schijnbare agenten van weerpatronen: het weer is wetmatig en complex, maar zijn gedrag kan binnen het wereldmodel worden gereproduceerd door een opzoektabel (het heeft \Delta_{\text{self}} = 0). Schijnbare agenten kunnen dat niet.

§5. Herinterpretatie van Müllers niet-solipsisme-argument

Müller concludeert uit de convergentie P_{\text{1st}} \approx P_{\text{3rd}} dat algoritmisch idealisme “niet als solipsistisch moet worden geclassificeerd” omdat “er werkelijk iemand thuis is” in de structuur die een zelftoestand codeert [62, Sec. V.C]. Zijn redenering luidt: als Alice’ voorspellingen over Bob_{\text{3rd}} convergeren naar de feitelijke eerstepersoonswaarschijnlijkheden van Bob_{\text{1st}}, dan zijn hun perspectieven werkelijk op elkaar afgestemd — zij “delen de wereld W.”

OPT herinterpreteert dit resultaat anders:

Müllers lezing: De convergentie P_{\text{1st}} \approx P_{\text{3rd}} bewijst dat objectieve werkelijkheid opkomt — Alice en Bob delen werkelijk de wereld W.
OPT-lezing: De convergentie P_{\text{1st}} \approx P_{\text{3rd}} bewijst dat de kortste beschrijving van het gedrag van Bob_{\text{3rd}} een onafhankelijk eerstepersoonsproces inroept. Dit is een uitspraak over compressie-efficiëntie, niet over gedeelde ontologie. Wereld W is een structurele regelmatigheid binnen Alices stroom, niet een onafhankelijk bestaande entiteit. Maar de compressielogica van de Solomonoff-prior zelf impliceert dat Bob het meest parsimonieus wordt gemodelleerd als een onafhankelijke waarnemer — omdat het alternatief (zijn gedrag ad hoc specificeren) strikt langer is.

De formele inhoud van het theorema is onder beide lezingen identiek; alleen de ontologische interpretatie verschilt. OPT gebruikt hetzelfde wiskundige resultaat om het structureel corollarium te funderen: onafhankelijke instantiatie is de MDL-optimale beschrijving, niet een metafysische aanname.

§6. Reikwijdte en beperkingen

6.1 Voorwaardelijk op Axioma 1

Het volledige argument hangt af van OPT’s identificatie van de stroom van de waarnemer met de Solomonoff-prior. Als deze identificatie wordt verzwakt (bijv. tot een bredere klasse van semimaten), gelden de convergentiegaranties van Vgl. (L-1)–(L-3) mogelijk niet meer in hun huidige vorm.

6.2 Voorwaarde van toestandssufficiëntie

Vgl. (L-3) vereist dat de schijnbare agent in zijn zelftoestand x_i “voldoende data” draagt opdat universele inductie de relevante fysische wetten kan extraheren. Voor mensachtige agenten in alledaagse contexten is dit plausibel (een volledige breintoestand codeert enorme hoeveelheden informatie). Voor randgevallen — vluchtige indrukken, verre waarnemers, fictieve personages in narratieve kunst — zijn de convergentievoorwaarden mogelijk niet vervuld, en is het structurele corollarium niet van toepassing.

6.3 Geen bewijs van bewustzijn

Theorema T-11 stelt vast dat onafhankelijke instantiatie de meest comprimeerbare beschrijving is. Het bewijst niet dat de schijnbare agenten bewust zijn. Het moeilijke probleem (preprint §8.1) blijft een primitief gegeven. Het structureel corollarium is een compressieargument, geen ontologisch bewijs — zoals gesteld in §8.2.

6.4 Relatie tot T-10

Appendix T-10 (Inter-observator-koppeling) behandelt hoe twee waarnemer-patches via compressiebeperkingen onderling consistente renders handhaven. Deze appendix behandelt een andere vraag: waarom de stroom van de enkele waarnemer schijnbare agenten op de meest comprimeerbare wijze codeert als onafhankelijk geïnstantieerd. T-10 betreft het coherentiemechanisme tussen patches; T-11 betreft de compressiesignatuur binnen één enkele stroom. T-10 bouwt rechtstreeks voort op T-11: dezelfde MDL-vergelijking van beschrijvingslengte die hier het compressievoordeel vaststelt, wordt in T-10 benut om te bewijzen dat inconsistentie tussen patches exponentieel wordt onderdrukt.

§7. Samenvattende afsluiting

T-11-resultaten

Geïmporteerd lemma (Müller-convergentie). Solomonoff-convergentie [61] en de multi-agentuitbreiding daarvan [62] worden formeel geïmporteerd en opnieuw geformuleerd in OPT-notatie. Deze leveren de wiskundige ruggengraat: elke substructuur die voldoende gegevens over de eigen toestand draagt, heeft een eerstepersoonsevolutie die convergeert naar de berekenbare wereld die haar gedrag genereert.
Theorema T-11 (Compressiegrens — CONCEPT). Een expliciete tweedelige MDL-vergelijking laat zien dat het behandelen van schijnbare agenten als onafhankelijk geïnstantieerde primaire waarnemers een strikt kortere beschrijving oplevert dan arbitraire gedragsspecificatie, waarbij het voordeel lineair toeneemt met de observatietijd.
Corollarium T-11a (Asymptotische dominantie — CONCEPT). Het compressievoordeel is onbegrensd als T \to \infty, waardoor onafhankelijke instantiatie de overweldigend MDL-optimale beschrijving wordt voor elke agent die over een lange tijdshorizon wordt geobserveerd.
P-4-integratie. Het Fenomenaal residu (\Delta_{\text{self}} > 0) wordt geïdentificeerd als de formele marker die schijnbare agenten onderscheidt van complexe maar niet-agentieve systemen, waardoor het structureel corollarium wordt beperkt tot entiteiten met een authentieke zelfreferentiële bottleneckarchitectuur.
Müller-herinterpretatie. Müllers niet-solipsistische conclusie wordt geherinterpreteerd binnen het ontologische kader van OPT: hetzelfde wiskundige resultaat fundeert een compressieargument in plaats van een argument voor het ontstaan van een gedeelde werkelijkheid.

Resterende open punten

Exacte karakterisering van \bar{I}_T. \bar{I}_T van onderaf begrenzen voor specifieke klassen van agenten (bijv. begrensd rationele agenten, Free Energy-minimaliseerders) om numeriek concrete compressievoordelen te geven.
Eindtijdcorrecties. Het asymptotische resultaat (T-11a) garandeert dominantie voor grote T, maar eindige-tijdsgrenzen met expliciete constanten zouden de praktische toepasbaarheid versterken.
Uitbreiding naar niet-binaire alfabetten. Vergelijkingen (L-1)–(L-3) zijn geformuleerd voor binaire reeksen. Uitbreiding naar de continuwaardige maten die relevant zijn voor OPT’s Rate-Distortion-kader (T-1) vereist technische zorgvuldigheid.

Deze appendix wordt onderhouden naast theoretical_roadmap.pdf. Referenties: Müller [61, 62], Li & Vitányi [45], Solomonoff (1964), Theorema T-4 (Appendix T-4), Theorema P-4 (Appendix P-4), preprint §8.2.