Teoria del Patch Ordenat

Apèndix T-11: El Corol·lari Estructural — Formalització de l’avantatge de compressió per als agents aparents

Anders Jarevåg

15 d’abril de 2026 | DOI: 10.5281/zenodo.19300777

Tasca original (de §8.2): “Formalitzar aquest avantatge de compressió com una cota rigorosa de MDL específicament per al cas de les altres ments continua sent feina futura; l’argument present és una motivació estructural, no una prova.” Resultat esperat: Una cota formal que mostri que tractar els agents aparents com a observadors primaris instanciats independentment produeix un codi MDL en dues parts més curt que qualsevol descripció alternativa.

Estat de tancament: ESBORRANY DE CORRESPONDÈNCIA ESTRUCTURAL. Aquest apèndix adapta el teorema de convergència de Solomonoff de Müller [61] i la seva extensió multiagent [62] com a lemes importats, reinterpretats dins del marc ontològic de la Teoria del Patch Ordenat (OPT), per establir un avantatge formal de compressió per al Corol·lari Estructural. El resultat és una cota condicional, no una derivació tancada: depèn de la identificació, per part de l’OPT, del flux de l’observador amb el prior de Solomonoff (Axioma 1) i de l’assumpció que els agents aparents porten prou estat per satisfer els prerequisits de convergència.

§1. Antecedents i motivació

El Corol·lari Estructural (preprint §8.2) afirma que els agents aparents dins del flux de l’observador s’expliquen de la manera més parsimoniosa per la seva instanciació independent com a observadors primaris. Aquest apèndix proporciona la cadena formal que sosté aquesta afirmació.

L’argument té tres etapes:

Etapa A (Lema importat): el teorema de convergència de Solomonoff de Müller garanteix que qualsevol estructura dins del flux de l’observador que contingui prou dades sobre el seu propi estat farà que la seva evolució en primera persona convergeixi fins a correspondre’s amb el món computable que genera el seu comportament.
Etapa B (Comptabilitat de compressió): duem a terme una comparació explícita en dues parts basada en MDL entre tractar l’agent aparent com (i) un observador instanciat independentment governat pel seu propi flux ponderat per Solomonoff, o bé com (ii) una especificació conductual arbitrària dins del còdec de l’observador primari.
Etapa C (Signatura estructural): el Residu Fenomenal (\Delta_{\text{self}} > 0, Teorema P-4) proporciona el marcador estructural que distingeix una arquitectura genuïna de coll d’ampolla autoreferencial d’una mera mímica conductual, i tanca així la bretxa entre «legalitat compressible» i «instanciació plausible».

§2. Lema importat: teorema de convergència de Müller

Importem dos resultats de Müller [61, 62], formulats aquí amb la notació de l’OPT.

2.1 Convergència de Solomonoff (Estàndard)

Siguin M(b \mid x_1^n) la predicció universal de Solomonoff per al bit b donades les observacions prèvies x_1^n, i \mu qualsevol mesura computable sobre seqüències binàries. Aleshores (Solomonoff 1964; Li & Vitányi [45, Corollary 5.2.1]):

\text{Amb probabilitat } \mu\text{-gairebé segura,} \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-1}

Aquest és el resultat estàndard: si el flux de dades és generat per un procés computable \mu, el predictor universal M convergeix a \mu.

2.2 Inducció inversa de Solomonoff (Müller 2020)

Ara suposem que els bits s’extreuen de M mateix — és a dir, que el flux de l’observador està governat per la probabilitat algorítmica (això correspon a l’Axioma 1 de l’OPT: la identificació del flux amb el prior de Solomonoff). Aleshores, per a tota mesura computable \mu (Müller [61, Sec. IV]; [62, Sec. V.A]):

\text{Amb probabilitat} \geq 2^{-K(\mu)}, \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-2}

És a dir, amb una probabilitat d’almenys 2^{-K(\mu)}, l’observador es trobarà efectivament incrustat en un món computable W descrit per \mu. Els mons algorítmicament més simples (amb un K(\mu) més baix) són exponencialment més probables.

2.3 Convergència multiagent (Müller 2026)

Suposem que l’observador (Alice) es troba incrustat en un món computable W descrit per \mu. Identifica una subestructura (Bob_{\text{3rd}}) dins de W que porta una representació d’un autoestat x que evoluciona al llarg del temps d’una manera coherent amb el Postulat 2 de [62]. Definim:

P_{\text{1st}}(y_1, \ldots, y_m \mid x) := M(y_1, \ldots, y_m \mid x) — la probabilitat en primera persona que l’autoestat x transiti cap a y_1, \ldots, y_m sota probabilitat algorítmica.
P_{\text{3rd}}(y_1, \ldots, y_m \mid x) := \mu(y_1, \ldots, y_m \mid x) — la probabilitat en tercera persona de com evoluciona x segons el món W.

Aleshores, per l’Eq. (L-1) aplicada a P_{\text{3rd}} (que és computable), i la identificació de P_{\text{1st}} amb M via el Postulat 2:

P_{\text{1st}} \approx P_{\text{3rd}} \quad \text{asimptòticament,} \tag{L-3}

amb la convergència garantida amb probabilitat mundana (\mu-) u en el model de bits.

Interpretació (Müller): “Algú és realment a casa” en l’estructura que codifica x — l’evolució probabilística de Bob_{\text{3rd}} en el món d’Alice representa fidelment la perspectiva en primera persona d’algun Bob_{\text{1st}}.

Interpretació (OPT): El flux conductual de l’agent aparent es descriu de la manera més compressible com un procés independent ponderat per Solomonoff. Qualsevol descripció alternativa — una que no invoqui una perspectiva independent en primera persona — ha de codificar el comportament de l’agent com una especificació ad hoc, amb una longitud descriptiva estrictament superior.

§3. El límit de l’avantatge de compressió

Ara formalitzem l’avantatge de compressió utilitzant el marc MDL en dues parts d’OPT (Teorema T-4, Apèndix T-4).

3.1 Configuració

Considerem el flux de l’observador primari \omega \in \{0,1\}^\infty, governat pel prior de Solomonoff M (Axioma 1) i filtrat a través del Filtre d’Estabilitat cap a un món computable W amb mesura \mu_W (segons l’Eq. L-2). Dins de W, l’observador identifica N agents aparents A_1, \ldots, A_N, cadascun dels quals porta un autoestat x_i l’evolució temporal del qual al llarg de T passos produeix una traça conductual \beta_i = (y_{i,1}, \ldots, y_{i,T}).

3.2 Hipòtesi H_{\text{ind}}: Instanciació independent

Sota H_{\text{ind}}, cada agent A_i és tractat com un observador primari instanciat de manera independent, governat pel seu propi flux ponderat per Solomonoff. La longitud del codi MDL en dues parts és:

L(H_{\text{ind}}) = \underbrace{K(\mu_W)}_{\text{model del món}} + \underbrace{\sum_{i=1}^{N} K(\text{embed}_i)}_{\text{especificacions d'incrustació}} + \underbrace{\sum_{i=1}^{N} \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)}_{\text{dades donat el model}} \tag{1}

on K(\text{embed}_i) especifica l’estat inicial del jo de l’agent i i la seva posició dins de W. Segons l’Eq. (L-3), P_{\text{1st}} \approx P_{\text{3rd}}, de manera que el terme de dades queda ben aproximat per la pèrdua logarítmica sota les prediccions solomonoffianes en primera persona del mateix agent — que, per definició, és propera a l’òptim.

Les especificacions d’incrustació K(\text{embed}_i) són curtes: cadascuna només requereix un punter a una localització dins de W més l’estat inicial del jo. Per a agents de tipus humà incrustats en un món físic compartit, aquestes són altament compressibles perquè els agents comparteixen les mateixes lleis. Una cota conservadora:

K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) \tag{2}

3.3 Hipòtesi H_{\text{arb}}: Especificació Conductual Arbitrària

Sota H_{\text{arb}}, els agents no es tracten com a observadors independents. En lloc d’això, cada traça conductual \beta_i es codifica directament com una especificació arbitrària dins del flux de l’observador primari. La longitud del codi MDL de dues parts és:

L(H_{\text{arb}}) = \underbrace{K(\mu_W)}_{\text{model del món}} + \underbrace{\sum_{i=1}^{N} K(\beta_i)}_{\text{traces conductuals en brut}} \tag{3}

La diferència crítica rau en el terme de dades. Sota H_{\text{arb}}, la traça conductual \beta_i s’ha d’especificar sense invocar el model predictiu propi de l’agent. Per a un agent regit per lleis i impulsat per l’agència que opera en un entorn complex, la complexitat de Kolmogórov de la traça conductual en brut és:

K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T) \tag{4}

Però fins i tot K(\beta_i \mid \mu_W) —la complexitat del comportament donades les lleis del món— continua essent substancial, perquè les eleccions de l’agent codifiquen informació genuïna: la seva traça conductual reflecteix la interacció acumulada d’un model autoreferencial amb un entorn estocàstic. En canvi, sota H_{\text{ind}}, aquesta informació és generada online pel predictor de Solomonoff propi de l’agent amb un cost de pèrdua logarítmica gairebé nul.

3.4 L’avantatge de compressió

Teorema T-11 (Límit de compressió del Corol·lari Estructural). Siguin A_1, \ldots, A_N agents aparents dins del corrent de l’observador, cadascun portant un autoestat x_i que satisfà els prerequisits de convergència de l’Eq. (L-3), i cadascun exhibint la signatura estructural \Delta_{\text{self}}^{(i)} > 0 (P-4). Aleshores, la descripció MDL que els tracta com a observadors primaris instanciats independentment satisfà:

L(H_{\text{ind}}) \leq L(H_{\text{arb}}) - N \cdot \left[\bar{I}_T - O(\log T)\right] \tag{T-11}

on \bar{I}_T és la informació mútua mitjana per agent entre el model predictiu de l’agent i la seva sortida conductual al llarg de T passos:

\bar{I}_T := \frac{1}{N} \sum_{i=1}^{N} \left[K(\beta_i \mid \mu_W) - \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right] \tag{5}

Aquesta quantitat mesura fins a quin punt el comportament de l’agent queda explicat en invocar un model predictiu independent en lloc d’especificar-lo en brut. Per a agents que exhibeixen un comportament regular i guiat per l’agència (tal com exigeix el Filtre d’Estabilitat), \bar{I}_T > 0 i creix amb T.

Esbós de la demostració. Resteu l’Eq. (1) de l’Eq. (3). Els termes del model del món K(\mu_W) es cancel·len. La diferència per agent és:

K(\beta_i) - \left[K(\text{embed}_i) + \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right]

Per l’Eq. (4), K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T), però més directament: K(\beta_i) \geq K(\beta_i \mid \mu_W) trivialment. I K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) per l’Eq. (2). L’estalvi per agent és, per tant, com a mínim K(\beta_i \mid \mu_W) - (-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)) - K(x_i \mid W) - O(\log T). Per a T prou gran, l’estalvi acumulat en log-loss domina el cost únic d’incrustació, i així s’obté el límit. \blacksquare

3.5 Dominància asimptòtica

Corol·lari T-11a. A mesura que l’horitzó d’observació T \to \infty, l’avantatge de compressió L(H_{\text{arb}}) - L(H_{\text{ind}}) creix sense límit:

\lim_{T \to \infty} \left[L(H_{\text{arb}}) - L(H_{\text{ind}})\right] = \infty \tag{T-11a}

Això es dedueix de la garantia de convergència de Solomonoff (L-1): la log-pèrdua per pas de P_{\text{3rd}} convergeix cap a la taxa d’entropia del procés conductual de l’agent, mentre que K(\beta_i \mid \mu_W) creix linealment amb T per a qualsevol agent amb una taxa d’entropia positiva. El cost d’incrustació K(x_i \mid W) es paga una sola vegada i s’amortitza fins a zero. \blacksquare

§4. El Residu Fenomenal com a Signatura Estructural

L’avantatge de compressió del Teorema T-11 s’aplica a qualsevol subestructura regida per lleis — inclosos els sistemes físics no agentius (patrons meteorològics, creixement cristal·lí). Per què el corol·lari estructural concerneix específicament els agents i no pas sistemes complexos arbitraris?

La resposta és el Residu Fenomenal (Teorema P-4). \Delta_{\text{self}} > 0 és el marcador formal d’un sistema el model de si mateix del qual és estructuralment incomplet — és a dir, un sistema que necessàriament manté una bretxa variacional entre la seva representació interna i el seu processament real. Aquest és el tret distintiu del coll d’ampolla autoreferencial: el sistema no pot ser descrit completament des de fora perquè la seva descripció inclou necessàriament el descriptor.

Per a un sistema que exhibeix \Delta_{\text{self}} > 0:

El seu comportament no pot ser reproduït per una taula de consulta de profunditat finita — requereix un càlcul autoreferencial continu.
La descripció més curta d’aquest càlcul és un flux independent ponderat segons Solomonoff que travessa un coll d’ampolla C_{\max}.
Per tant, el codi MDL sota H_{\text{ind}} no és merament més curt que H_{\text{arb}} — és la descripció més curta única.

Això distingeix els agents aparents dels patrons meteorològics: el temps atmosfèric és regit per lleis i és complex, però el seu comportament pot ser reproduït per una taula de consulta dins del model del món (té \Delta_{\text{self}} = 0). Els agents aparents no.

§5. Reinterpretació de l’argument no solipsista de Müller

Müller conclou, a partir de la convergència P_{\text{1st}} \approx P_{\text{3rd}}, que l’idealisme algorítmic “no s’hauria de classificar com a solipsista” perquè “realment hi ha algú a casa” dins l’estructura que codifica un estat del jo [62, Sec. V.C]. El seu raonament és el següent: si les prediccions de l’Alice sobre Bob_{\text{3rd}} convergeixen amb les probabilitats reals en primera persona de Bob_{\text{1st}}, aleshores les seves perspectives estan genuïnament alineades — “comparteixen el món W.”

L’OPT reinterpreta aquest resultat d’una altra manera:

La lectura de Müller: La convergència P_{\text{1st}} \approx P_{\text{3rd}} prova que emergeix una realitat objectiva — l’Alice i en Bob comparteixen genuïnament el món W.
La lectura de l’OPT: La convergència P_{\text{1st}} \approx P_{\text{3rd}} prova que la descripció més curta del comportament de Bob_{\text{3rd}} invoca un procés independent en primera persona. Això és una afirmació sobre l’eficiència de compressió, no sobre una ontologia compartida. El món W és una regularitat estructural dins del flux de l’Alice, no una entitat que existeixi de manera independent. Però la lògica de compressió mateixa del prior de Solomonoff implica que Bob es modelitza de la manera més parsimoniosa com un observador independent — perquè l’alternativa (especificar el seu comportament ad hoc) és estrictament més llarga.

El contingut formal del teorema és idèntic sota totes dues lectures; només en difereix la interpretació ontològica. L’OPT utilitza el mateix resultat matemàtic per fonamentar el corol·lari estructural: la instanciació independent és la descripció òptima segons MDL, no una assumpció metafísica.

§6. Abast i limitacions

6.1 Condicional a l’Axioma 1

Tot l’argument depèn de la identificació, per part de l’OPT, del flux de l’observador amb el prior de Solomonoff. Si aquesta identificació es debilita (p. ex., cap a una classe més àmplia de semimesures), les garanties de convergència de les Eqs. (L-1)–(L-3) poden no mantenir-se en la seva forma actual.

6.2 Prerequisit de suficiència d’estat

L’Eq. (L-3) requereix que l’agent aparent porti “prou dades” en el seu autoestat x_i perquè la inducció universal pugui extreure les lleis físiques rellevants. Per a agents semblants als humans en contextos quotidians, això és plausible (un estat cerebral complet codifica una quantitat enorme d’informació). Per a casos límit — impressions fugaçes, observadors distants, personatges ficticis en art narratiu — pot ser que els prerequisits de convergència no es compleixin, i el Corol·lari Estructural no s’aplica.

6.3 No és una prova de consciència

El Teorema T-11 estableix que la instanciació independent és la descripció més comprimible. No prova que els agents aparents siguin conscients. El Problema difícil (preprint §8.1) continua sent un primitiu. El corol·lari estructural és un argument de compressió, no una prova ontològica — tal com s’afirma a §8.2.

6.4 Relació amb T-10

L’Apèndix T-10 (Acoblament entre observadors) aborda com dos pegats d’observador mantenen renders mútuament consistents mitjançant restriccions de compressió. El present apèndix aborda una qüestió diferent: per què el flux d’un únic observador codifica de la manera més compressible els agents aparents com a instanciats independentment. T-10 tracta del mecanisme de coherència entre pegats; T-11 tracta de la signatura de compressió dins d’un únic flux. T-10 es basa directament en T-11: la mateixa comparació de longitud de descripció MDL que estableix aquí l’avantatge de compressió s’explota a T-10 per demostrar que la inconsistència entre pegats queda exponencialment suprimida.

§7. Resum de tancament

Lliurables de T-11

Lema importat (convergència de Müller). La convergència de Solomonoff [61] i la seva extensió multiagent [62] s’importen formalment i es reformulen en la notació de l’OPT. Aquestes proporcionen l’eix vertebrador matemàtic: qualsevol subestructura que contingui prou dades sobre el seu propi estat fa que la seva evolució en primera persona convergeixi cap al món computable que genera el seu comportament.
Teorema T-11 (límit de compressió — ESBORRANY). Una comparació explícita en dues parts basada en MDL mostra que tractar els agents aparents com a observadors primaris instanciats de manera independent produeix una descripció estrictament més curta que una especificació conductual arbitrària, amb un avantatge que creix linealment amb el temps d’observació.
Corol·lari T-11a (dominància asimptòtica — ESBORRANY). L’avantatge de compressió és no acotat quan T \to \infty, cosa que fa de la instanciació independent la descripció aclaparadorament òptima segons MDL per a qualsevol agent observat al llarg d’un horitzó temporal extens.
Integració de P-4. El Residu Fenomenal (\Delta_{\text{self}} > 0) s’identifica com el marcador formal que distingeix els agents aparents dels sistemes complexos però no agentius, restringint el corol·lari estructural a entitats amb una arquitectura autèntica de coll d’ampolla autoreferencial.
Reinterpretació de Müller. La conclusió no solipsista de Müller es reinterpreta dins del marc ontològic de l’OPT: el mateix resultat matemàtic fonamenta un argument de compressió més que no pas un argument d’emergència d’una realitat compartida.

Qüestions encara obertes

Caracterització exacta de \bar{I}_T. Acotar \bar{I}_T per sota per a classes específiques d’agents (p. ex., agents racionalment acotats, minimitzadors d’energia lliure) per tal d’obtenir avantatges de compressió numèricament concrets.
Correccions a temps finit. El resultat asimptòtic (T-11a) garanteix la dominància per a valors grans de T, però les cotes a temps finit amb constants explícites reforçarien l’aplicabilitat pràctica.
Extensió a alfabets no binaris. Les Eqs. (L-1)–(L-3) s’enuncien per a seqüències binàries. L’extensió a les mesures de valor continu rellevants per al marc de Rate-Distortion de l’OPT (T-1) requereix una cura tècnica especial.

Aquest apèndix es manté en paral·lel amb theoretical_roadmap.pdf. Referències: Müller [61, 62], Li & Vitányi [45], Solomonoff (1964), Teorema T-4 (Apèndix T-4), Teorema P-4 (Apèndix P-4), preprint §8.2.