Teoría del Parche Ordenado

Apéndice T-11: El Corolario Estructural — Formalización de la Ventaja de Compresión para Agentes Aparentes

Anders Jarevåg

15 de abril de 2026 | DOI: 10.5281/zenodo.19300777

Tarea original (de §8.2): “Formalizar esta ventaja de compresión como una cota rigurosa de MDL específicamente para el caso de las otras mentes sigue siendo trabajo futuro; el presente argumento es una motivación estructural, no una prueba.” Entregable: Una cota formal que muestre que tratar a los agentes aparentes como observadores primarios instanciados de manera independiente produce un código MDL de dos partes más corto que cualquier descripción alternativa.

Estado de cierre: BORRADOR DE CORRESPONDENCIA ESTRUCTURAL. Este apéndice adapta el teorema de convergencia de Solomonoff de Müller [61] y su extensión multiagente [62] como lemas importados, reinterpretados dentro del marco ontológico de la OPT, para establecer una ventaja formal de compresión para el corolario estructural. El resultado es una cota condicional, no una derivación cerrada: depende de la identificación, por parte de la OPT, de la corriente del observador con el prior de Solomonoff (Axioma 1) y del supuesto de que los agentes aparentes portan estado suficiente para satisfacer los prerrequisitos de convergencia.

§1. Antecedentes y motivación

El Corolario Estructural (preprint §8.2) sostiene que los agentes aparentes dentro del flujo del observador se explican de la manera más parsimoniosa por su instanciación independiente como observadores primarios. Este apéndice proporciona la cadena formal que respalda esa afirmación.

El argumento tiene tres etapas:

Etapa A (Lema importado): El teorema de convergencia de Solomonoff de Müller garantiza que cualquier estructura en el flujo del observador que porte suficientes datos de autoestado hará que su evolución en primera persona converja hasta coincidir con el mundo computable que genera su comportamiento.
Etapa B (Contabilidad de compresión): Realizamos una comparación explícita en dos partes mediante MDL entre tratar al agente aparente como (i) un observador instanciado independientemente, gobernado por su propio flujo ponderado por Solomonoff, frente a (ii) una especificación conductual arbitraria dentro del códec del observador primario.
Etapa C (Firma estructural): El Residuo Fenomenal (\Delta_{\text{self}} > 0, Teorema P-4) proporciona el marcador estructural que distingue una arquitectura genuina de cuello de botella autorreferencial de una mera imitación conductual, cerrando la brecha entre lo “legalmente compresible” y lo “plausiblemente instanciado”.

§2. Lema Importado: Teorema de Convergencia de Müller

Importamos dos resultados de Müller [61, 62], enunciados aquí en la notación de OPT.

2.1 Convergencia de Solomonoff (estándar)

Sea M(b \mid x_1^n) la predicción universal de Solomonoff para el bit b dadas las observaciones previas x_1^n. Sea \mu cualquier medida computable sobre secuencias binarias. Entonces (Solomonoff 1964; Li & Vitányi [45, Corollary 5.2.1]):

\text{Con } \mu\text{-probabilidad uno,} \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-1}

Este es el resultado estándar: si el flujo de datos es generado por un proceso computable \mu, el predictor universal M converge a \mu.

2.2 Inducción de Solomonoff Inversa (Müller 2020)

Supongamos ahora que los bits se extraen de la propia M; es decir, que el flujo del observador está regido por la probabilidad algorítmica (esto corresponde al Axioma 1 de la OPT: la identificación del flujo con el prior de Solomonoff). Entonces, para toda medida computable \mu (Müller [61, Sec. IV]; [62, Sec. V.A]):

\text{Con probabilidad} \geq 2^{-K(\mu)}, \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-2}

Es decir, con probabilidad al menos 2^{-K(\mu)}, el observador se encontrará efectivamente incrustado en un mundo computable W descrito por \mu. Los mundos algorítmicamente más simples (con menor K(\mu)) son exponencialmente más probables.

2.3 Convergencia Multiagente (Müller 2026)

Supongamos que el observador (Alice) se encuentra incrustado en un mundo computable W descrito por \mu. Identifica una subestructura (Bob_{\text{3rd}}) dentro de W que porta una representación de un autoestado x que evoluciona a lo largo del tiempo de un modo consistente con el Postulado 2 de [62]. Definimos:

P_{\text{1st}}(y_1, \ldots, y_m \mid x) := M(y_1, \ldots, y_m \mid x) — la probabilidad en primera persona de que el autoestado x transicione a y_1, \ldots, y_m bajo probabilidad algorítmica.
P_{\text{3rd}}(y_1, \ldots, y_m \mid x) := \mu(y_1, \ldots, y_m \mid x) — la probabilidad en tercera persona de cómo evoluciona x según el mundo W.

Entonces, por la Ec. (L-1) aplicada a P_{\text{3rd}} (que es computable), y la identificación de P_{\text{1st}} con M vía el Postulado 2:

P_{\text{1st}} \approx P_{\text{3rd}} \quad \text{asintóticamente,} \tag{L-3}

con convergencia garantizada con probabilidad mundana (\mu-) uno en el modelo de bits.

Interpretación (Müller): “Alguien está realmente en casa” en la estructura que codifica x — la evolución probabilística de Bob_{\text{3rd}} en el mundo de Alice representa fielmente la perspectiva en primera persona de algún Bob_{\text{1st}}.

Interpretación (OPT): La corriente conductual del agente aparente se describe de la manera más compresible como un proceso independiente ponderado por Solomonoff. Cualquier descripción alternativa —una que no invoque una perspectiva independiente en primera persona— debe codificar el comportamiento del agente como una especificación ad hoc, con una longitud de descripción estrictamente mayor.

§3. La Cota de la Ventaja de Compresión

Ahora formalizamos la ventaja de compresión usando el marco MDL en dos partes de OPT (Teorema T-4, Apéndice T-4).

3.1 Planteamiento

Considérese la corriente del observador primario \omega \in \{0,1\}^\infty, gobernada por el prior de Solomonoff M (Axioma 1) y filtrada a través del Filtro de Estabilidad hacia un mundo computable W con medida \mu_W (por la Ec. L-2). Dentro de W, el observador identifica N agentes aparentes A_1, \ldots, A_N, cada uno portando un autoestado x_i cuya evolución temporal a lo largo de T pasos produce una traza conductual \beta_i = (y_{i,1}, \ldots, y_{i,T}).

3.2 Hipótesis H_{\text{ind}}: Instanciación Independiente

Bajo H_{\text{ind}}, cada agente A_i se trata como un observador primario instanciado de manera independiente, regido por su propia corriente ponderada por Solomonoff. La longitud de código MDL de dos partes es:

L(H_{\text{ind}}) = \underbrace{K(\mu_W)}_{\text{modelo del mundo}} + \underbrace{\sum_{i=1}^{N} K(\text{embed}_i)}_{\text{especificaciones de incrustación}} + \underbrace{\sum_{i=1}^{N} \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)}_{\text{datos dado el modelo}} \tag{1}

donde K(\text{embed}_i) especifica el autoestado inicial del agente i y su posición dentro de W. Por la Ec. (L-3), P_{\text{1st}} \approx P_{\text{3rd}}, de modo que el término de datos queda bien aproximado por la pérdida logarítmica bajo las propias predicciones solomonoffianas en primera persona del agente, que, por definición, es cercana al óptimo.

Las especificaciones de incrustación K(\text{embed}_i) son breves: cada una requiere solo un puntero a una localización en W más el autoestado inicial. Para agentes de tipo humano incrustados en un mundo físico compartido, estas son altamente compresibles porque los agentes comparten las mismas leyes. Una cota conservadora:

K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) \tag{2}

3.3 Hipótesis H_{\text{arb}}: Especificación Conductual Arbitraria

Bajo H_{\text{arb}}, los agentes no se tratan como observadores independientes. En su lugar, cada traza conductual \beta_i se codifica directamente como una especificación arbitraria dentro del flujo del observador primario. La longitud del código MDL de dos partes es:

L(H_{\text{arb}}) = \underbrace{K(\mu_W)}_{\text{modelo del mundo}} + \underbrace{\sum_{i=1}^{N} K(\beta_i)}_{\text{trazas conductuales en bruto}} \tag{3}

La diferencia crítica reside en el término de datos. Bajo H_{\text{arb}}, la traza conductual \beta_i debe especificarse sin invocar el propio modelo predictivo del agente. Para un agente regido por leyes y guiado por agencia, que opera en un entorno complejo, la complejidad de Kolmogórov de la traza conductual en bruto es:

K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T) \tag{4}

Pero incluso K(\beta_i \mid \mu_W) —la complejidad del comportamiento dadas las leyes del mundo— sigue siendo sustancial, porque las elecciones del agente codifican información genuina: su traza conductual refleja la interacción acumulada de un modelo autorreferencial con un entorno estocástico. En cambio, bajo H_{\text{ind}}, esta información es generada online por el propio predictor de Solomonoff del agente a un coste de log-loss cercano a cero.

3.4 La Ventaja de Compresión

Teorema T-11 (Cota Estructural de Compresión del Corolario Estructural). Sean A_1, \ldots, A_N agentes aparentes dentro del flujo del observador, cada uno portando un autoestado x_i que satisface los prerrequisitos de convergencia de la Ec. (L-3), y cada uno exhibiendo la firma estructural \Delta_{\text{self}}^{(i)} > 0 (P-4). Entonces, la descripción MDL que los trata como observadores primarios instanciados de manera independiente satisface:

L(H_{\text{ind}}) \leq L(H_{\text{arb}}) - N \cdot \left[\bar{I}_T - O(\log T)\right] \tag{T-11}

donde \bar{I}_T es la información mutua media por agente entre el modelo predictivo del agente y su salida conductual a lo largo de T pasos:

\bar{I}_T := \frac{1}{N} \sum_{i=1}^{N} \left[K(\beta_i \mid \mu_W) - \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right] \tag{5}

Esta cantidad mide cuánto del comportamiento del agente queda explicado al invocar un modelo predictivo independiente en lugar de especificarlo en bruto. Para agentes que exhiben un comportamiento regido por leyes y guiado por agencia (como exige el Filtro de Estabilidad), \bar{I}_T > 0 y crece con T.

Esbozo de la demostración. Resta la Ec. (1) de la Ec. (3). Los términos del modelo del mundo K(\mu_W) se cancelan. La diferencia por agente es:

K(\beta_i) - \left[K(\text{embed}_i) + \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right]

Por la Ec. (4), K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T), pero de forma más directa: K(\beta_i) \geq K(\beta_i \mid \mu_W) trivialmente. Y K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) por la Ec. (2). El ahorro por agente es, por tanto, al menos K(\beta_i \mid \mu_W) - (-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)) - K(x_i \mid W) - O(\log T). Para T suficientemente grande, el ahorro acumulado en log-loss domina el coste único de incrustación, lo que da la cota. \blacksquare

3.5 Dominancia Asintótica

Corolario T-11a. A medida que el horizonte de observación T \to \infty, la ventaja de compresión L(H_{\text{arb}}) - L(H_{\text{ind}}) crece sin cota:

\lim_{T \to \infty} \left[L(H_{\text{arb}}) - L(H_{\text{ind}})\right] = \infty \tag{T-11a}

Esto se sigue de la garantía de convergencia de Solomonoff (L-1): la log-pérdida por paso de P_{\text{3rd}} converge a la tasa de entropía del proceso conductual del agente, mientras que K(\beta_i \mid \mu_W) crece linealmente en T para cualquier agente con tasa de entropía positiva. El coste de incrustación K(x_i \mid W) se paga una sola vez y se amortiza hasta cero. \blacksquare

§4. El Residuo Fenomenal como Firma Estructural

La ventaja de compresión del Teorema T-11 se aplica a cualquier subestructura regida por leyes, incluidos los sistemas físicos no agentivos (patrones meteorológicos, crecimiento cristalino). ¿Por qué el corolario estructural concierne específicamente a los agentes y no a sistemas complejos arbitrarios?

La respuesta es el Residuo Fenomenal (Teorema P-4). \Delta_{\text{self}} > 0 es el marcador formal de un sistema cuyo automodelo es estructuralmente incompleto; es decir, un sistema que necesariamente mantiene una brecha variacional entre su representación interna y su procesamiento real. Este es el sello distintivo del cuello de botella autorreferencial: el sistema no puede describirse plenamente desde el exterior porque su descripción incluye necesariamente al descriptor.

Para un sistema que exhibe \Delta_{\text{self}} > 0:

Su comportamiento no puede reproducirse mediante una tabla de consulta de profundidad finita: requiere un cómputo autorreferencial en curso.
La descripción más corta de este cómputo es una corriente independiente ponderada por Solomonoff que atraviesa un cuello de botella C_{\max}.
Por tanto, el código MDL bajo H_{\text{ind}} no es meramente más corto que H_{\text{arb}}: es la única descripción más corta.

Esto distingue a los agentes aparentes de los patrones meteorológicos: el tiempo atmosférico está regido por leyes y es complejo, pero su comportamiento puede reproducirse mediante una tabla de consulta dentro del modelo del mundo (tiene \Delta_{\text{self}} = 0). Los agentes aparentes no.

§5. Reinterpretación del argumento no solipsista de Müller

Müller concluye, a partir de la convergencia P_{\text{1st}} \approx P_{\text{3rd}}, que el idealismo algorítmico “no debería clasificarse como solipsista” porque “realmente hay alguien en casa” en la estructura que codifica un estado del yo [62, Sec. V.C]. Su razonamiento es el siguiente: si las predicciones de Alice sobre Bob_{\text{3rd}} convergen hacia las probabilidades efectivas en primera persona de Bob_{\text{1st}}, entonces sus perspectivas están genuinamente alineadas: “comparten el mundo W”.

La OPT reinterpreta este resultado de otro modo:

Lectura de Müller: La convergencia P_{\text{1st}} \approx P_{\text{3rd}} prueba que emerge una realidad objetiva: Alice y Bob comparten genuinamente el mundo W.
Lectura de la OPT: La convergencia P_{\text{1st}} \approx P_{\text{3rd}} prueba que la descripción más corta del comportamiento de Bob_{\text{3rd}} invoca un proceso independiente en primera persona. Se trata de una afirmación sobre eficiencia de compresión, no sobre ontología compartida. El mundo W es una regularidad estructural dentro de la corriente de Alice, no una entidad que exista independientemente. Pero la propia lógica de compresión del prior de Solomonoff implica que Bob se modela de la manera más parsimoniosa como un observador independiente, porque la alternativa (especificar su comportamiento ad hoc) es estrictamente más larga.

El contenido formal del teorema es idéntico bajo ambas lecturas; solo difiere la interpretación ontológica. La OPT utiliza el mismo resultado matemático para fundamentar el Corolario Estructural: la instanciación independiente es la descripción óptima según MDL, no un supuesto metafísico.

§6. Alcance y limitaciones

6.1 Condicional al Axioma 1

Todo el argumento depende de la identificación, por parte de OPT, del flujo del observador con el prior de Solomonoff. Si esta identificación se debilita (p. ej., a una clase más amplia de semimedidas), las garantías de convergencia de las Ecs. (L-1)–(L-3) pueden no mantenerse en su forma actual.

6.2 Prerrequisito de Suficiencia de Estado

La Ec. (L-3) requiere que el agente aparente porte “datos suficientes” en su autoestado x_i para que la inducción universal extraiga las leyes físicas pertinentes. Para agentes de tipo humano en contextos cotidianos, esto es plausible (un estado cerebral completo codifica una enorme cantidad de información). Para casos límite — impresiones fugaces, observadores distantes, personajes ficticios en el arte narrativo — puede que no se satisfagan los prerrequisitos de convergencia, y el Corolario Estructural no se aplica.

6.3 No es una prueba de consciencia

El Teorema T-11 establece que la instanciación independiente es la descripción más compresible. No demuestra que los agentes aparentes sean conscientes. El Problema Difícil (preprint §8.1) sigue siendo un primitivo. El corolario estructural es un argumento de compresión, no una prueba ontológica, como se afirma en §8.2.

6.4 Relación con T-10

El Apéndice T-10 (Acoplamiento entre observadores) aborda cómo dos parches de observador mantienen renders mutuamente consistentes mediante restricciones de compresión. El presente apéndice aborda una cuestión distinta: por qué la corriente de un único observador codifica de la forma más compresible a los agentes aparentes como instanciados de manera independiente. T-10 se refiere al mecanismo de coherencia entre parches; T-11 se refiere a la firma de compresión dentro de una sola corriente. T-10 se basa directamente en T-11: la misma comparación de longitud de descripción de MDL que establece aquí la ventaja de compresión se aprovecha en T-10 para demostrar que la inconsistencia entre parches queda suprimida exponencialmente.

§7. Resumen de cierre

Entregables de T-11

Lema importado (Convergencia de Müller). La convergencia de Solomonoff [61] y su extensión multiagente [62] se importan formalmente y se reformulan en la notación de OPT. Estas proporcionan la columna vertebral matemática: cualquier subestructura que porte datos suficientes sobre su propio estado hace que su evolución en primera persona converja hacia el mundo computable que genera su comportamiento.
Teorema T-11 (Cota de Compresión — BORRADOR). Una comparación explícita en dos partes basada en MDL muestra que tratar a los agentes aparentes como observadores primarios instanciados de manera independiente produce una descripción estrictamente más corta que una especificación conductual arbitraria, y que la ventaja crece linealmente con el tiempo de observación.
Corolario T-11a (Dominancia Asintótica — BORRADOR). La ventaja de compresión es no acotada cuando T \to \infty, lo que convierte a la instanciación independiente en la descripción abrumadoramente óptima en términos de MDL para cualquier agente observado a lo largo de un horizonte temporal extenso.
Integración de P-4. El Residuo Fenomenal (\Delta_{\text{self}} > 0) se identifica como el marcador formal que distingue a los agentes aparentes de los sistemas complejos pero no agenciales, restringiendo el corolario estructural a entidades con una arquitectura genuinamente autorreferencial de cuello de botella.
Reinterpretación de Müller. La conclusión no solipsista de Müller se reinterpreta dentro del marco ontológico de OPT: el mismo resultado matemático fundamenta un argumento de compresión, en lugar de un argumento de emergencia de una realidad compartida.

Puntos aún abiertos

Caracterización exacta de \bar{I}_T. Acotar \bar{I}_T por abajo para clases específicas de agentes (p. ej., agentes racionales acotados, minimizadores de Energía Libre) con el fin de obtener ventajas de compresión numéricamente concretas.
Correcciones a tiempo finito. El resultado asintótico (T-11a) garantiza la dominancia para valores grandes de T, pero cotas a tiempo finito con constantes explícitas reforzarían la aplicabilidad práctica.
Extensión a alfabetos no binarios. Las ecs. (L-1)–(L-3) se formulan para secuencias binarias. La extensión a las medidas de valor continuo relevantes para el marco de Tasa-Distorsión de OPT (T-1) requiere cuidado técnico.

Este apéndice se mantiene en paralelo con theoretical_roadmap.pdf. Referencias: Müller [61, 62], Li y Vitányi [45], Solomonoff (1964), Teorema T-4 (Apéndice T-4), Teorema P-4 (Apéndice P-4), preprint §8.2.