Teoría del Parche Ordenado

Apéndice T-4: Comparación MDL / Parsimonia

Anders Jarevåg

v2.0.0 — 2 de abril de 2026 | DOI: 10.5281/zenodo.19300777

Tarea Original T-4: Comparación MDL / Parsimonia Problema: El preprint en circulación afirma una mayor parsimonia que la física estándar al tratar las leyes físicas como algoritmos macroscópicos de compresión, pero no proporciona una comparación formal en términos de MDL. Entregable: Análisis comparativo de MDL de la OPT frente a clases de modelos de física de referencia bajo convenciones de codificación explícitas.

Estado de cierre: CERRADO (condicionado a la tipicidad y a la normalización de IC). Este apéndice presenta la evaluación formal en términos de MDL exigida por la T-4. Se fijan tres clases de modelos de referencia con convenciones de codificación explícitas. Se establecen cuatro teoremas y una conjetura: (T-4a) la regla selectora de la OPT tiene una longitud de descripción \mathcal{O}(1); (T-4b) la cota de dominancia de Solomonoff acota superiormente la pérdida logarítmica de la OPT; (Conjetura T-4c) la fuente conjeturada de la ventaja estructural de la OPT es la compresión de las condiciones iniciales; (T-4d) la OPT alcanza una ventaja permanente de complejidad de modelo de bits constantes frente a todo modelo de referencia computable; (T-4e) la ventaja para T finito queda cuantificada condicionalmente. El cierre descansa sobre tres condiciones fundamentales: la tipicidad de la corriente del observador, la absorción de la penalización de normalización de Solomonoff \log(1/\xi(\mathcal{O})), y el estado de K(\text{IC} \mid \text{SP}) > K_0.

§1. Fijación de las convenciones de codificación MDL

Las comparaciones MDL carecen de sentido sin convenciones de codificación explícitas y fijas. La §5.1 del preprint señala este requisito, pero lo pospone. Aquí fijamos las convenciones siguiendo a Rissanen (1978) [12] y el marco MDL de dos partes de Li y Vitányi (2008) [27].

1.1 La longitud de código en dos partes

Para una clase de hipótesis \mathcal{M} y una secuencia de observaciones y_{1:T} \in \{0,1\}^*, la longitud de código MDL en dos partes es:

L_T(\mathcal{M}) = K(\mathcal{M}) + L(y_{1:T} \mid \mathcal{M}) \tag{preprint §5.1, Eq. 13}

donde K(\mathcal{M}) es la complejidad de Kolmogórov prefija de la hipótesis —la longitud del programa autodelimitado más corto en una máquina de Turing universal (UTM) fija que produce una descripción completa de \mathcal{M}— y L(y_{1:T} \mid \mathcal{M}) es el logaritmo negativo de la verosimilitud de los datos bajo el mejor modelo predictivo de \mathcal{M}:

L(y_{1:T} \mid \mathcal{M}) = -\log_2 P_\mathcal{M}(y_{1:T})

Para teorías deterministas (las leyes + IC determinan de manera unívoca las observaciones), L(y_{1:T} \mid \mathcal{M}) = 0 cuando y es consistente con la teoría y L = \infty en caso contrario. Todos los logaritmos son en base 2; todas las longitudes de código, en bits.

1.2 La máquina universal

Fijamos una única UTM óptima \mathcal{U} en todo el texto. Todas las complejidades de Kolmogórov son relativas a \mathcal{U}; los resultados cambian a lo sumo en \mathcal{O}(1) bits bajo una elección distinta de UTM. La medida de Solomonoff \xi se define relativa a \mathcal{U} (preprint, Ec. 1). Esto fija la convención para todas las comparaciones posteriores.

1.3 Alcance de y_{1:T}

Comparamos modelos en el dominio que cada uno fue diseñado para predecir: la corriente consciente del observador y_{1:T} = z_{0:T} (la secuencia de estados latentes comprimidos, C_{\max} bits por segundo durante T segundos). La física estándar se evalúa en el mismo dominio reduciendo sus predicciones a la corriente compatible con el observador mediante grano grueso. A ambas teorías se les exige dar cuenta de exactamente las mismas observaciones.

§2. Clases de modelos de referencia

Se fijan tres clases de referencia. A cada una se le asigna una estimación explícita de K(\mathcal{M}) bajo nuestra convención UTM. Los valores numéricos precisos son estimaciones de orden de magnitud; los resultados estructurales de §§3–7 dependen solo del ordenamiento, no de los valores exactos.

2.1 \mathcal{M}_1 — Modelo Estándar + Relatividad General

La teoría física más predictivamente precisa disponible en la actualidad. Su descripción requiere tres componentes:

Estructura matemática K_{\text{struct}}: el grupo gauge \text{SU}(3) \times \text{SU}(2) \times \text{U}(1), la invariancia de Lorentz, la renormalizabilidad y la simetría de difeomorfismo de la RG. Complejidad de Kolmogórov: K_{\text{struct}} \approx 10^3 bits.
Valores de los parámetros K_{\text{param}}: 19 parámetros libres del ME + 3 ángulos de mezcla + 1 fase CP + \Lambda + G + c \approx 25 constantes codificadas con precisión experimental (\sim 30 bits cada una): K_{\text{param}} \approx 750 bits.
Condiciones iniciales K_{\text{IC}}: bajo el paradigma inflacionario, K_{\text{IC}}^{\text{inf}} \approx 200–400 bits. Nota: aquí no puntuamos la cota de entropía termodinámica 10^{123} de Penrose porque mide volumen macroscópico del espacio de fases (S), no complejidad algorítmica específica de Kolmogórov (K). El microestado específico puede ser altamente compresible. Nos apoyamos exclusivamente en las cotas inflacionarias rigurosas.

K(\mathcal{M}_1) = K_{\text{struct}} + K_{\text{param}} \approx 1750 \text{ bits}

K(\text{IC} \mid \mathcal{M}_1) \approx 300 \text{ bits (inflacionario)}

2.2 \mathcal{M}_2 — TCC renormalizable genérica

La clase de todas las teorías cuánticas de campos renormalizables en \leq 4 dimensiones espaciotemporales. Esta clase contiene a \mathcal{M}_1 como uno de sus miembros. Dado que también deben especificarse el grupo de gauge y el contenido de partículas:

K(\mathcal{M}_2) \gg K(\mathcal{M}_1) \gg 1750 \text{ bits}

\mathcal{M}_2 se incluye como contrapunto a la tesis de la OPT de que las leyes se seleccionan, no se enumeran. Aunque la comparación MDL con \mathcal{M}_2 se gana trivialmente por cualquier subclase finita (incluida \mathcal{M}_1), porque K(\mathcal{M}_2) no está acotada, su inclusión sirve formalmente para demostrar la escala infinita del problema de selección de parámetros que el Filtro de Estabilidad colapsa de manera nativa.

2.3 \mathcal{M}_3 — Cerebro de Boltzmann / Fluctuación Térmica

Física estándar con condiciones iniciales máximamente simples: un estado térmico (de entropía máxima) a escala de Planck. Las leyes son idénticas a \mathcal{M}_1; las condiciones iniciales son trivialmente simples:

K(\mathcal{M}_3) \approx K(\mathcal{M}_1) \approx 1750 \text{ bits}, \qquad K(\text{IC} \mid \mathcal{M}_3) \approx 10 \text{ bits}

Sin embargo, la log-verosimilitud de observar una corriente consciente ordenada y_{1:T} bajo \mathcal{M}_3 es astronómicamente pequeña: L(y_{1:T} \mid \mathcal{M}_3) \approx K(y_{1:T}) \gg T \cdot C_{\max}. Por tanto, \mathcal{M}_3 tiene un coste de IC despreciable, pero un coste de verosimilitud catastrófico, y se incluye para mostrar que la ventaja MDL de OPT no se logra mediante el mismo truco.

§3. Longitud de Código de la OPT — Teorema T-4a

La longitud de código MDL para la OPT se descompone como:

L_T(\text{OPT}) = K(\xi, \text{Filter}) + L(y_{1:T} \mid \xi, \text{Filter}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

donde \xi^{\text{Filter}} es la medida de Solomonoff \xi condicionada sobre la clase compatible con el observador \mathcal{O} (flujos que satisfacen R_{\text{req}} \leq B_{\max}), y K_0 = K(\xi, \text{Filter}) es la longitud de descripción de la regla selectora.

Teorema T-4a (Cota de Complejidad de la Metarregla). K(\xi, \text{Filter}) = K_0 = \mathcal{O}(1) bits. En concreto:

K_0 \leq K(\mathcal{U}) + K(C_{\max}) + K(\Delta t) + c

donde K(\mathcal{U}) es la complejidad de la UTM, K(C_{\max}) = \mathcal{O}(\log C_{\max}) bits codifica el umbral de ancho de banda con precisión experimental, K(\Delta t) = \mathcal{O}(\log \Delta t) codifica la ventana de actualización, y c es una pequeña constante universal.

Prueba. La medida de Solomonoff \xi queda determinada de manera única por la UTM fija \mathcal{U}, de modo que K(\xi \mid \mathcal{U}) = \mathcal{O}(1). El Filtro de Estabilidad requiere dos parámetros: C_{\max} y \Delta t, cada uno medido con \sim 4 cifras significativas, por lo que K(C_{\max}, \Delta t) \leq 2 \times (4 \times \log_2 10) \approx 26 bits. La condición R_{\text{req}} \leq B_{\max} es una única desigualdad en notación fija: \sim 10 bits. Total: K_0 \leq K(\mathcal{U}) + 36 bits.

Para absorber K(\mathcal{U}) de manera justa, debemos asumir una UTM “epistémicamente neutral”, es decir, una máquina de referencia cuyo conjunto de instrucciones incorporado no codifique preferentemente ninguna teoría física (esto es, una geometría básica de combinadores o equivalente a Brainfuck, completamente agnóstica respecto de la física). Bajo una máquina no sesgada de este tipo, es válido mantener K(\xi, \text{Filter}) \approx 36 bits mientras se estandariza K(\mathcal{M}_1) \approx 1750 bits. Reconocemos que esto deja específicamente el recuento absoluto de bits vulnerable a un escalado constante \mathcal{O}(1) si se cambia la UTM, lo que significa que el cálculo de 36 frente a 1750 es intrínsecamente relativo. La formulación matemática estructuralmente honesta aquí es el orden de rango (K_0 \ll K(\mathcal{M}_1)), que afirma una ventaja estructural robusta independiente de la constante numérica precisa. \blacksquare

Comparación: Excluyendo la sobrecarga compartida de la UTM, K_0 \approx 36 bits frente a K(\mathcal{M}_1) \approx 1750 bits. La regla selectora de la OPT es más breve que la descripción del Modelo Estándar en K(\mathcal{M}_1) - K_0 \approx 1714 bits. Esta es la ventaja de parsimonia estructural reivindicada en el §5 del preprint, ahora con un recuento explícito de bits.

§4. La cota de dominancia de Solomonoff — Teorema T-4b

Teorema T-4b (Cota de Dominancia de Solomonoff). Para cualquier medida de física computable \nu (incluidas \mathcal{M}_1, \mathcal{M}_2, \mathcal{M}_3) con K(\nu) < \infty, y para cualquier flujo de datos y_{1:T}:

L_T(\text{OPT}) \leq L_T(\nu) + K'_0

donde K'_0 = K_0 + \log(1/\xi(\mathcal{O})). Esto representa la complejidad de la regla base más la penalización de normalización algorítmica necesaria que se incurre al condicionar la medida universal sobre la clase de observadores \mathcal{O}.

Demostración. A partir de la definición de la medida de Solomonoff (preprint, Ec. 1), con w_\nu \asymp 2^{-K(\nu)}:

\xi(y_{1:T}) \geq w_\nu \cdot \nu(y_{1:T}) \geq 2^{-K(\nu)} \cdot \nu(y_{1:T})

Tomando logaritmos negativos:

-\log \xi(y_{1:T}) \leq -\log \nu(y_{1:T}) + K(\nu)

Al pasar de la medida universal \xi al filtro restringido \xi^{\text{Filter}}, pagamos el coste de normalización -\log \xi^{\text{Filter}}(y) = -\log \xi(y) + \log(1/\xi(\mathcal{O})). Sustituyendo en L_T(\text{OPT}):

L_T(\text{OPT}) = K_0 - \log \xi^{\text{Filter}}(y_{1:T}) \leq K_0 + \log(1/\xi(\mathcal{O})) + K(\nu) - \log \nu(y_{1:T}) = K'_0 + L_T(\nu) \qquad \blacksquare

Salvedad importante. El Teorema T-4b no muestra que OPT supere a SP. Muestra que OPT no puede hacerlo peor que ningún referente en más de K'_0 bits. En adelante absorbemos \log(1/\xi(\mathcal{O})) en K_0 asumiendo que la clase de secuencias de observadores queda acotada limpiamente en relación con las constantes estructurales de la UTM, pero señalamos esta brecha de normalización como una vulnerabilidad formal.

§5. La Compresión de las Condiciones Iniciales — Teorema T-4c

La fuente estructural de la ventaja MDL de OPT es la compresión de las condiciones iniciales. En la física estándar, las leyes y las condiciones iniciales son objetos separados que deben describirse ambos. En OPT, las condiciones iniciales se absorben en el prior: la medida de Solomonoff ya asigna el mayor peso a las corrientes más simples compatibles con el observador, haciendo redundante una especificación separada de las CI.

5.1 El argumento de redundancia de las IC

Bajo la física estándar (\mathcal{M}_1), el código MDL completo para una teoría determinista es:

L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) + 0 \qquad \text{[determinista: } -\log P = 0 \text{ si es consistente]}

El término IC K(\text{IC} \mid \text{laws}) es la longitud descriptiva de las condiciones iniciales específicas dadas las leyes; no es derivable de las propias leyes. Este es el locus del ajuste fino.

Bajo la Teoría del Parche Ordenado (OPT), el código en dos partes es:

L_T(\text{OPT}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

El término -\log \xi^{\text{Filter}}(y_{1:T}) codifica la corriente específica dada la metarregla. El prior de Solomonoff ya incorpora un modelo universal de la física: -\log \xi(y) \approx K(y). La codificación de OPT nunca necesita pagar por separado las IC.

Conjetura T-4c (cota heurística de compresión de las IC). Definamos la ventaja de compresión de las IC:

\Delta_{\text{IC}} = K(\text{IC} \mid \text{SP laws}) - K(\text{IC} \mid \text{OPT})

Sostenemos la siguiente cota heurística:

\boxed{L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1)}

donde K(\text{IC} \mid \text{OPT}) := K(\text{IC} \mid \xi, \text{Filter}, \text{codec}) es la longitud descriptiva residual de las condiciones iniciales dada la modelización completa de OPT. \Delta_{\text{IC}} \geq 0, con igualdad si y solo si el Filtro de Estabilidad no proporciona ninguna compresión adicional de las IC más allá de la que ya aportan las leyes.

Argumento. Partiendo del código completo en dos partes para SP y aplicando la dominancia de Solomonoff (absorbiendo las constantes de normalización en un término de acotación \mathcal{O}(1) de la UTM):

L_T(\text{OPT}) \leq K_0 + K(\text{laws}) + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) + \mathcal{O}(1)

Reordenando y sustituyendo L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) (teoría determinista):

L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 + \mathcal{O}(1)

Dentro de OPT, -\log \xi^{\text{Filter}}(y_{1:T}) no necesita codificar individualmente las IC: el Filtro selecciona a partir del prior de Solomonoff, que comprime las IC de manera inherente mediante ponderaciones por longitud. La subaditividad de la AIT garantiza que K(\text{IC} \mid x, f(x)) \leq K(\text{IC} \mid x) + \mathcal{O}(1). Si postulamos que la regla de selección de OPT se acota como una cadena descriptiva más ajustada que la mera declaración de las leyes en bruto (que es la apuesta central del marco, no una prueba derivada matemáticamente), entonces el K(\text{IC} \mid \text{OPT}) residual codificado no puede exceder significativamente a K(\text{IC} \mid \text{laws}). De ello se sigue heurísticamente que \Delta_{\text{IC}} \geq 0.

Por sustitución: L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1). \blacksquare

Observación. Planteamos la hipótesis de que la compresión antrópica K(\text{IC} \mid \text{OPT}) \approx 0 opera en el límite en que el Filtro de Estabilidad es altamente restrictivo, mapeando matemáticamente a estados compatibles con observadores de manera única. Se trata de una proposición física motivada, más que de una cota de unicidad demostrada algorítmicamente.

§6. Ventaja de Complejidad de Modelo de Bits Constantes — Teorema T-4d

Teorema T-4d (Ventaja Permanente de MDL de Bits Constantes — Condicionada a la Tipicidad). Para todo modelo físico computable fijo y no trivial \nu con K_0 < K(\nu) < \infty, la formulación de la OPT alcanza una ventaja fija y permanente de complejidad de modelo específicamente para cualquier y_{1:T} \in \mathcal{O} que sea además típico respecto de \nu. A medida que la longitud de la secuencia T \to \infty, la diferencia total de longitud de código queda estructuralmente acotada:

L_T(\text{OPT}) - L_T(\nu) \to K_0 - K(\nu)

Prueba. A partir de T-4b, L_T(\text{OPT}) \leq K'_0 - \log \xi^{\text{Filter}}(y_{1:T}). Para cualquier \nu computable, el teorema de Solomonoff garantiza que \xi converge a \nu exactamente sobre secuencias típicas respecto de \nu: medido como \nu-casi-todo y_{1:\infty}. Nótese aquí la profunda tensión formal: el Filtro de Estabilidad aísla corrientes que se evalúan estrictamente como de baja entropía y estructuradas, cartografiándolas de manera nativa como estructuralmente atípicas en comparación con las corrientes de medida \nu estándar no restringidas de máxima entropía. A menos que la clase de observadores filtrada \mathcal{O} y la clase típica respecto de \nu posean un solapamiento matemático no trivial demostrable, el límite de convergencia de Solomonoff no puede aprovecharse de manera nativa. En consecuencia, este teorema se aplica condicionalmente si y solo si la corriente específica del observador filtrado permanece típica respecto de \nu bajo las leyes de referencia específicas (dejando formalmente no caracterizado el conjunto de tales corrientes intersectantes teóricamente conformes):

-\frac{1}{T} \log \xi(y_{1:T}) \to H(\nu) \quad \text{cuando } T \to \infty

donde H(\nu) es la tasa de entropía de \nu. De manera análoga, -\frac{1}{T} \log \nu(y_{1:T}) \to H(\nu). Asintóticamente, los términos de verosimilitud de log-loss por bit convergen y se igualan, lo que significa que la ventaja restante en la longitud total de código se aísla puramente en la longitud de descripción del modelo:

\left[L_T(\text{OPT}) - L_T(\nu)\right] \to K_0 - K(\nu) < 0 \qquad \text{[puesto que } K_0 \approx 36 \text{ frente a } K(\nu) \sim 1750 \text{]}

Nota: Aunque la longitud de código total mantiene esta ventaja permanente fija en bits, la ventaja por bit (\frac{K_0 - K(\nu)}{T}) se reduce activamente hasta cero. Esto no representa una ventaja asintóticamente creciente de manera continua mediante acumulación de datos, sino más bien un desplazamiento estructural rígido y permanente. \blacksquare

Estimación numérica para \mathcal{M}_1: K(\mathcal{M}_1) - K_0 \approx 1714 bits. Una vez que las verosimilitudes de log-loss convergen a lo largo de ventanas de observación típicas respecto de \nu suficientemente amplias, la OPT mantiene una superioridad matemática permanente en la codificación total de aproximadamente 1714 bits.

§7. La Ventaja Condicional de T Finito — Teorema T-4e

Para secuencias de longitud finita, la comparación MDL requiere que la ventaja de compresión de IC de T-4c exceda la sobrecarga K_0.

Teorema T-4e (Ventaja MDL Condicional para T Finito). La OPT logra una ventaja MDL estricta para T finito sobre \mathcal{M}_1 — es decir, L_T(\text{OPT}) < L_T(\mathcal{M}_1) — si y solo si se cumple la siguiente condición:

\boxed{K(\text{IC} \mid \text{SP laws}) > K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y_{1:T}) - \left(-\log P_{\text{SP}}(y_{1:T})\right)\right]}

El corchete del lado derecho es el déficit de log-verosimilitud de la OPT con respecto a SP en la secuencia específica y_{1:T}. La condición se satisface siempre que el coste descriptivo de IC exceda la sobrecarga combinada de la metarregla y el déficit predictivo de la OPT en esta secuencia.

Demostración. Manipulación directa de las longitudes de código en dos partes:

L_T(\text{OPT}) < L_T(\text{SP}) \iff \quad K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) - \log \xi^{\text{Filter}}(y) < K_{\text{laws}} + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) \iff \quad K(\text{IC} \mid \text{laws}) - K_0 > \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] + \left[K_{\text{laws}} - K_{\text{laws}}\right]

Reordenando (se cancela K_{\text{laws}} en ambos lados) se obtiene directamente la condición enunciada. \blacksquare

7.1 Evaluación de la Condición para la Cosmología Estándar

Bajo la codificación inflacionaria (el caso más favorable para SP):

K(\text{IC} \mid \text{SP laws}) \approx 300 bits (parámetros inflacionarios + número de e-folds + recalentamiento)
K_0 \approx 36 bits (T-4a)
El déficit de log-verosimilitud: Hipotetizamos funcionalmente que la OPT, equipada con los límites del códec R_{T,h}(D) cartografiados en T-1, alcanza una log-verosimilitud puntual al menos tan robusta como la de la física estándar sobre una corriente compatible con el observador. Nótese que las cotas de Solomonoff solo proporcionan estrictamente dominancia sobre sumas esperadas, no cotas puntuales definitivas sobre corrientes singulares específicas; por tanto, \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] \leq 0 representa una expectativa estructural empírica más que una garantía algorítmica.

Por tanto, la condición se reduce a K(\text{IC} \mid \text{SP laws}) > K_0, es decir, 300 > 36. Esto se cumple con un margen estructural sustancial. La condición solo falla si IC cuesta menos de \sim 36 bits; es decir, si la IC específica de nuestro universo es estructuralmente derivable únicamente a partir de las leyes de SP, generando menos de 36 bits residuales. Ningún modelo cosmológico actual logra esto.

§8. La tabla comparativa de MDL

Modelo	K(\mathcal{M}) (bits)	K(\text{IC}\mid\mathcal{M}) (bits)	-\log P(y\mid\mathcal{M})	L_T total	rango MDL
\mathcal{M}_1 — SM + GR	\sim 1750	\sim 300 (inflacionario)	\sim 0 (determinista)	\sim 2050	2.º (inflacionario)
\mathcal{M}_3 — Boltzmann	\sim 1750	\sim 10	\gg 0 (flujo raro)	\gg 1760	Último (verosimilitud catastrófica)
\mathcal{M}_{\text{OPT}} — OPT	\sim 36	\sim 0 (condicional mediante un Filtro altamente restringido)	*\sim 0^ (aprox. determinista del códec)**	\sim 36 (condicional)	1.º (condicional)

^* Bajo la identificación explícita del códec de §9.2, el término de datos activo de OPT se reduce a -\log P_{K_\theta}(y) = -\log P_\text{SP}(y) = 0 una vez que K_\theta se identifica con el códec SP.

§9. Límites de la comparación

9.1 K(y \mid \text{Filter}) no es computable

La longitud de código de OPT K_0 + K(y \mid \text{Filter}) = K_0 - \log \xi^{\text{Filter}}(y) contiene un término que no es computable en el sentido de Turing (el problema de la parada impide calcular \xi exactamente). En la práctica, las predicciones de OPT deben aproximarse mediante un códec finito K_\theta, lo cual es estándar en física. Esto significa que, para fines predictivos, OPT se reduce al mejor códec computable disponible. La ventaja MDL de OPT sobre SP es, por tanto, una ventaja estructural (en la descripción de la regla de selección) más que una ventaja operativa a la hora de generar predicciones novedosas.

Esto no es un defecto: es el contenido formal correcto de la afirmación del preprint: “OPT desplaza parte de la carga explicativa de la enumeración de leyes a la selección de leyes”. El desplazamiento es real y está formalmente cuantificado (\approx 1700 bits para la regla de selección frente a \mathcal{M}_1), pero no genera contenido predictivo nuevo más allá de lo que el códec ya proporciona.

9.2 El problema de identificación del códec

El códec OPT K_\theta es la medida computable específica de \mathcal{M} que selecciona el Filtro de Estabilidad. T-4 no determina cuál es esa medida; esa identificación requiere T-5 (recuperación de constantes) y el programa completo de unificación física. Hasta que K_\theta se identifique explícitamente con SM + GR, la comparación MDL es condicional a dicha identificación. La cota formal L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 garantiza que la OPT no puede hacerlo peor que SP, pero no garantiza que lo haga mejor en tiempo finito a menos que se cumpla la condición IC de T-4e, lo cual efectivamente ocurre bajo supuestos cosmológicos estándar.

Restricción de P-2. El Apéndice P-2 (incrustación en el espacio de Hilbert mediante corrección cuántica de errores) establece que, bajo ruido local, el códec debe satisfacer una estructura QECC: su representación interna debe constituir un código cuántico de corrección de errores con parámetros específicos (n, k, d). Esto acota el problema de identificación del códec: K_\theta deja de ser una medida computable arbitraria para pasar a ser una cuyas estados predictivos portan la geometría correctora de errores de un espacio de Hilbert. Esta restricción es previa al programa de recuperación de constantes de T-5 y puede aportar criterios de selección adicionales para identificar K_\theta con el Modelo Estándar.

§10. Resumen de cierre

Entregables de T-4 — Cierre confirmado (con condiciones de normalización y tipicidad)

Convenciones de codificación fijadas (§1). MDL de dos partes, complejidad de Kolmogórov prefija relativa a una UTM fija inclusiva, mapeando el dominio de datos funcionalmente sobre la corriente consciente y_{1:T} = z_{0:T}.
Clases de referencia fijadas (§2). Evalúa \mathcal{M}_1 (SM+GR) frente a fronteras triviales como \mathcal{M}_2 (selección explosiva del parámetro de alcance generativo) y \mathcal{M}_3 (colapso de verosimilitud de Boltzmann).
T-4a (Complejidad de la metarregla). K(\xi, \text{Filter}) = K_0 \approx 36 bits, incluidos los desplazamientos relativos de la UTM.
T-4b (Solomonoff acotado). L_T(\text{OPT}) \leq L_T(\nu) + K_0 + \log(1/\xi(\mathcal{O})). Define explícitamente el parámetro de penalización de normalización algorítmica.
Conjetura T-4c (Cota heurística de compresión de IC). La redundancia estructural de las condiciones iniciales es el motor conjeturado de la compresión: \Delta_{\text{IC}} = K(\text{IC}\mid\text{SP}) - K(\text{IC}\mid\text{OPT}) \geq 0, aunque la unicidad del mapeo es condicional. Esto funciona como una cota heurística, no como un teorema formalmente demostrado.
T-4d (Ventaja del modelo de bits constantes). Acota condicionalmente el comportamiento límite: para referencias computables cuya clase típica-\nu se solapa de manera no trivial con \mathcal{O}, OPT asegura una ventaja permanente de complejidad numérica (\sim -1714 bits), aunque su densidad infinita por bit escala a cero.
T-4e (Ventaja en T finito — condicional). OPT supera numéricamente a \mathcal{M}_1 en T finito exactamente cuando las pérdidas empíricas puntuales no revierten la frontera estructural central K(\text{IC}\mid\text{SP}) > K_0 (300 > 36). Sitúa la vulnerabilidad directamente en los supuestos de dominancia algorítmica puntual.

Condiciones de falsación para la afirmación MDL

Una derivación de las condiciones iniciales cosmológicas a partir únicamente de las leyes SP en menos de \sim 36 bits, mostrando que K(\text{IC} \mid \text{SP laws}) < K_0.
Una demostración de que la restricción del Filtro de Estabilidad a corrientes compatibles con observadores no comprime IC; es decir, K(\text{IC} \mid \xi, \text{Filter}) = K(\text{IC} \mid \text{laws}), dando \Delta_{\text{IC}} = 0.
Un códec computable explícito K_\theta para OPT que sea demostrablemente menos preciso que SM+GR en corrientes de observador, de modo que el déficit de log-verosimilitud exceda la ganancia de compresión de IC.

Dependencias posteriores

T-5 (Recuperación de constantes) es el siguiente paso esencial: una vez que el códec K_\theta se identifica con las leyes SM+GR vía T-1/T-2/T-3, la comparación MDL se vuelve completamente explícita y la condición en T-4e pasa a ser una desigualdad concreta entre magnitudes conocidas.
Actualización de la prepublicación §5.2: la frase “Whether this meta-rule yields an actual MDL advantage… is an open comparative question” puede actualizarse ahora a: “Theorem T-4d establishes a conditional asymptotic advantage (for observer streams that are also \nu-typical under the benchmark physics, a set currently uncharacterised); Theorem T-4e establishes a conditional finite-T advantage; see Appendix T-4.”

Este apéndice se mantiene como parte del repositorio del proyecto OPT junto con theoretical_roadmap.pdf. Referencias: Rissanen (1978) [12], Li & Vitányi (2008) [27], Solomonoff (1964) [11], Penrose (2004).