Apéndice E-11 de OPT: Simulación Computacional del Ciclo de Vida Tasa-Distorsión

Anders Jarevåg

Abril de 2026

Apéndice E-11: Simulación computacional del ciclo de vida tasa-distorsión

Este apéndice documenta la modelización in silico del ciclo de vida del códec en la Teoría del Parche Ordenado (OPT). Dado que el sustrato universal subyacente (la Semimedida Universal de Solomonoff) es estructuralmente incomputable, las simulaciones dentro del marco de la OPT se restringen a modelizar el ciclo de vida del códec en sí: el parámetro de compuerta de frontera C_{\max}, la dinámica de Inferencia Activa, el ciclo de mantenimiento de tres pasadas \mathcal{M}_\tau y el decaimiento narrativo bajo estrés entrópico.

Se han establecido dos paradigmas de simulación distintos: aprendizaje profundo analógico (toy_model.py) y modelización matemática estricta de tasa-distorsión (opt_simulator.py).

1. Simulación Analógica: Cuellos de Botella Variacionales Profundos

El paradigma inicial de simulación (toy_model.py) valida la premisa central de la Fractura del Códec mediante una analogía estructural literal.

Sustrato: Una red periódica unidimensional instanciada con enteros discretos. Se inyectan rasgos estructurales persistentes sobre una línea de base de ruido termodinámico, funcionando como los “Parches Ordenados” observables.

Arquitectura: El observador se modela como un Cuello de Botella de Información Variacional (VIB) construido sobre una red neuronal profunda (TensorFlow). La red observa un vector de historia espacial X_{t-k \dots t} y realiza un descenso de gradiente hacia adelante para comprimirlo en un cuello de botella capaz de predecir el abanico temporal futuro X_{t+1 \dots t+h}.

Mecánica del Colapso: Las restricciones de C_{\max} (tasa) y D_{\min} (distorsión aceptable) se imponen dinámicamente mediante un controlador PID que modula el multiplicador lagrangiano \beta. Bajo una entropía masiva del sustrato (p. ej., ruido altamente volátil que domina los patrones persistentes), la red intercambia físicamente resolución predictiva por ancho de banda. Cuando la complejidad algorítmica requerida R_{\text{req}} supera C_{\max} pese al ajuste máximo de \beta, la red alcanza formalmente una singularidad algorítmica y colapsa, confirmando la predicción de la OPT de que inyectar ruido de alta entropía destruye la coherencia predictiva en lugar de “expandir” la conciencia.

2. Formalismo Matemático: Modelado Estricto de Tasa-Distorsión

Aunque el VIB neuronal proporciona confirmación visual de la fractura del códec, la sobrecarga de las arquitecturas de aprendizaje automático oscurece las relaciones puramente informacionales que gobiernan al observador. El segundo paradigma (opt_simulator.py) elimina la geometría estructural para modelar estrictamente la dinámica del cuello de botella usando los propios escalares de la teoría.

2.1 Arquitectura

El simulador separa tres capas estructurales, en correspondencia con el formalismo de la OPT:

Componente	Concepto de la OPT	Implementación
`PhenomenalStateTensor`	K(P_\theta(t))	Complejidad estable del códec C_{\text{state}}, acotada por C_{\text{ceil}} (techo de ejecutabilidad) y C_{\text{floor}} (códec mínimo viable)
`StabilityFilter`	apertura C_{\max}	Solo deja pasar el error de predicción \varepsilon_t a través del cuello de botella; se fractura cuando \varepsilon_t > C_{\max} \cdot \Delta t
`ActiveInferenceCodec`	Modelo generativo K_\theta	Predictibilidad endógena derivada de la profundidad del códec; estacionariedad ambiental como perturbación exógena
`MaintenanceCycle`	\mathcal{M}_\tau	Gestión offline de la complejidad en tres pasadas (poda, consolidación, muestreo del Abanico Predictivo)

El principio de diseño clave es que la predictibilidad es endógena: la capacidad del códec para predecir el entorno se deriva de C_{\text{state}} mediante una relación de ley de potencia \text{error} \propto C_{\text{state}}^{-0.6}, en lugar de ser un parámetro codificado de forma rígida. Esto significa que las cascadas de fractura y las trayectorias de recuperación emergen de la dinámica propia del sistema, en vez de imponerse manualmente.

2.2 El Canal de Error de Predicción

Bajo la teoría predictiva de tasa-distorsión, lo que atraviesa la apertura C_{\max} es el error de predicción: solo el residuo que queda después de sustraer la predicción del modelo generativo:

\varepsilon_t = S_{\text{raw}} \cdot (1 - \text{predictability})

donde S_{\text{raw}} = 10^9 \cdot \Delta t bits por ventana de actualización. En la línea de base (C_{\text{state}} \approx 10^{14}, estacionariedad = 1.0), esto produce \varepsilon_t \approx 0.16 bits/paso, cómodamente por debajo del límite de capacidad de C_{\max} \cdot \Delta t = 0.5 bits/paso.

Cuando la estacionariedad del entorno disminuye (p. ej., choque por ketamina, estacionariedad \to 0.1), el error de predicción efectivo se amplifica por un factor de 1/\text{stationarity}, empujando \varepsilon_t por encima del límite de capacidad y desencadenando la fractura.

2.3 El Ciclo de Mantenimiento de Tres Pasadas (\mathcal{M}_\tau)

El ciclo de mantenimiento implementa las tres pasadas offline especificadas en §3.6 del preprint:

Pasada	Operación	Tasa	Correspondencia en OPT
I. Poda	Eliminación MDL de parámetros de bajo valor	4% de C_{\text{state}}	borrado con \Delta_{\text{MDL}} < 0
II. Consolidación	Recompresión de patrones adquiridos recientemente	3% de C_{\text{state}}	compresión MDL bajo presupuesto de distorsión
III. Abanico Predictivo	Autoevaluación adversarial (proxy de sueño REM)	+1% de C_{\text{state}}	muestreo del Abanico Predictivo frente a futuros hostiles

Drenaje neto por ejecución de mantenimiento: \sim 6\% de C_{\text{state}}. El mantenimiento está condicionado por la estabilidad: solo se activa cuando el códec no está fracturado, en consonancia con la predicción de la OPT de que \mathcal{M}_\tau opera durante estados de bajo sensorio (paradigmáticamente: el sueño).

La tasa de acumulación de aprendizaje está calibrada de modo que la ganancia de integración del error a lo largo de 100 pasos entre mantenimientos iguale aproximadamente el drenaje de mantenimiento del 6%, produciendo un equilibrio dinámico en la línea de base.

2.4 Dinámica de Fractura

El decaimiento narrativo se modela como una degradación multiplicativa suave con un suelo rígido:

C_{\text{state}}(t+1) = \max\bigl(C_{\text{state}}(t) \cdot 0.9999,\; C_{\text{floor}}\bigr)

A lo largo de 400 pasos de fractura sostenidos (un choque de 20 segundos), esto se compone hasta 0.9999^{400} \approx 0.961 — aproximadamente una pérdida del 4%. Esto modela un apagamiento fenomenológico gradual (como en la titulación de anestesia, Protocolo E-9) en lugar de un colapso catastrófico de todo o nada.

2.5 Resultados de la Simulación

El simulador ejecuta 2000 ciclos con una resolución de \Delta t = 50\text{ms} (100 segundos de tiempo de observador simulado). Se aplica un choque entrópico (estacionariedad \to 0.1) desde t=40\text{s} hasta t=60\text{s}.

Fase	Duración	Fracturas	Trayectoria de C_{\text{state}}	Comportamiento
Línea base	t = 0 \to 40\text{s}	0 / 800 (0%)	9.41 \times 10^{13} \to 9.18 \times 10^{13}	Equilibrio dinámico en diente de sierra; cero fracturas
Choque	t = 40 \to 60\text{s}	400 / 400 (100%)	9.18 \times 10^{13} \to 8.82 \times 10^{13}	Fractura continua; degradación gradual de \sim 4\%
Recuperación	t = 60 \to 100\text{s}	0 / 800 (0%)	8.30 \times 10^{13} \to 8.39 \times 10^{13}	Las fracturas se detienen de inmediato; reconstrucción lenta del códec

Estas tres fases demuestran la predicción central de la OPT: un observador acotado puede mantener una homeostasis estable, degradarse de manera gradual bajo un choque entrópico y recuperarse cuando se restablece la estacionariedad ambiental, siempre que el choque no lleve C_{\text{state}} por debajo de C_{\text{floor}}.

2.6 Observaciones clave

La línea de base en diente de sierra: Entre ejecuciones de mantenimiento, C_{\text{state}} se acumula mediante integración del error (\sim +5\% por cada ventana de 100 pasos), y luego desciende bruscamente cuando se activa \mathcal{M}_\tau (\sim -6\%). Esta oscilación es la firma computacional del ciclo sueño-vigilia: el sistema debe podar periódicamente para evitar alcanzar C_{\text{ceil}}.
El inicio del choque es instantáneo: Cuando la estacionariedad cae a 0.1, cada ciclo se fractura de inmediato. No hay una transición gradual: el error de predicción salta de \sim 0.16 a \sim 1.6 bits/paso, superando la capacidad de 0.5 bits por un factor de tres.
La recuperación es asimétrica: Después del choque, C_{\text{state}} crece en \sim +1\% a lo largo de 40 segundos, frente a la pérdida de \sim -4\% durante el choque de 20 segundos. La recuperación es más lenta que la degradación. Esta asimetría es una predicción estructural de la Teoría del Parche Ordenado (OPT): reconstruir un modelo generativo es más difícil que dañarlo.
La puerta de fractura del mantenimiento importa: Si el mantenimiento se ejecuta durante una fractura activa (como en las primeras versiones del simulador), el sistema entra en un bucle de retroalimentación positiva y colapsa hasta C_{\text{floor}}. La regla de compuerta no es una conveniencia: es estructuralmente necesaria para la viabilidad del códec.

3. Vías de simulación futura

Relojes talamocorticales (E-12): Codificar de forma rígida las actualizaciones de \Delta t para que coincidan con los ciclos de compuerta talámica de 20–40\text{Hz}, generando predicciones contrastables con resolución de milisegundos frente a las mediciones de información integrada cortical (\Phi).
Integración POMDP de energía libre: Sustituir el escalar abstracto de predictibilidad por un modelo discreto de espacio de estados de Inferencia Activa (p. ej., pymdp), permitiendo cartografiar los límites precisos que separan los termostatos termodinámicos del umbral fenomenal K_{\text{threshold}} (P-5).
Extensión multiobservador: Simular múltiples códecs en interacción con regiones compartidas del sustrato para poner a prueba las predicciones de Ligadura de Enjambre del Apéndice E-6: si los agentes distribuidos alcanzan ligadura fenomenal solo cuando se los fuerza a pasar por una apertura global de C_{\max}.
Calibración empírica: Ajustar la trayectoria de fractura-recuperación del simulador a datos de series temporales de neuroimagen (p. ej., complejidad de Lempel-Ziv bajo propofol o ketamina) para determinar si la constante de decaimiento 0.9999 y la curva de predictibilidad C_{\text{state}}^{-0.6} se corresponden con la dinámica fenomenológica observada.