OPT Appendix E-11: Simulació computacional del cicle de vida taxa-distorsió

Anders Jarevåg

abril de 2026

Apèndix E-11: Simulació computacional del cicle de vida taxa-distorsió

Aquest apèndix documenta la modelització in silico del cicle de vida del còdec de la Teoria del Patch Ordenat (OPT). Com que el substrat universal subjacent (la Semimesura universal de Solomonoff) és estructuralment incomputable, les simulacions dins del marc de l’OPT es restringeixen a modelitzar el cicle de vida del còdec mateix: el paràmetre de filtratge de frontera C_{\max}, la dinàmica d’Inferència activa, el cicle de manteniment de tres passades \mathcal{M}_\tau, i el decaïment narratiu sota estrès entròpic.

S’han establert dos paradigmes de simulació diferenciats: l’aprenentatge profund analògic (toy_model.py) i la modelització matemàtica estricta de taxa-distorsió (opt_simulator.py).

1. Simulació analògica: colls d’ampolla variacionals profunds

El paradigma inicial de simulació (toy_model.py) valida la premissa central de la Fractura del Còdec mitjançant una analogia estructural literal.

Substrat: Una xarxa periòdica unidimensional instanciada amb enters discrets. S’hi injecten trets estructurals persistents sobre una línia de base de soroll termodinàmic, que funcionen com els “Pegats Ordenats” observables.

Arquitectura: L’observador es modela com un Coll d’Ampolla d’Informació Variacional (VIB) construït sobre una xarxa neuronal profunda (TensorFlow). La xarxa observa un vector d’historial espacial X_{t-k \dots t} i duu a terme un descens de gradient cap endavant per comprimir-lo en un coll d’ampolla capaç de predir el ventall temporal futur X_{t+1 \dots t+h}.

Mecànica del col·lapse: Les restriccions de C_{\max} (taxa) i D_{\min} (distorsió acceptable) s’imposen dinàmicament mitjançant un controlador PID que modula el multiplicador lagrangià \beta. Sota una entropia massiva del substrat (p. ex., soroll altament volàtil que domina els patrons persistents), la xarxa intercanvia físicament resolució predictiva per amplada de banda. Quan la complexitat algorítmica requerida R_{\text{req}} supera C_{\max} malgrat un ajust màxim de \beta, la xarxa arriba formalment a una singularitat algorítmica i col·lapsa, confirmant la predicció de l’OPT que injectar soroll d’alta entropia destrueix la coherència predictiva en lloc d’“expandir” la consciència.

2. Formalisme matemàtic: modelització estricta taxa-distorsió

Tot i que el VIB neuronal proporciona una confirmació visual de la fractura del còdec, la sobrecàrrega de les arquitectures d’aprenentatge automàtic enfosqueix les relacions purament informacionals que governen l’observador. El segon paradigma (opt_simulator.py) elimina la geometria estructural per modelitzar estrictament la dinàmica del coll d’ampolla utilitzant els propis escalars de la teoria.

2.1 Arquitectura

El simulador separa tres capes estructurals, reflectint el formalisme de l’OPT:

Component Concepte OPT Implementació
PhenomenalStateTensor K(P_\theta(t)) Complexitat del còdec en règim estacionari C_{\text{state}}, acotada per C_{\text{ceil}} (sostre d’executabilitat) i C_{\text{floor}} (còdec viable mínim)
StabilityFilter obertura de C_{\max} Només deixa passar l’error de predicció \varepsilon_t a través del coll d’ampolla; es fractura quan \varepsilon_t > C_{\max} \cdot \Delta t
ActiveInferenceCodec Model generatiu K_\theta Predictibilitat endògena derivada de la profunditat del còdec; estacionarietat ambiental com a pertorbació exògena
MaintenanceCycle \mathcal{M}_\tau Gestió offline de la complexitat en tres passades (poda, consolidació, mostreig del Ventall Predictiu)

El principi de disseny clau és que la predictibilitat és endògena: la capacitat del còdec per predir l’entorn es deriva de C_{\text{state}} mitjançant una relació de llei de potència \text{error} \propto C_{\text{state}}^{-0.6}, en lloc de ser un paràmetre codificat de manera rígida. Això significa que les cascades de fractura i les trajectòries de recuperació emergeixen de la dinàmica pròpia del sistema, en comptes de ser imposades manualment.

2.2 El Canal d’Error de Predicció

D’acord amb la teoria predictiva de taxa-distorsió, allò que travessa l’obertura C_{\max} és l’error de predicció — només el residu que resta després de restar la predicció del model generatiu:

\varepsilon_t = S_{\text{raw}} \cdot (1 - \text{predictability})

on S_{\text{raw}} = 10^9 \cdot \Delta t bits per finestra d’actualització. En condicions basals (C_{\text{state}} \approx 10^{14}, estacionarietat = 1.0), això dona \varepsilon_t \approx 0.16 bits/pas — còmodament per sota del límit de capacitat de C_{\max} \cdot \Delta t = 0.5 bits/pas.

Quan l’estacionarietat ambiental disminueix (p. ex., xoc per ketamina, estacionarietat \to 0.1), l’error de predicció efectiu s’amplifica per un factor de 1/\text{stationarity}, fent que \varepsilon_t superi el límit de capacitat i desencadeni la fractura.

2.3 El Cicle de Manteniment de Tres Passades (\mathcal{M}_\tau)

El cicle de manteniment implementa les tres passades fora de línia especificades a la §3.6 del preprint:

Passada Operació Taxa Correspondència OPT
I. Poda eliminació MDL de paràmetres de baix valor 4% de C_{\text{state}} esborrament \Delta_{\text{MDL}} < 0
II. Consolidació recompressió de patrons adquirits recentment 3% de C_{\text{state}} compressió del pressupost de distorsió MDL
III. Ventall Predictiu autoavaluació adversària (proxy del somni REM) +1% de C_{\text{state}} mostreig del Ventall Predictiu contra futurs hostils

Drenatge net per execució de manteniment: \sim 6\% de C_{\text{state}}. El manteniment està condicionat per l’estabilitat — només s’activa quan el còdec no està fracturat, d’acord amb la predicció de l’OPT que \mathcal{M}_\tau s’executa durant estats de sensori baix (paradigmàticament: el son).

La taxa d’acumulació d’aprenentatge està calibrada de manera que el guany d’integració d’error al llarg de 100 passos entre manteniments iguali aproximadament el drenatge de manteniment del 6%, produint un equilibri dinàmic en la línia de base.

2.4 Dinàmica de fractura

El decaïment narratiu es modela com una degradació multiplicativa suau amb un sòl rígid:

C_{\text{state}}(t+1) = \max\bigl(C_{\text{state}}(t) \cdot 0.9999,\; C_{\text{floor}}\bigr)

Al llarg de 400 passos de fractura sostinguda (un xoc de 20 segons), això es compon fins a 0.9999^{400} \approx 0.961 — aproximadament una pèrdua del 4%. Això modela un esborrament fenomenològic gradual (com en la titulació de l’anestèsia, Protocol E-9) més que no pas un col·lapse catastròfic de tot o res.

2.5 Resultats de la simulació

El simulador executa 2000 cicles amb una resolució de \Delta t = 50\text{ms} (100 segons de temps d’observador simulat). S’aplica un xoc entròpic (estacionarietat \to 0.1) des de t=40\text{s} fins a t=60\text{s}.

Fase Durada Fractures Trajectòria de C_{\text{state}} Comportament
Línia de base t = 0 \to 40\text{s} 0 / 800 (0%) 9.41 \times 10^{13} \to 9.18 \times 10^{13} Equilibri dinàmic en dent de serra; zero fractures
Xoc t = 40 \to 60\text{s} 400 / 400 (100%) 9.18 \times 10^{13} \to 8.82 \times 10^{13} Fractura contínua; degradació gradual de \sim 4\%
Recuperació t = 60 \to 100\text{s} 0 / 800 (0%) 8.30 \times 10^{13} \to 8.39 \times 10^{13} Les fractures s’aturen immediatament; reconstrucció lenta del còdec

Aquestes tres fases demostren la predicció central de l’OPT: un observador acotat pot mantenir una homeòstasi estable, degradar-se de manera gradual sota un xoc entròpic i recuperar-se quan es restaura l’estacionarietat ambiental, sempre que el xoc no faci caure C_{\text{state}} per sota de C_{\text{floor}}.

2.6 Observacions clau

  1. La dent de serra de base: Entre execucions de manteniment, C_{\text{state}} s’acumula mitjançant la integració de l’error (\sim +5\% per finestra de 100 passos), i després cau bruscament quan s’activa \mathcal{M}_\tau (\sim -6\%). Aquesta oscil·lació és la signatura computacional del cicle son-vigília: el sistema ha de podar periòdicament per evitar assolir C_{\text{ceil}}.

  2. L’inici del xoc és instantani: Quan l’estacionarietat cau a 0.1, cada cicle es fractura immediatament. No hi ha cap transició gradual — l’error de predicció salta de \sim 0.16 a \sim 1.6 bits/pas, i supera la capacitat de 0.5 bits per un factor de tres.

  3. La recuperació és asimètrica: Després del xoc, C_{\text{state}} creix a \sim +1\% al llarg de 40 segons, en comparació amb la pèrdua de \sim -4\% durant el xoc de 20 segons. La recuperació és més lenta que la degradació. Aquesta asimetria és una predicció estructural de l’OPT: reconstruir un model generatiu és més difícil que malmetre’n un.

  4. La porta entre manteniment i fractura és important: Si el manteniment s’executa durant una fractura activa (com en les primeres versions del simulador), el sistema entra en un bucle de retroalimentació positiva i col·lapsa fins a C_{\text{floor}}. La regla de gating no és una mera conveniència — és estructuralment necessària per a la viabilitat del còdec.

3. Vies futures de simulació

  1. Rellotges talamocorticals (E-12): Codificar de manera rígida les actualitzacions de \Delta t perquè coincideixin amb els cicles de gating talàmic de 2040\text{Hz}, generant prediccions contrastables amb resolució de mil·lisegons respecte de les mesures d’informació integrada cortical (\Phi).

  2. Integració POMDP de l’Energia Lliure: Substituir l’escalar abstracte de predictibilitat per un model discret d’espai d’estats d’Inferència activa (p. ex., pymdp), cosa que permet cartografiar els límits precisos que separen els termòstats termodinàmics del llindar fenomenal K_{\text{threshold}} (P-5).

  3. Extensió multiobservador: Simular múltiples còdecs en interacció amb regions compartides del substrat per posar a prova les prediccions d’Unió d’Eixam de l’Apèndix E-6 — és a dir, si agents distribuïts assoleixen unió fenomenal només quan són forçats a passar per una obertura global de C_{\max}.

  4. Calibratge empíric: Ajustar la trajectòria de fractura-recuperació del simulador a dades de sèries temporals de neuroimatge (p. ex., la complexitat de Lempel-Ziv sota propofol o ketamina) per determinar si la constant de decaïment 0.9999 i la corba de predictibilitat C_{\text{state}}^{-0.6} concorden amb les dinàmiques fenomenològiques observades.