Annexe OPT E-11 : Simulation computationnelle du cycle de vie taux-distorsion

Anders Jarevåg

avril 2026

Annexe E-11 : Simulation computationnelle du cycle de vie taux-distorsion

Cette annexe documente la modélisation in silico du cycle de vie du codec de la Théorie du Patch Ordonné (OPT). Étant donné que le substrat universel sous-jacent (la Semi-mesure universelle de Solomonoff) est structurellement non calculable, les simulations dans le cadre de l’OPT se limitent à la modélisation du cycle de vie du codec lui-même : le paramètre de filtrage à la frontière C_{\max}, la dynamique d’Inférence active, le cycle de maintenance en trois passes \mathcal{M}_\tau, et la dégradation narrative sous contrainte entropique.

Deux paradigmes de simulation distincts ont été établis : l’apprentissage profond analogique (toy_model.py) et la modélisation mathématique stricte taux-distorsion (opt_simulator.py).

1. Simulation analogique : goulots d’étranglement variationnels profonds

Le paradigme initial de simulation (toy_model.py) valide la prémisse centrale de la Fracture du Codec au moyen d’une analogie structurelle littérale.

Substrat : un réseau périodique unidimensionnel instancié avec des entiers discrets. Des caractéristiques structurelles persistantes y sont injectées sur un fond de bruit thermodynamique, jouant le rôle de « patchs ordonnés » observables.

Architecture : l’observateur est modélisé comme un goulot d’étranglement informationnel variationnel (VIB) construit sur un réseau neuronal profond (TensorFlow). Le réseau observe un vecteur d’historique spatial X_{t-k \dots t} et effectue une descente de gradient vers l’avant afin de le comprimer en un goulot d’étranglement capable de prédire l’éventail temporel futur X_{t+1 \dots t+h}.

Mécanique de l’effondrement : Les contraintes de C_{\max} (taux) et de D_{\min} (distorsion acceptable) sont imposées dynamiquement via un contrôleur PID modulant le multiplicateur lagrangien \beta. Sous une entropie massive du substrat (par exemple, lorsque du bruit hautement volatil domine les motifs persistants), le réseau échange physiquement de la résolution prédictive contre de la bande passante. Lorsque la complexité algorithmique requise R_{\text{req}} dépasse C_{\max} malgré un réglage maximal de \beta, le réseau atteint formellement une singularité algorithmique et s’effondre, confirmant la prédiction de l’OPT selon laquelle l’injection de bruit à haute entropie détruit la cohérence prédictive au lieu d’« étendre » la conscience.

2. Formalisme mathématique : modélisation stricte en taux-distorsion

Alors que le VIB neuronal fournit une confirmation visuelle de la fracture du codec, la surcharge propre aux architectures d’apprentissage automatique obscurcit les relations purement informationnelles qui gouvernent l’observateur. Le second paradigme (opt_simulator.py) retire la géométrie structurelle afin de modéliser strictement la dynamique du goulet d’étranglement à l’aide des scalaires propres à la théorie.

2.1 Architecture

Le simulateur distingue trois couches structurelles, en miroir du formalisme de l’OPT :

Composant	Concept OPT	Implémentation
`PhenomenalStateTensor`	K(P_\theta(t))	Complexité stationnaire du codec C_{\text{state}}, bornée par C_{\text{ceil}} (plafond d’exécutabilité) et C_{\text{floor}} (codec viable minimal)
`StabilityFilter`	ouverture de C_{\max}	Ne laisse passer que l’erreur de prédiction \varepsilon_t à travers le goulot d’étranglement ; se fracture lorsque \varepsilon_t > C_{\max} \cdot \Delta t
`ActiveInferenceCodec`	Modèle génératif K_\theta	Prédictibilité endogène dérivée de la profondeur du codec ; stationnarité environnementale comme perturbation exogène
`MaintenanceCycle`	\mathcal{M}_\tau	Gestion hors ligne de la complexité en trois passes (élagage, consolidation, échantillonnage de l’Éventail Prédictif)

Le principe de conception central est que la prédictibilité est endogène : la capacité du codec à prédire l’environnement dérive de C_{\text{state}} via une relation de loi de puissance \text{error} \propto C_{\text{state}}^{-0.6}, plutôt que d’être un paramètre codé en dur. Cela signifie que les cascades de fracture et les trajectoires de récupération émergent de la dynamique propre du système, au lieu d’être imposées manuellement.

2.2 Le Canal d’Erreur de Prédiction

Dans le cadre de la théorie prédictive taux-distorsion, ce qui traverse l’ouverture C_{\max} est l’erreur de prédiction — autrement dit, uniquement le résidu après soustraction de la prédiction du modèle génératif :

\varepsilon_t = S_{\text{raw}} \cdot (1 - \text{predictability})

où S_{\text{raw}} = 10^9 \cdot \Delta t bits par fenêtre de mise à jour. Au niveau de base (C_{\text{state}} \approx 10^{14}, stationnarité = 1.0), on obtient ainsi \varepsilon_t \approx 0.16 bit/pas — nettement en dessous de la borne de capacité C_{\max} \cdot \Delta t = 0.5 bit/pas.

Lorsque la stationnarité environnementale diminue (p. ex. choc à la kétamine, stationnarité \to 0.1), l’erreur de prédiction effective est amplifiée d’un facteur 1/\text{stationarity}, ce qui pousse \varepsilon_t au-dessus de la borne de capacité et déclenche la fracture.

2.3 Le Cycle de Maintenance en Trois Passes (\mathcal{M}_\tau)

Le Cycle de Maintenance met en œuvre les trois passes hors ligne spécifiées au §3.6 du préprint :

Passe	Opération	Taux	Correspondance OPT
I. Élagage	suppression MDL des paramètres de faible valeur	4% de C_{\text{state}}	effacement avec \Delta_{\text{MDL}} < 0
II. Consolidation	recompression des motifs acquis récemment	3% de C_{\text{state}}	compression MDL sous contrainte de budget de distorsion
III. Éventail Prédictif	auto-test adversarial (proxy onirique REM)	+1% de C_{\text{state}}	échantillonnage de l’Éventail Prédictif face à des futurs hostiles

Drain net par exécution de maintenance : \sim 6\% de C_{\text{state}}. La maintenance est conditionnée par la stabilité — elle ne se déclenche que lorsque le codec n’est pas fracturé, conformément à la prédiction de l’OPT selon laquelle \mathcal{M}_\tau s’exécute durant des états de faible sensorium (paradigmatiquement : le sommeil).

Le taux d’accumulation de l’apprentissage est calibré de sorte que le gain d’intégration de l’erreur sur 100 étapes inter-maintenance soit approximativement égal au drain de maintenance de 6%, produisant ainsi un équilibre dynamique au niveau de base.

2.4 Dynamique de fracture

La dégradation narrative est modélisée comme une dégradation multiplicative douce avec un plancher strict :

C_{\text{state}}(t+1) = \max\bigl(C_{\text{state}}(t) \cdot 0.9999,\; C_{\text{floor}}\bigr)

Sur 400 étapes de fracture soutenues (un choc de 20 secondes), cela se compose en 0.9999^{400} \approx 0.961 — soit environ 4 % de perte. Cela modélise un effacement phénoménologique graduel (comme dans la titration de l’anesthésie, Protocole E-9) plutôt qu’un effondrement catastrophique en tout ou rien.

2.5 Résultats de simulation

Le simulateur exécute 2000 cycles avec une résolution de \Delta t = 50\text{ms} (100 secondes de temps-observateur simulé). Un choc entropique (stationnarité \to 0.1) est appliqué de t=40\text{s} à t=60\text{s}.

Phase	Durée	Fractures	Trajectoire de C_{\text{state}}	Comportement
Ligne de base	t = 0 \to 40\text{s}	0 / 800 (0%)	9.41 \times 10^{13} \to 9.18 \times 10^{13}	Équilibre dynamique en dents de scie ; zéro fracture
Choc	t = 40 \to 60\text{s}	400 / 400 (100%)	9.18 \times 10^{13} \to 8.82 \times 10^{13}	Fracturation continue ; dégradation graduelle de \sim 4\%
Récupération	t = 60 \to 100\text{s}	0 / 800 (0%)	8.30 \times 10^{13} \to 8.39 \times 10^{13}	Les fractures s’arrêtent immédiatement ; reconstruction lente du codec

Ces trois phases démontrent la prédiction centrale de l’OPT : un observateur borné peut maintenir une homéostasie stable, se dégrader de manière progressive sous un choc entropique, puis récupérer lorsque la stationnarité environnementale est rétablie — à condition que le choc ne fasse pas passer C_{\text{state}} en dessous de C_{\text{floor}}.

2.6 Observations clés

La dent de scie de base : Entre les exécutions de maintenance, C_{\text{state}} s’accumule par intégration de l’erreur (\sim +5\% par fenêtre de 100 pas), puis chute brutalement lorsque \mathcal{M}_\tau se déclenche (\sim -6\%). Cette oscillation constitue la signature computationnelle du cycle veille-sommeil — le système doit élaguer périodiquement pour éviter d’atteindre C_{\text{ceil}}.
Le déclenchement du choc est instantané : Lorsque la stationnarité tombe à 0.1, chaque cycle se fracture immédiatement. Il n’y a pas de transition graduelle — l’erreur de prédiction passe de \sim 0.16 à \sim 1.6 bit/pas, dépassant la capacité de 0.5 bit d’un facteur trois.
La récupération est asymétrique : Après le choc, C_{\text{state}} croît de \sim +1\% sur 40 secondes, contre une perte de \sim -4\% durant le choc de 20 secondes. La récupération est plus lente que la dégradation. Cette asymétrie est une prédiction structurelle de l’OPT : reconstruire un modèle génératif est plus difficile que l’endommager.
Le filtre de fracture de maintenance importe : Si la maintenance s’exécute pendant une fracture active (comme dans les premières versions du simulateur), le système entre dans une boucle de rétroaction positive et s’effondre jusqu’à C_{\text{floor}}. La règle de filtrage n’est pas une commodité — elle est structurellement nécessaire à la viabilité du codec.

3. Voies futures de simulation

Horloges thalamocorticales (E-12) : coder en dur les mises à jour de \Delta t afin qu’elles correspondent aux cycles de gating thalamique de 20–40\text{Hz}, en générant des prédictions testables à résolution milliseconde à confronter aux mesures de l’information intégrée corticale (\Phi).
Intégration POMDP de l’énergie libre : remplacer le scalaire abstrait de prédictibilité par un modèle discret d’espace d’états d’Inférence active (par ex. pymdp), permettant de cartographier les bornes précises qui séparent les thermostats thermodynamiques du K_{\text{threshold}} phénoménal (P-5).
Extension multi-observateurs : simuler plusieurs codecs en interaction avec des régions partagées du substrat afin de tester les prédictions de liaison en essaim de l’Appendice E-6 — à savoir si des agents distribués n’atteignent une liaison phénoménale que lorsqu’ils sont contraints de passer par une aperture globale de C_{\max}.
Calibrage empirique : ajuster la trajectoire de fracture-récupération du simulateur aux données de séries temporelles issues de la neuroimagerie (par ex. la complexité de Lempel-Ziv sous propofol ou kétamine) afin de déterminer si la constante de décroissance 0.9999 et la courbe de prédictibilité C_{\text{state}}^{-0.6} correspondent aux dynamiques phénoménologiques observées.