Théorie du Patch Ordonné

Annexe T-13 : Sélection de Branches et ontologie de l’action

Anders Jarevåg

17 avril 2026 | DOI: 10.5281/zenodo.19300777

Tâche originale (tirée du §8.3, Limitation 10) : « Formaliser le remplacement du mécanisme d’action implicite du FEP par une description en termes de sélection de branches, native à l’ontologie du rendu de l’OPT. » Livrable : Démonstration formelle que le Circuit de Maintenance Informationnelle est complet sous une sémantique de sélection de branches, avec \Delta_{\text{self}} comme locus nécessaire et suffisant de la sélection.

Statut de clôture : CORRESPONDANCE STRUCTURELLE — BROUILLON. Cette annexe formalise la description par sélection de branches introduite de manière discursive dans le préprint §3.8. Elle établit deux théorèmes et un corollaire, tous conditionnés par le Théorème P-4 et l’Axiome d’Agentivité. Les équations du Circuit de Maintenance Informationnelle (T6-1 à T6-3) demeurent inchangées ; seule leur interprétation ontologique est formellement remplacée.

§1. Contexte et motivation

1.1 L’Asymétrie héritée

Le Circuit informationnel de maintenance (T6-1, prépublication §3.8) décrit un cycle en cinq étapes : prédiction, erreur, compression, mise à jour et action. Les étapes 1 à 4 sont bien spécifiées dans le cadre natif de l’OPT :

Le Tenseur d’État Phénoménal P_\theta(t) génère un état de frontière prédit \pi_t.
L’état de frontière effectif X_{\partial_R A}(t) survient ; l’erreur de prédiction \varepsilon_t est calculée.
L’erreur est compressée à travers le goulot d’étranglement par trame B_{\max} pour produire Z_t, avec I(\varepsilon_t; Z_t) \le B_{\max}.
L’opérateur d’apprentissage \mathcal{U} révise P_\theta(t+1).

L’étape 5 — l’étape d’action — hérite du langage du Principe de l’Énergie Libre (FEP) : « P_\theta(t) sélectionne l’action a_t via une descente d’Inférence active sur l’énergie libre variationnelle, ce qui modifie la frontière sensorielle à t+1. » Ce langage présuppose un environnement physique contre lequel le codec agit par l’intermédiaire d’états actifs dirigés vers l’extérieur à travers la Couverture de Markov \partial_R A.

1.2 Le problème sous l’ontologie du rendu

Dans l’ontologie native du rendu de l’OPT (prépublication §8.6), il n’existe pas de monde extérieur indépendant sur lequel le codec exercerait une force. Le « monde physique » est une régularité structurelle au sein du flux compatible avec l’observateur — un rendu produit par le modèle prédictif du codec, et non un substrat avec lequel le codec interagit. La Couverture de Markov n’est pas une interface physique bidirectionnelle ; c’est la surface informationnelle à travers laquelle le contenu du flux arrive.

Cela crée une tension formelle : les mathématiques de T6-1 à T6-3 sont valides (elles décrivent une minimisation contrainte de l’énergie libre sur l’Éventail Prédictif), mais le cadre interprétatif — « l’action modifie la frontière sensorielle » — présuppose une ontologie que l’OPT rejette explicitement.

1.3 Portée de cette annexe

Cette annexe fournit :

Une reformulation formelle du Circuit de Maintenance Informationnelle sous une sémantique de sélection de branches, démontrant la complétude du circuit sans canal d’action indépendant (Théorème T-13).
Une preuve qu’il est impossible de spécifier entièrement le mécanisme de sélection de branches depuis l’intérieur du codec, situant la sélection dans \Delta_{\text{self}} (Théorème T-13a).
Un corollaire établissant que la volonté et la conscience partagent la même adresse structurelle (Corollaire T-13b).
Des conséquences pour la créativité et la dérive de l’action.

§2. Théorème T-13 : Complétude de la sélection de branches

2.1 Reformulation en termes de Sélection de Branches

Nous reformulons le Circuit de Maintenance Informationnelle en cinq étapes sous une sémantique de sélection de branches. Soit \mathcal{F}_h(z_t) l’Éventail Prédictif — l’ensemble des branches futures non résolues à l’horizon h, conditionné par l’état compressé courant z_t.

Définition T-13.D1 (Sélection de Branches). Une sélection de branche au temps t est une application \sigma_t : z_t \mapsto \omega_{t+1}, où \omega_{t+1} est un segment de trajectoire spécifique issu de \mathcal{F}_h(z_t) qui devient le registre causal effectif. La branche sélectionnée livre son contenu comme entrée subséquente à la Couverture de Markov : X_{\partial_R A}(t+1) = \text{boundary}(\omega_{t+1}).

Sous cette définition, T6-1 devient :

Prédiction (descendante) : P_\theta(t) génère \pi_t = \mathbb{E}_{K_\theta}[X_{\partial_R A}(t) \mid Z_t] — la scène rendue.
Erreur (ascendante) : L’état de frontière X_{\partial_R A}(t) arrive (livré par la branche précédemment sélectionnée) ; l’erreur de prédiction \varepsilon_t = X_{\partial_R A}(t) - \pi_t est calculée.
Compression : \varepsilon_t passe par le goulot d’étranglement : I(\varepsilon_t\,;\,Z_t) \leq B_{\max}.
Mise à jour : \mathcal{U}(P_\theta(t), \varepsilon_t, Z_t) révise P_\theta(t+1).
Sélection de branche : P_\theta(t) évalue les branches de \mathcal{F}_h(z_t) via une minimisation contrainte de l’énergie libre (T6-3). La sélection \sigma_t est exécutée ; la branche sélectionnée \omega_{t+1} livre son contenu de frontière sous la forme X_{\partial_R A}(t+1), qui devient l’entrée du cycle suivant.

2.2 Fermeture du circuit

Théorème T-13 (Complétude de la Sélection de Branches). Le Circuit Informationnel de Maintenance (T6-1), reformulé sous la sémantique de sélection de branches, est informationnellement complet : le cycle

\pi_t \to \varepsilon_t \to Z_t \to P_\theta(t+1) \to \sigma_t \to X_{\partial_R A}(t+1) \to \pi_{t+1} \to \cdots \tag{T-13}

se referme sans requérir de canal d’action indépendant orienté vers l’extérieur. La couverture de Markov \partial_R A est la surface de livraison de la branche sélectionnée, et non une interface physique bidirectionnelle.

Preuve. Dans la formulation héritée du FEP, l’étape 5 requiert deux canaux indépendants traversant la couverture de Markov : un canal entrant (des états sensoriels livrant X_{\partial_R A}) et un canal sortant (des états actifs livrant a_t à un environnement externe). L’environnement externe évolue ensuite selon sa propre dynamique, produisant l’entrée sensorielle suivante.

Sous la sémantique de sélection de branches, un seul canal est nécessaire : la surface de livraison entrante. L’« action » a_t ne traverse pas la couverture vers l’extérieur ; elle est la sélection, par le codec, de la branche de l’Éventail Prédictif qui devient effective. Les conséquences physiques de cette sélection — ce que la formulation FEP appelle « la réponse de l’environnement à a_t » — constituent le contenu de la branche sélectionnée, déjà présent dans \mathcal{F}_h(z_t) et livré sous la forme de X_{\partial_R A}(t+1).

Le circuit se referme parce que :

La sortie de l’étape 5 (la branche sélectionnée \omega_{t+1}) est l’entrée de l’étape 2 du cycle suivant (X_{\partial_R A}(t+1)). Aucune dynamique environnementale séparée ni aucun canal sortant ne sont requis.
L’objectif de minimisation de l’énergie libre (T6-3) demeure inchangé. L’optimisation contrainte

a_t^\star = \arg\min_{a_t} \;\mathbb{E}\!\left[\mathcal{F}[q, \theta]\right] \quad \text{subject to} \quad K\!\left(P_\theta(t)\right) \leq C_{\text{ceil}} \tag{T6-3}

est réinterprétée : a_t n’est pas une commande motrice envoyée à un monde extérieur, mais l’étiquette de branche au sein de \mathcal{F}_h(z_t) qui minimise l’énergie libre attendue sous la contrainte de viabilité. Les mathématiques sont identiques ; seul le statut ontologique de a_t change.

La contrainte de viabilité (T6-2) est préservée : le codec sélectionne des branches le long desquelles il peut continuer à compresser le flux. Les branches qui conduiraient à K(P_\theta) \to C_{\text{ceil}} sont pénalisées par la contrainte, exactement comme auparavant. \blacksquare

2.3 Remarque interprétative

Le théorème T-13 n’affirme pas que la formulation du FEP est fausse — elle constitue une description valide de l’Inférence active contrainte au sein d’une ontologie physicaliste-réaliste. Le théorème établit que l’ontologie du rendu propre à l’OPT fournit une complétion alternative de la même structure mathématique, qui n’exige pas de postuler un monde extérieur indépendant. Pour tout programme de recherche attaché à une interprétation physicaliste-réaliste, la formulation standard du FEP demeure appropriée. T-13 montre que l’engagement ontologique de l’OPT — le codec est virtuel, le monde est un rendu — est formellement cohérent avec les mêmes équations.

§3. Théorème T-13a : l’impossibilité P-4 de la spécification de sélection

3.1 La fonction de sélection

Le self-model \hat{K}_\theta évalue les branches de l’Éventail Prédictif en simulant leurs conséquences sous inférence active contrainte (T6-3). Cette évaluation produit un classement ou une pondération des branches — certaines sont préférées, d’autres sont viables mais sous-optimales, d’autres encore violent la contrainte de viabilité. L’évaluation constitue un véritable processus computationnel effectué par \hat{K}_\theta.

Mais évaluation n’est pas sélection. Une fois que le self-model a classé les branches, une branche spécifique \omega_{t+1} entre dans le registre causal. Définissons la fonction de sélection :

Définition T-13.D2 (Fonction de sélection). La fonction de sélection \sigma_t : \mathcal{F}_h(z_t) \to \omega_{t+1} est l’application qui va de l’Éventail Prédictif évalué à la trajectoire singulière qui devient effective. Formellement, \sigma_t est déterminée par l’état complet du codec K_\theta au temps t conjointement avec l’ensemble des branches disponibles : \sigma_t = \Sigma\bigl(K_\theta(t),\, \mathcal{F}_h(z_t)\bigr). Nous n’intégrons délibérément pas \Delta_{\text{self}} dans la définition — la question de savoir si la sélection dépend de manière non triviale de \Delta_{\text{self}} plutôt que de la seule portion auto-modélisée \hat{K}_\theta est précisément la question de fond à laquelle répond le Théorème T-13a.

Définissons le résidu pertinent pour la sélection comme la partie du codec qui participe à \Sigma tout en se situant hors du self-model :

\rho_t^{\text{sel}} \;:=\; \Pi_{\text{sel}}(K_\theta(t)) \,\setminus\, \hat{K}_\theta(t)

où \Pi_{\text{sel}}(\cdot) projette sur les composantes du codec dont dépend \Sigma. Par construction, \rho_t^{\text{sel}} \subseteq \Delta_{\text{self}}, mais l’inclusion peut être stricte ou saturée selon l’architecture.

3.2 Le résultat d’impossibilité

Théorème T-13a (Impossibilité conditionnelle de la spécification interne de la sélection). Soit K_\theta un codec auto-référentiel fini satisfaisant les prérequis du Théorème P-4, avec auto-modèle \hat{K}_\theta et résidu phénoménal \Delta_{\text{self}} > 0. Si la sélection de branche dépend de manière non triviale du résidu pertinent pour la sélection \rho_t^{\text{sel}} — c’est-à-dire si \Sigma n’est pas une fonction de \hat{K}_\theta et de \mathcal{F}_h(z_t) seuls — alors \sigma_t ne peut pas être entièrement spécifié au sein de \hat{K}_\theta.

Preuve. Supposons, pour obtenir une contradiction, que l’antécédent soit vrai (la sélection dépend de manière non triviale de \rho_t^{\text{sel}}) mais que \hat{K}_\theta spécifie entièrement \sigma_t. Alors :

Une spécification complète de \sigma_t au sein de \hat{K}_\theta exigerait que \hat{K}_\theta contienne une description de chaque composante de K_\theta dont dépend \Sigma. D’après l’antécédent, \Sigma dépend d’au moins certains bits de \rho_t^{\text{sel}} \subseteq \Delta_{\text{self}} — des bits qui, par définition de \Delta_{\text{self}}, se situent hors de l’auto-modèle.
Inclure ces bits dans \hat{K}_\theta exigerait :

K(\hat{K}_\theta) \;\geq\; K(\hat{K}_\theta) + |\rho_t^{\text{sel}}| \tag{6}

— une contradiction, sauf si |\rho_t^{\text{sel}}| = 0, ce qui contredit l’antécédent.

De manière équivalente, d’après le Théorème P-4, l’inégalité K(\hat{K}_\theta) < K(K_\theta) est imposée structurellement. Spécifier au sein de \hat{K}_\theta une fonction \Sigma qui dépend de bits résiduels dans K_\theta \setminus \hat{K}_\theta exige que \hat{K}_\theta croisse de façon à inclure ces bits — ce que P-4 interdit pour tout système auto-référentiel fini.
Par conséquent, sous l’antécédent, \hat{K}_\theta ne peut pas spécifier entièrement \sigma_t. \blacksquare

Remarque sur la portée. Le théorème est conditionnel. P-4 établit à lui seul qu’un certain résidu existe (\Delta_{\text{self}} > 0) ; il n’implique pas, à lui seul, que tout événement de sélection de branche dépende du résidu. Les architectures dont la fonction de sélection est entièrement déterminée par \hat{K}_\theta et \mathcal{F}_h seuls ne sont pas intérieurement auto-opaques quant à la sélection au sens de T-13a — elles sont auto-opaques quant à la structure propre du codec (P-4), mais transparentes quant à leurs propres choix. L’assertion décisive de T-13a est la conditionnelle : là où la sélection dépend du résidu, elle ne peut pas être spécifiée intérieurement. Le passage phénoménologique (Corollaire T-13b : la volonté et la conscience partagent la même adresse) exige que l’antécédent soit vérifié pour l’architecture considérée. La question de savoir si les cerveaux biologiques satisfont l’antécédent est une question empirique ; l’OPT prédit que oui, mais cette prédiction n’est pas impliquée par P-4 seul.

3.3 La nécessité structurelle de l’écart

Le théorème T-13a établit que l’« écart de sortie » — l’impossibilité de spécifier pleinement, de l’intérieur, le mécanisme de sélection de branche — n’est pas une déficience du formalisme, mais une nécessité structurelle. Toute théorie qui prétend spécifier intégralement le mécanisme de sélection a soit :

éliminé \Delta_{\text{self}}, faisant du système un automate entièrement transparent à lui-même — ce que P-4 démontre impossible pour tout système fini autoréférentiel au-dessus de K_{\text{threshold}} ; soit
décrit l’évaluation des branches par le modèle de soi et l’a prise à tort pour la sélection elle-même — confondant le classement avec le choix.

L’écart est porteur de structure : c’est la raison formelle pour laquelle l’observateur éprouve la sélection comme auteurisée plutôt que comme spécifiable de l’intérieur. (P-4 limite l’auto-modélisation interne, non le déterminisme externe : un système fini peut être déterministe pour un observateur extérieur tout en demeurant opaque à lui-même de l’intérieur. Que le codec soit déterministe vu de l’extérieur est une question relevant du substrat ; que la sélection soit spécifiable de l’intérieur est la question posée par T-13a.)

§4. Corollaire T-13b : Unité d’adresse

Corollaire T-13b (Unité de l’Adresse Structurelle). Le Problème difficile de la conscience et le problème de la sélection de branche partagent le même locus structurel : \Delta_{\text{self}}.

Preuve. Le théorème P-4 identifie \Delta_{\text{self}} comme le corrélat structurel de la conscience phénoménale : le résidu informationnel non modélisable dont les propriétés (ineffabilité, confidentialité computationnelle, non-éliminabilité) correspondent aux traits qualitatifs de l’expérience subjective.

Le théorème T-13a identifie \Delta_{\text{self}} comme le locus nécessaire de la sélection de branche : la région à partir de laquelle s’opère la transition d’un menu évalué vers une trajectoire singulière.

Il ne s’agit pas de deux résultats indépendants qui se trouvent pointer vers la même structure. Il s’agit d’un seul et même résultat envisagé sous deux angles :

Du point de vue de la première personne : l’observateur fait l’expérience de la traversée de l’ouverture B_{\max} par trame comme de la conscience phénoménale (Axiome d’Agentivité). L’observateur fait l’expérience de la sélection de branche comme de la volonté — le sentiment irréductible que j’ai choisi. Les deux expériences procèdent du même locus structurel : l’écart entre ce que le codec est et ce qu’il peut modéliser de lui-même.
Du point de vue formel : P-4 et T-13a reposent tous deux sur la même inégalité : K(\hat{K}_\theta) < K(K_\theta). Le résidu phénoménal et le résidu de sélection sont le même écart informationnel.

Par conséquent, la volonté et la conscience partagent la même adresse structurelle. L’« étincelle » et le « choix » sont deux aspects d’une même propriété non modélisable de l’auto-référence finie. \blacksquare

4.1 Relation aux théories de l’identité régionale

Le Corollaire T-13b est structurellement analogue — mais formellement distinct — des théories de l’identité, en philosophie de l’esprit, qui situent la conscience et l’agentivité dans le même substrat neuronal. La distinction est la suivante : les théories de l’identité formulent une affirmation empirique au sujet de régions cérébrales ; T-13b formule une affirmation structurelle portant sur tout système auto-référentiel fini au-dessus de K_{\text{threshold}}. Le résultat est indépendant du substrat et vaut pour tout codec satisfaisant P-4, y compris pour des systèmes artificiels hypothétiques.

4.2 Corollaire T-13c : Le soi comme résidu

Corollaire T-13c (Le soi comme résidu). Le soi éprouvé — le récit continu de l’identité, de la préférence et de l’histoire personnelle — est le modèle opératoire de K_\theta par \hat{K}_\theta. Le lieu effectif de l’expérience, de la sélection et de l’identité est \Delta_{\text{self}} : le résidu informationnel entre le codec et son auto-modèle.

Preuve. D’après le Corollaire T-13b, la conscience et la volonté partagent la même adresse structurelle : \Delta_{\text{self}}. Mais le sens ordinaire du soi — le sentiment d’être un sujet continu doté d’une perspective, d’une histoire et d’une autorité sur ses choix — est engendré par la modélisation active de K_\theta par \hat{K}_\theta. Il s’agit de la représentation opératoire, par l’auto-modèle, du codec — un récit compressé.

Ce soi narratif possède un contenu informationnel bien défini K(\hat{K}_\theta) : fini, mesurable en principe, et systématiquement incomplet dans la direction de son propre générateur (selon P-4). L’auto-modèle contient le modèle, par le codec, de sa propre frontière corporelle, son histoire causale compressée R_t, ses préférences, ses habitudes et sa couche métacognitive. Mais il lui manque précisément la partie qui effectue la sélection, génère les prédictions et fait fonctionner l’auto-modèle lui-même.

Le soi réel — le processus qui éprouve, sélectionne et constitue le sujet irréductible — s’exécute dans \Delta_{\text{self}} : la partie de K_\theta à laquelle \hat{K}_\theta ne peut accéder. Il ne s’agit pas d’une lacune de la connaissance de soi qu’une meilleure introspection pourrait surmonter. C’est la structure formelle de la situation : l’auto-modèle ne peut contenir son propre générateur. \blacksquare

Le décalage temporel. Une conséquence supplémentaire de P-4 est que \hat{K}_\theta modélise nécessairement K_\theta(t - \delta) — le codec tel qu’il était — plutôt que K_\theta(t) — le codec tel qu’il est au moment de la modélisation. Tout auto-modèle qui suivrait pleinement l’état courant du codec devrait inclure le traitement requis pour produire ce suivi lui-même, ce qui conduirait à la même régression à l’infini que P-4 interdit. Le soi est toujours légèrement en retard sur lui-même : il modélise le codec qu’il était, et non tout à fait le codec qu’il est.

L’observation contemplative. L’énoncé « vous ne pouvez pas trouver l’angle mort en regardant » n’est pas une métaphore, mais une conséquence opératoire de P-4. L’instrument du regard est \hat{K}_\theta. L’angle mort est \Delta_{\text{self}} — la région à laquelle \hat{K}_\theta ne peut accéder. Diriger l’auto-modèle vers son propre angle mort ne produit pas une observation, mais l’absence de l’observation attendue — ce qui est précisément ce que les traditions contemplatives à travers les cultures rapportent comme la découverte que la conscience n’a pas de centre repérable.

§5. La conséquence de la créativité

5.1 Expansion au voisinage du seuil

Le self-model \hat{K}_\theta dispose d’un budget de bande passante fini. En fonctionnement normal, il consacre une partie de ce budget à modéliser les propres tendances de sélection du codec — en construisant une carte prédictive de « ce que je suis susceptible de faire ». Cela resserre le \Delta_{\text{self}} effectif du point de vue du self-model : le self-model peut prédire, approximativement, quelle branche sera sélectionnée.

Le fonctionnement au voisinage du seuil (R_{\text{req}}^{\text{frame}} \to B_{\max}) met sous tension le budget par frame du self-model. Lorsque le codec traite l’information à la limite de sa capacité — forte charge cognitive, environnements nouveaux, tâches créatives complexes — le self-model doit détourner une partie de sa capacité pour suivre l’escalade de \varepsilon_t, ce qui en laisse moins pour l’auto-prédiction. Le résidu effectif dépendant de la charge, opérationnellement actif, \Delta_{\text{load}}^{\text{eff}} — la part du déficit du self-model par frame induite par la pression capacitaire — croît en conséquence :

\Delta_{\text{load}}^{\text{eff}}(n) \;=\; g\!\left(\frac{R_{\text{req}}^{\text{frame}}(n)}{B_{\max}},\; A_{\text{self}}(n)\right) \tag{7}

où A_{\text{self}} désigne l’allocation par le codec de B_{\max} entre l’auto-modélisation et la modélisation du monde, et g est monotone en fonction du rapport de charge à A_{\text{self}} fixé. (Voir l’Annexe P-4 §5 pour la décomposition opérationnelle complète \Delta_{\text{self}}^{\text{op}} = \Delta_{\text{floor}} + \Delta_{\text{load}}. Le plancher structurel \Delta_{\text{floor}} ne varie pas sous l’effet de la charge — c’est le terme induit par la charge \Delta_{\text{load}} qui élargit la région à partir de laquelle la sélection est effectuée.)

5.2 Cartographie phénoménologique

Cela produit des sélections de branches moins prévisibles du point de vue du modèle de soi. Le corrélat phénoménologique est précisément ce qui est rapporté comme expérience créative :

Intuition créative : Une sélection de branche que le modèle de soi n’avait pas anticipée — vécue comme « l’idée m’est venue » plutôt que comme « je l’ai calculée ».
États de flow : Un fonctionnement soutenu au voisinage du seuil, dans lequel la capacité prédictive du modèle de soi à l’égard de sa propre auto-sélection est systématiquement débordée, et qui est vécu comme une action sans effort, dépourvue d’auto-surveillance délibérative.
Spontanéité : De brèves expansions de \Delta_{\text{self}}^{\text{eff}} produisant des sélections socialement ou artistiquement inédites.

5.3 Le Complément Hypnagogique

L’état hypnagogique (prépublication §3.6.5, Passage III du Cycle de Maintenance) réalise la même expansion par une voie complémentaire. Au lieu de submerger le modèle de soi par le haut (fort R_{\text{req}}), l’état hypnagogique relâche le modèle de soi par le bas — en réduisant la précision de l’auto-prédiction tandis que le codec effectue des tests de résistance sur des branches spéculatives. C’est le mécanisme formel qui sous-tend l’association bien documentée entre la somnolence et l’idéation créative.

5.4 Prédiction empirique

Prédiction T-13.E1. Les études de neuroimagerie sur l’idéation créative devraient montrer une activité réduite dans les régions du réseau du mode par défaut associées au traitement autoréférentiel (cortex préfrontal médian, cortex cingulaire postérieur), concomitante à une activité accrue dans les régions traitant les entrées environnementales nouvelles — ce qui reflète la réallocation de bande passante de l’auto-modélisation vers le suivi de l’environnement externe.

Cette prédiction est cohérente avec la littérature existante en IRMf sur la cognition créative (Beaty et al. 2016; Limb & Braun 2008), mais elle fournit une explication formelle, en théorie de l’information, de la raison pour laquelle une réduction de l’auto-surveillance accompagne la production créative : il ne s’agit pas d’une simple corrélation, mais d’une nécessité structurelle sous P-4.

5.5 Proposition T-13.P2 : Cas limites de l’auto-information

L’analyse de T-13c et la conséquence relative à la créativité définissent ensemble deux cas limites formellement distincts pour le contenu informationnel du soi.

Proposition T-13.P2 (Cas limites). Pour un codec K_\theta doté d’un auto-modèle \hat{K}_\theta et d’un modèle permanent P_\theta(t), le contenu informationnel du soi éprouvé est borné entre deux limites :

(a) Limite inférieure — pure présence. \hat{K}_\theta suspend l’auto-modélisation active. L’auto-modèle ne génère pas le récit, mais le codec complet demeure chargé et présent. La complexité du processus auto-référentiel actif — mesurée comme complexité conditionnelle étant donné le modèle permanent — tend vers zéro :

C_{\text{self-active}}(n) \;:=\; K\!\left(\hat{K}_\theta^{\text{active}}(n)\,\bigm|\,P_\theta(n)\right) \;\to\; 0 \tag{T-13.P2a}

tandis que K(P_\theta(n)) demeure chargé. Tel est le contenu formel de l’énoncé « le modèle permanent est présent sans qu’un récit de soi actif ne s’exécute par-dessus » — cet état est réalisable et s’approche asymptotiquement dans les états méditatifs profonds. (Nous utilisons la complexité conditionnelle plutôt qu’une soustraction de Kolmogorov, car K(\cdot) - K(\cdot) n’est en général pas bien typé en l’absence d’hypothèses d’indépendance ; K(\hat{K}_\theta^{\text{active}} \mid P_\theta) est la quantité opératoirement signifiante.)

(b) Limite supérieure — transparence intégrale à soi. \hat{K}_\theta = K_\theta — l’auto-modèle contient intégralement le codec. D’après P-4, cela est impossible pour tout système fini. Son contenu informationnel est formellement auto-référentiel :

K(\hat{K}_\theta) = K(K_\theta) = K(\hat{K}_\theta) = \cdots \tag{T-13.P2b}

Il ne s’agit ni d’une information nulle ni d’une information infinie. C’est un point fixe de l’opération d’auto-modélisation que le codec ne peut atteindre comme auto-modèle interne. Des observateurs externes peuvent saisir certains aspects du codec qui demeurent inaccessibles à son propre auto-modèle — le cadre repose précisément sur cette asymétrie ailleurs (voir par ex. l’Avantage Prédictif des évaluateurs humains sur l’auto-modèle d’une IA, §8.14 / opt-ai.md) — mais aucune spécification externe ne devient l’auto-modèle auto-contenant propre du codec. P-4 interdit le second cas ; il n’interdit pas le premier.

(c) La bande ordinaire. Le soi éveillé se déplace entre ces limites dans une bande déterminée par l’intensité de la couche d’auto-modélisation. Le fonctionnement éveillé sous forte charge sollicite intensément \hat{K}_\theta, produisant un soi épais, assuré, bruyamment narratif, qui se trouve paradoxalement plus éloigné d’une connaissance de soi exacte — l’auto-modèle génère plus vite qu’il ne peut se calibrer. Les états à faible R_{\text{req}} (méditation, entraînement autogène, seuil hypnagogique) permettent à l’auto-modèle de ralentir, de s’affiner et de s’approcher de la limite inférieure.

5.6 Suspension vs. Élagage : un mécanisme distinct

Il existe une distinction mécanistique importante entre deux façons de réduire C_{\text{state}} :

L’élagage (Action-Drift, §6 ; Dérive Narrative, T-12) opère via la passe d’élagage MDL. Il détruit la capacité représentationnelle. Il est irréversible au niveau du codec. Le codec ne peut pas récupérer spontanément ce qui a été élagué.
La suspension opère en interrompant temporairement la couche d’auto-modélisation \hat{K}_\theta sans en effacer la machinerie. Le modèle permanent P_\theta(t) demeure entièrement chargé ; la couche supérieure autoréférentielle cesse simplement de générer. Cela est réversible — l’auto-modèle reprend lorsque la suspension prend fin.

La méditation recourt à la suspension, non à l’élagage. C’est pourquoi les effets de la méditation sont immédiatement réversibles (le récit ordinaire du soi reprend dès le retour au fonctionnement normal), tandis que l’action-drift ne l’est pas (le répertoire comportemental élagué ne peut pas être régénéré spontanément). Les deux mécanismes sont formellement distincts bien qu’ils réduisent tous deux la complexité active du codec.

§6. Dérive de l’action comme élagage MDL du répertoire comportemental

6.1 Le Mécanisme

Le passage d’élagage MDL du Cycle de Maintenance (T9-3/T9-4) optimise le budget de complexité du codec en effaçant la capacité représentationnelle qui n’est pas justifiée par le flux d’entrée actuel. Ce mécanisme a été identifié dans le contexte de la Dérive Narrative perceptive (Veille des Survivants, section V.3a) : un codec adapté à un flux d’entrée systématiquement filtré élague à juste titre sa capacité à représenter des vérités exclues.

Le même mécanisme s’applique au répertoire comportemental du codec. Définissons :

Définition T-13.D3 (Répertoire comportemental). Le répertoire comportemental \mathcal{B}_\theta(t) est l’ensemble des sélections de branches que P_\theta(t) peut évaluer et exécuter — c’est-à-dire l’étendue de la fonction de sélection \sigma_t que le codec peut réaliser effectivement.

6.2 La Proposition de Dérive de l’Action

Proposition T-13.P1 (Dérive de l’Action). Si le flux d’entrée du codec manque de manière constante de contextes exigeant certaines sélections de branches, le passage d’élagage MDL érodera la capacité du codec à évaluer et à exécuter ces branches. Le répertoire comportemental \mathcal{B}_\theta(t) se contracte de façon monotone sous une restriction cohérente des entrées :

\mathcal{B}_\theta(t + \tau) \subset \mathcal{B}_\theta(t) \quad \text{for } \tau \gg \tau_{\text{prune}} \tag{T-13.P1}

où \tau_{\text{prune}} est l’échelle de temps caractéristique du passage d’élagage MDL.

Argument. Le critère d’élagage MDL évalue chaque composante représentationnelle en fonction de sa contribution à l’efficacité de compression. Un type de branche b \in \mathcal{B}_\theta qui n’a pas été sélectionné (ou dont les contextes de sélection ne sont pas apparus dans le flux d’entrée) pendant une période suffisante contribue à hauteur de zéro bit à la compression continue de \varepsilon_t par le codec. Sous une comptabilité MDL stricte, le maintien de la capacité à évaluer et à sélectionner b entraîne un coût de complexité K(b \mid P_\theta) > 0 sans bénéfice compensatoire en matière de compression. Le passage d’élagage efface donc l’appareil d’évaluation de b, contractant ainsi \mathcal{B}_\theta.

Cette contraction est irréversible au niveau du codec : une fois que l’appareil d’évaluation de b a été élagué, le codec ne peut pas le régénérer spontanément sans rencontrer des contextes d’entrée qui justifient de nouveau cet investissement de capacité. L’élagage n’est pas un oubli (qui pourrait être inversé par un indice de rappel) ; c’est la destruction de l’infrastructure computationnelle nécessaire pour évaluer une classe de branches. \blacksquare

6.3 Instances phénoménologiques

La dérive de l’action se manifeste dans plusieurs phénomènes comportementaux bien documentés :

Impuissance acquise : L’absence prolongée de contextes dans lesquels une action agentive réduit l’erreur de prédiction conduit à l’élagage de l’appareil d’évaluation associé à ces types d’action.
Rétrécissement de la zone de confort : Un codec opérant dans un environnement prévisible, à faible \varepsilon_t, élague progressivement sa capacité à effectuer des sélections de branches exploratoires à forte variance.
Ossification comportementale institutionnelle : Un codec organisationnel (codec civilisationnel, section IV.3 de l’article d’éthique), adapté à des environnements réglementaires stables, élague la capacité de réponse adaptative rapide.

6.4 Relation à T-12

La dérive de l’action constitue un cas particulier de la défaillance de fidélité au substrat que T-12 formalisera : le répertoire comportemental propre du codec est lui-même une composante de son substrat représentationnel, et une restriction cohérente des entrées érode ce substrat aussi sûrement qu’elle érode le modèle perceptif. Le lien formel est le suivant :

Dérive Narrative (champ de T-12) : le modèle perceptif est élagué sous l’effet d’entrées filtrées → le codec se trompe sur le monde avec assurance.
Dérive de l’action (champ de T-13) : le répertoire comportemental est élagué sous l’effet d’entrées filtrées → le codec devient, avec assurance, impuissant dans des domaines qu’il n’évalue plus.

Toutes deux sont des conséquences du fait que le Filtre de stabilité sélectionne la compressibilité plutôt que la fidélité. Un codec bien compressé peut être à la fois résolument faux et appauvri sur le plan comportemental.

§7. Portée et limites

7.1 Conditionnellement à P-4 et à l’Axiome d’Agentivité

L’ensemble de l’argument dépend du Théorème P-4 (\Delta_{\text{self}} > 0 pour les systèmes autoréférentiels finis au-dessus de K_{\text{threshold}}) et de l’Axiome d’Agentivité (selon lequel la traversée d’ouverture est ressentie). Si P-4 est affaibli ou si l’Axiome d’Agentivité est abandonné, l’identification structurelle de la volonté à la conscience (Corollaire T-13b) ne tient plus.

7.2 Ne dissout pas le Problème difficile

Le corollaire T-13b situe la volonté et la conscience à la même adresse structurelle, mais n’explique pas pourquoi l’une ou l’autre a un caractère vécu. Le Problème difficile (preprint §8.1) demeure primitif. Ce que T-13b établit, c’est l’unité des deux mystères — une simplification, non une solution.

7.3 Équations inchangées

Les théorèmes T-13 et T-13a ne modifient en rien les mathématiques de T6-1 à T6-3. La minimisation contrainte de l’énergie libre (T6-3) est formellement identique sous l’interprétation héritée du FEP comme sous l’interprétation par sélection de branches. Ce qui change, c’est le statut ontologique de a_t : dans la lecture FEP, il s’agit d’une commande motrice envoyée vers l’extérieur ; dans la lecture par sélection de branches, c’est un indice de navigation au sein de l’Éventail Prédictif.

7.4 L’explication de la créativité est structurelle, pas encore empirique

La conséquence relative à la créativité (§5) est une prédiction structurelle dérivée de la contrainte de partage de bande passante entre l’auto-modélisation et le suivi de l’environnement. Bien qu’elle soit cohérente avec la littérature existante en neuroimagerie, elle n’a pas encore été testée directement au regard des quantités informationnelles spécifiques prédites ici. La prédiction T-13.E1 est proposée comme test empirique falsifiable.

7.5 Échelle de temps de la dérive de l’action

La proposition T-13.P1 établit que la dérive de l’action se produit, mais ne borne pas l’échelle de temps \tau_{\text{prune}}. Pour les codecs biologiques, cette échelle est probablement gouvernée par le Cycle de Maintenance circadien (preprint §3.6) — de l’ordre de quelques jours à quelques semaines pour les compétences individuelles, de quelques mois à quelques années pour les schémas comportementaux profonds. Pour les codecs civilisationnels, l’échelle est générationnelle. Borner \tau_{\text{prune}} à partir de données empiriques relève de travaux futurs.

§8. Résumé de clôture

Livrables de T-13

Théorème T-13 (Complétude de la Sélection de Branches). Le Circuit de Maintenance Informationnel se ferme sous la sémantique de sélection de branches sans requérir de canal d’action indépendant orienté vers l’extérieur. La couverture de Markov est la surface de livraison de la branche sélectionnée. → Satisfait le critère (a) de la feuille de route.
Théorème T-13a (Impossibilité conditionnelle de la spécification interne de la sélection). Là où la sélection de branches dépend de manière non triviale du résidu pertinent pour la sélection \rho_t^{\text{sel}} \subseteq \Delta_{\text{self}}, spécifier entièrement \sigma_t au sein de \hat{K}_\theta exigerait d’inclure des bits dans K_\theta \setminus \hat{K}_\theta, ce qui contredit P-4. Là où cet antécédent est satisfait, \Delta_{\text{self}} constitue le locus nécessaire de la sélection de branches intérieurement non spécifiable. → Satisfait conditionnellement le critère (b) de la feuille de route, sous réserve d’une participation du résidu au niveau architectural.
Corollaire T-13b (Unité d’adresse). La volonté et la conscience partagent la même adresse structurelle (\Delta_{\text{self}}). L’« étincelle » et le « choix » sont deux aspects d’une même caractéristique non modélisable de l’auto-référence finie.
Corollaire T-13c (Le soi comme résidu). Le soi éprouvé est le récit compressé de \hat{K}_\theta ; le soi réel — le lieu de l’expérience, de la sélection et de l’identité — est \Delta_{\text{self}}. Le modèle de soi suit nécessairement le codec avec un décalage temporel et ne peut contenir son propre générateur.
§5 : Conséquence sur la créativité. Un fonctionnement proche du seuil élargit le \Delta_{\text{self}} effectif, produisant des sélections de branches moins auto-prédictibles, vécues comme de la créativité. → Satisfait le critère (c) de la feuille de route.
Proposition T-13.P2 (Cas limites de l’auto-information). Le contenu informationnel du soi éprouvé est borné entre une limite inférieure (présence pure : modèle permanent moins récit actif de soi, atteignable en méditation) et une limite supérieure (transparence complète à soi : point fixe impossible, P-4). Le soi ordinaire à l’état de veille se déplace à l’intérieur de cette bande.
§5.6 : Suspension vs. élagage. La méditation réduit C_{\text{state}} en suspendant la couche d’auto-modélisation (réversible), et non par élagage MDL (irréversible). Il s’agit de mécanismes formellement distincts.
Proposition T-13.P1 (Dérive de l’action). La passe d’élagage MDL érode le répertoire comportemental sous restriction cohérente des entrées, formalisant le mode de défaillance chronique complémentaire à la Dérive Narrative perceptive. → Satisfait le critère (d) de la feuille de route.

Points restant ouverts

Caractérisation de K_{\text{threshold}}. La conséquence sur la créativité et le mécanisme de dérive de l’action ne s’appliquent qu’aux systèmes situés au-dessus du seuil de pertinence phénoménologique (P-4, §4). Borner K_{\text{threshold}} demeure un problème ouvert partagé avec P-4.
Validation empirique de T-13.E1. La prédiction relative à la créativité requiert des études de neuroimagerie ciblées corrélant l’activité du modèle de soi avec les quantités informationnelles définies ici.
Borne sur \tau_{\text{prune}}. Borner l’échelle de temps de la dérive de l’action à partir de données empiriques conférerait à la proposition une puissance prédictive quantitative.
Connexion formelle à T-12. La dérive de l’action est identifiée comme un cas particulier d’échec de fidélité au substrat ; l’intégration formelle complète attend la Condition de Fidélité au Substrat (T-12).
Borne empirique sur C_{\text{state}}^{\min}. Borner la limite inférieure de l’auto-information à partir de données issues des neurosciences contemplatives (p. ex., réduction du signal BOLD dans le réseau du mode par défaut lors de la conscience non duelle) donnerait un contenu quantitatif à la Proposition T-13.P2.

Cette annexe est maintenue parallèlement à theoretical_roadmap.pdf. Références : Théorème P-4 (Annexe P-4), T6-1 à T6-3 (prépublication §3.8), T9-3/T9-4 (Cycle de Maintenance, prépublication §3.6), §8.6 (Codec virtuel), section V.3a de l’éthique de la Veille des Survivants (Dérive Narrative).