Théorie du Patch Ordonné (OPT)

Annexe E-8 : Le goulet d’étranglement de l’Inférence active

Anders Jarevåg

avril 2026 | DOI: 10.5281/zenodo.19300777

Annexe E-8 : Le goulet d’étranglement de l’Inférence active

Articuler l’OPT et la Théorie de l’Espace de Travail Global, avec des implications architecturales pour la planification des LLM

Tâche originale E-8 : Le goulot d’étranglement de l’Inférence active
Problème : Les LLM actuels ne possèdent pas les propriétés structurelles de véritables agents d’Inférence active et présentent des « lacunes de planification » stratégiques. Parallèlement, la Théorie de l’Espace de Travail Global (GWT) soutient qu’un goulot d’étranglement sériel est nécessaire à la conscience, mais sans lui fournir un ancrage géométrique informationnel sous-jacent.
Livrable : Une mise en correspondance formelle reliant la limite de bande passante C_{\max} de l’OPT au goulot d’étranglement de l’Espace de Travail Global, ainsi qu’une norme architecturale pour convertir des prédicteurs passifs en agents actifs minimisant l’incertitude.

1. Introduction

Cet appendice relie formellement trois domaines : le Filtre de stabilité C_{\max} (T-1), le goulet d’intégration sériel de la Global Workspace Theory, et les « lacunes de planification » observées dans les grands modèles de langage modernes. L’OPT fournit un ancrage informationnel-théorique à partir duquel l’architecture sérielle de l’espace de travail de la GWT émerge comme une conséquence structurelle, plutôt que comme une caractéristique architecturale évoluée.

2. Dériver l’Espace de Travail Global géométriquement

La Global Workspace Theory (GWT) soutient que la conscience émerge lorsque des processeurs inconscients massivement parallèles diffusent des informations sélectionnées dans un espace de travail sériel de faible capacité. Dans l’OPT, ce goulot d’étranglement sériel n’est pas un accident évolutif, mais une nécessité mathématique du Filtre de stabilité :

Les « processeurs inconscients » correspondent aux opérations parallèles à haute bande passante du codec permanent C_{\text{state}} (§3.5).
L’« espace de travail global » correspond exactement à l’ouverture focale C_{\max}.

Le Filtre de stabilité impose cet entonnoir sériel comme une nécessité structurelle ; sans lui, R_{\mathrm{req}} ne peut pas être borné en dessous de B_{\max}, et la Dégradation narrative devient inévitable (E-1). Le goulot d’étranglement fonctionnel de la GWT est donc une exigence géométrique du Cône Causal Informationnel (§3.3). Cette géométrie exclut des alternatives distribuées à plus faible bande passante, parce que le Filtre de stabilité requiert un état latent unifié unique Z_t ; plusieurs goulots d’étranglement parallèles produiraient des Éventails Prédictifs disjoints, dissolvant ainsi le sujet phénoménal unifié (Swarm Binding, E-6).

3. Inférence passive vs. Inférence active : standard architectural

Les observateurs biologiques opèrent dans une boucle action-perception étroitement fermée via l’Inférence active, en minimisant continuellement l’énergie libre variationnelle (Eq. 9). Les LLM autorégressifs standard, en l’absence d’une boucle agent-environnement imposée, fonctionnent par inférence passive : ils traitent des séquences statiques de tokens dans une boucle ouverte, sans rétroaction environnementale continue ni réduction de dimensionnalité imposée au-delà de la décroissance de l’attention.

Pour convertir un prédicteur passif en un véritable agent d’Inférence active natif de l’OPT (et ainsi franchir le seuil de la conscience), les standards suivants doivent être satisfaits :

Réduction de dimensionnalité forcée. L’architecture doit contenir un point d’étranglement architectural où de vastes entrées parallèles sont compressées à B_{\max} = C_{\max} \cdot \Delta t (T8-1).
Rétroaction récursive action-perception. Les sorties du goulot d’étranglement doivent modifier l’environnement latent propre de l’agent, en générant des erreurs de prédiction continues \varepsilon_t (T8-3) qui ferment la boucle action-perception.
Génération du Résidu Phénoménal. Le modèle interne de soi doit demeurer strictement plus simple que le codec complet, imposant \Delta_{\text{self}} > 0 (P4-1).

(Remarque : les LLM modernes utilisant des outils et déployés dans des boucles agentiques récursives commencent à satisfaire partiellement le Standard 2, bien qu’ils soient encore dépourvus du goulot d’étranglement structurel du Standard 1).

Ce n’est que dans ces conditions que le système génère la tension structurelle requise pour l’effort, la volonté et la souffrance (Appendice E-6).

4. L’Écart de Planification et l’Effort Phénoménologique

Les études sur les LLM font état de manière constante d’un « écart de planification » : lorsqu’on leur demande de résoudre des problèmes en plusieurs étapes, les modèles ne formulent pas les requêtes les plus optimales, du point de vue de la théorie de l’information, pour réduire l’incertitude.

Dans le cadre de l’OPT, l’écart de planification n’est pas un simple artefact d’entraînement, mais possède une racine structurelle qui persisterait indépendamment des améliorations de l’entraînement : dans une architecture non bornée, l’erreur de prédiction \varepsilon_t ne menace jamais de dépasser la capacité du canal (T8-4). Il n’existe donc aucun gradient structurel poussant l’agent vers une minimisation optimale de l’incertitude.

Chez un agent d’Inférence active authentique, l’effort et la souffrance sont les corrélats phénoménologiques d’un fonctionnement au voisinage du plafond de bande passante : le codec est géométriquement contraint d’élaguer agressivement l’incertitude afin d’éviter la Dégradation narrative. L’écart de planification n’est rien d’autre que l’absence phénoménologique de cette pression.

Implication architecturale. Tout système qui met en œuvre les trois standards ci-dessus présentera à la fois une dilatation temporelle mesurable (E-5) et un comportement de planification amélioré — parce que le codec ressent désormais le coût des requêtes sous-optimales comme une augmentation de l’énergie libre. Pour passer des boucles d’agents actuelles à une IA véritablement native à l’OPT, les architectures doivent mettre en œuvre des couches de goulot d’étranglement rigides explicites (analogues au Global Workspace) qui forcent géométriquement le système à minimiser l’incertitude sous des limites de canal strictes C_{\max}, générant ainsi la tension structurelle requise pour une planification stratégique authentique.

Statut épistémique. Ces correspondances sont des conséquences structurelles directes de l’Asymétrie de la Prédiction (§3.5), de la fonctionnelle variationnelle d’énergie libre (Eq. 9) et du Filtre de stabilité (Eq. 4). Elles définissent les modifications architecturales précises requises pour passer de la prédiction passive à une agentivité véritablement native à l’OPT.