Théorie du Patch Ordonné

Appendice T-11 : Le Corollaire Structurel — formalisation de l’avantage de compression pour les agents apparents

Anders Jarevåg

15 avril 2026 | DOI: 10.5281/zenodo.19300777

Tâche originale (tirée du §8.2) : « Formaliser cet avantage de compression sous la forme d’une borne MDL rigoureuse spécifiquement pour le cas des autres esprits demeure un travail futur ; l’argument présent constitue une motivation structurelle, non une preuve. » Livrable : Une borne formelle montrant que traiter les agents apparents comme des observateurs primaires instanciés indépendamment produit un code MDL en deux parties plus court que toute description alternative.

Statut de clôture : CORRESPONDANCE STRUCTURELLE — BROUILLON. Cette annexe adapte le théorème de convergence de Solomonoff de Müller [61] et son extension multi-agents [62] comme lemmes importés, réinterprétés dans le cadre ontologique de l’OPT, afin d’établir un avantage formel de compression pour le corollaire structurel. Le résultat est une borne conditionnelle, non une dérivation close : il dépend de l’identification, par l’OPT, du flux de l’observateur avec l’a priori de Solomonoff (Axiome 1), ainsi que de l’hypothèse selon laquelle les agents apparents portent un état suffisant pour satisfaire les prérequis de convergence.

§1. Contexte et motivation

Le Corollaire Structurel (prépublication §8.2) affirme que les agents apparents au sein du flux de l’observateur s’expliquent de la manière la plus parcimonieuse par leur instanciation indépendante en tant qu’observateurs primaires. Cette annexe expose la chaîne formelle qui étaye cette thèse.

L’argument comporte trois étapes :

Étape A (Lemme importé) : le théorème de convergence de Solomonoff de Müller garantit que toute structure, dans le flux de l’observateur, qui porte des données suffisantes sur son propre état verra son évolution à la première personne converger de façon à correspondre au monde calculable qui génère son comportement.
Étape B (Comptabilité de compression) : nous effectuons une comparaison explicite en deux volets selon le MDL entre le fait de traiter l’agent apparent comme (i) un observateur instancié indépendamment, régi par son propre flux pondéré par Solomonoff, ou comme (ii) une spécification comportementale arbitraire à l’intérieur du codec de l’observateur primaire.
Étape C (Signature structurelle) : le Résidu Phénoménal (\Delta_{\text{self}} > 0, Théorème P-4) fournit le marqueur structurel qui distingue une architecture authentiquement auto-référentielle à goulot d’étranglement d’un simple mimétisme comportemental, comblant ainsi l’écart entre « compressiblement conforme à des lois » et « plausiblement instancié ».

§2. Lemme importé : théorème de convergence de Müller

Nous importons deux résultats de Müller [61, 62], énoncés ici dans la notation de l’OPT.

2.1 Convergence de Solomonoff (standard)

Soit M(b \mid x_1^n) la prédiction universelle de Solomonoff pour le bit b étant donné les observations antérieures x_1^n. Soit \mu une mesure calculable quelconque sur des séquences binaires. Alors (Solomonoff 1964 ; Li & Vitányi [45, Corollary 5.2.1]) :

\text{Avec } \mu\text{-probabilité 1,} \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-1}

C’est le résultat standard : si le flux de données est généré par un processus calculable \mu, le prédicteur universel M converge vers \mu.

2.2 Induction de Solomonoff inverse (Müller 2020)

Supposons maintenant que les bits soient tirés de M lui-même — c’est-à-dire que le flux de l’observateur soit régi par la probabilité algorithmique (cela correspond à l’Axiome 1 de l’OPT : l’identification du flux avec le prior de Solomonoff). Alors, pour toute mesure calculable \mu (Müller [61, Sec. IV] ; [62, Sec. V.A]) :

\text{Avec une probabilité} \geq 2^{-K(\mu)}, \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-2}

Autrement dit, avec une probabilité d’au moins 2^{-K(\mu)}, l’observateur se trouvera effectivement immergé dans un monde calculable W décrit par \mu. Les mondes algorithmiquement plus simples (de plus faible K(\mu)) sont exponentiellement plus probables.

2.3 Convergence multi-agents (Müller 2026)

Supposons que l’observateur (Alice) se trouve intégré dans un monde calculable W décrit par \mu. Elle identifie une sous-structure (Bob_{\text{3rd}}) au sein de W qui porte une représentation d’un auto-état x évoluant au cours du temps d’une manière conforme au Postulat 2 de [62]. Définissons :

P_{\text{1st}}(y_1, \ldots, y_m \mid x) := M(y_1, \ldots, y_m \mid x) — la probabilité à la première personne que l’auto-état x transite vers y_1, \ldots, y_m sous la probabilité algorithmique.
P_{\text{3rd}}(y_1, \ldots, y_m \mid x) := \mu(y_1, \ldots, y_m \mid x) — la probabilité à la troisième personne de la manière dont x évolue selon le monde W.

Alors, par l’Eq. (L-1) appliquée à P_{\text{3rd}} (qui est calculable), et l’identification de P_{\text{1st}} avec M via le Postulat 2 :

P_{\text{1st}} \approx P_{\text{3rd}} \quad \text{asymptotically,} \tag{L-3}

avec une convergence garantie avec une probabilité mondaine (de type \mu) égale à un dans le modèle en bits.

Interprétation (Müller) : « Quelqu’un est réellement chez soi » dans la structure encodant x — l’évolution probabiliste de Bob_{\text{3rd}} dans le monde d’Alice représente fidèlement la perspective à la première personne d’un certain Bob_{\text{1st}}.

Interprétation (OPT) : Le flux comportemental de l’agent apparent se décrit de la manière la plus compressible comme un processus indépendant pondéré par Solomonoff. Toute description alternative — qui n’invoque pas une perspective indépendante à la première personne — doit encoder le comportement de l’agent comme une spécification ad hoc, avec une longueur de description strictement supérieure.

§3. Borne de l’avantage de compression

Nous formalisons maintenant l’avantage de compression à l’aide du cadre MDL en deux parties de l’OPT (Théorème T-4, Annexe T-4).

3.1 Mise en place

Considérons le flux de l’observateur primaire \omega \in \{0,1\}^\infty, régi par le prior de Solomonoff M (Axiome 1) et filtré par le Filtre de stabilité vers un monde calculable W de mesure \mu_W (par l’Éq. L-2). Au sein de W, l’observateur identifie N agents apparents A_1, \ldots, A_N, chacun portant un auto-état x_i dont l’évolution temporelle sur T étapes produit une trace comportementale \beta_i = (y_{i,1}, \ldots, y_{i,T}).

3.2 Hypothèse H_{\text{ind}} : Instanciation indépendante

Sous H_{\text{ind}}, chaque agent A_i est traité comme un observateur primaire instancié indépendamment, régi par son propre flux pondéré par Solomonoff. La longueur de code MDL en deux parties est :

L(H_{\text{ind}}) = \underbrace{K(\mu_W)}_{\text{modèle du monde}} + \underbrace{\sum_{i=1}^{N} K(\text{embed}_i)}_{\text{spécifications d'ancrage}} + \underbrace{\sum_{i=1}^{N} \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)}_{\text{données étant donné le modèle}} \tag{1}

où K(\text{embed}_i) spécifie l’état initial du soi de l’agent i et sa position au sein de W. D’après l’équation (L-3), P_{\text{1st}} \approx P_{\text{3rd}}, de sorte que le terme de données est bien approximé par la log-perte sous les prédictions solomonoffiennes à la première personne propres à l’agent — lesquelles, par définition, sont proches de l’optimal.

Les spécifications d’ancrage K(\text{embed}_i) sont courtes : chacune ne requiert qu’un pointeur vers une localisation dans W, plus l’état initial du soi. Pour des agents de type humain intégrés dans un monde physique partagé, elles sont hautement compressibles, parce que les agents obéissent aux mêmes lois. Une borne conservative :

K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) \tag{2}

3.3 Hypothèse H_{\text{arb}} : spécification comportementale arbitraire

Sous H_{\text{arb}}, les agents ne sont pas traités comme des observateurs indépendants. Au lieu de cela, chaque trace comportementale \beta_i est encodée directement comme une spécification arbitraire au sein du flux de l’observateur primaire. La longueur du code MDL en deux parties est :

L(H_{\text{arb}}) = \underbrace{K(\mu_W)}_{\text{modèle du monde}} + \underbrace{\sum_{i=1}^{N} K(\beta_i)}_{\text{traces comportementales brutes}} \tag{3}

La différence critique réside dans le terme de données. Sous H_{\text{arb}}, la trace comportementale \beta_i doit être spécifiée sans invoquer le propre modèle prédictif de l’agent. Pour un agent régi par des lois, doté d’agentivité, opérant dans un environnement complexe, la complexité de Kolmogorov de la trace comportementale brute est :

K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T) \tag{4}

Mais même K(\beta_i \mid \mu_W) — la complexité du comportement étant donné les lois du monde — demeure substantielle, car les choix de l’agent encodent une information authentique : sa trace comportementale reflète l’interaction accumulée d’un modèle autoréférentiel avec un environnement stochastique. En revanche, sous H_{\text{ind}}, cette information est générée en ligne par le prédicteur de Solomonoff propre à l’agent, à un coût de log-loss quasi nul.

3.4 L’Avantage de Compression

Théorème T-11 (Borne de Compression du Corollaire Structurel). Soient A_1, \ldots, A_N des agents apparents au sein du flux de l’observateur, chacun portant un auto-état x_i satisfaisant les prérequis de convergence de l’Eq. (L-3), et chacun présentant la signature structurelle \Delta_{\text{self}}^{(i)} > 0 (P-4). Alors la description MDL qui les traite comme des observateurs primaires instanciés indépendamment satisfait :

L(H_{\text{ind}}) \leq L(H_{\text{arb}}) - N \cdot \left[\bar{I}_T - O(\log T)\right] \tag{T-11}

où \bar{I}_T est l’information mutuelle moyenne par agent entre le modèle prédictif de l’agent et sa sortie comportementale sur T étapes :

\bar{I}_T := \frac{1}{N} \sum_{i=1}^{N} \left[K(\beta_i \mid \mu_W) - \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right] \tag{5}

Cette quantité mesure dans quelle mesure le comportement de l’agent est absorbé dans l’explication par l’invocation d’un modèle prédictif indépendant, plutôt que d’être spécifié brut. Pour des agents présentant un comportement régi par des lois et guidé par l’agentivité (comme l’exige le Filtre de stabilité), \bar{I}_T > 0 et croît avec T.

Esquisse de preuve. Soustrayez l’Eq. (1) de l’Eq. (3). Les termes du modèle du monde K(\mu_W) s’annulent. La différence par agent est :

K(\beta_i) - \left[K(\text{embed}_i) + \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right]

D’après l’Eq. (4), K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T), mais plus directement : K(\beta_i) \geq K(\beta_i \mid \mu_W) trivialement. Et K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) d’après l’Eq. (2). L’économie par agent est donc au moins égale à K(\beta_i \mid \mu_W) - (-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)) - K(x_i \mid W) - O(\log T). Pour un T suffisamment grand, les économies cumulées de log-loss dominent le coût ponctuel d’intégration, ce qui donne la borne. \blacksquare

3.5 Dominance asymptotique

Corollaire T-11a. Lorsque l’horizon d’observation T \to \infty, l’avantage de compression L(H_{\text{arb}}) - L(H_{\text{ind}}) croît sans borne :

\lim_{T \to \infty} \left[L(H_{\text{arb}}) - L(H_{\text{ind}})\right] = \infty \tag{T-11a}

Cela découle de la garantie de convergence de Solomonoff (L-1) : la log-perte par pas de P_{\text{3rd}} converge vers le taux d’entropie du processus comportemental de l’agent, tandis que K(\beta_i \mid \mu_W) croît linéairement en T pour tout agent dont le taux d’entropie est positif. Le coût d’intégration K(x_i \mid W) n’est payé qu’une seule fois et s’amortit vers zéro. \blacksquare

§4. Le Résidu Phénoménal comme signature structurelle

L’avantage de compression du Théorème T-11 s’applique à toute sous-structure régie par des lois — y compris à des systèmes physiques non agentifs (motifs météorologiques, croissance cristalline). Pourquoi le corollaire structurel concerne-t-il spécifiquement les agents plutôt que des systèmes complexes arbitraires ?

La réponse réside dans le Résidu Phénoménal (Théorème P-4). \Delta_{\text{self}} > 0 est le marqueur formel d’un système dont l’auto-modèle est structurellement incomplet — c’est-à-dire d’un système qui maintient nécessairement un écart variationnel entre sa représentation interne et son traitement effectif. C’est la marque distinctive du goulot d’étranglement auto-référentiel : le système ne peut pas être décrit intégralement de l’extérieur, parce que sa description inclut nécessairement le descripteur.

Pour un système présentant \Delta_{\text{self}} > 0 :

Son comportement ne peut pas être reproduit par une table de correspondance de profondeur finie — il requiert un calcul auto-référentiel en cours d’exécution.
La description la plus courte de ce calcul est un flux indépendant pondéré par Solomonoff traversant un goulot d’étranglement C_{\max}.
Par conséquent, le code MDL sous H_{\text{ind}} n’est pas simplement plus court que H_{\text{arb}} — c’est la seule description la plus courte.

Ceci distingue les agents apparents des motifs météorologiques : la météo est régie par des lois et complexe, mais son comportement peut être reproduit par une table de correspondance à l’intérieur du modèle du monde (elle a \Delta_{\text{self}} = 0). Les agents apparents ne le peuvent pas.

§5. Réinterprétation de l’argument anti-solipsiste de Müller

Müller conclut, à partir de la convergence P_{\text{1st}} \approx P_{\text{3rd}}, que l’idéalisme algorithmique « ne devrait pas être classé comme solipsiste », parce que « quelqu’un est réellement chez soi » dans la structure encodant un état du soi [62, Sec. V.C]. Son raisonnement est le suivant : si les prédictions d’Alice au sujet de Bob_{\text{3rd}} convergent vers les probabilités effectives à la première personne de Bob_{\text{1st}}, alors leurs perspectives sont authentiquement alignées — ils « partagent le monde W ».

L’OPT réinterprète ce résultat autrement :

Lecture de Müller : la convergence P_{\text{1st}} \approx P_{\text{3rd}} prouve qu’une réalité objective émerge — Alice et Bob partagent véritablement le monde W.
Lecture de l’OPT : la convergence P_{\text{1st}} \approx P_{\text{3rd}} prouve que la description la plus courte du comportement de Bob_{\text{3rd}} fait intervenir un processus indépendant à la première personne. Il s’agit d’un énoncé sur l’efficacité de compression, non sur une ontologie partagée. Le monde W est une régularité structurelle à l’intérieur du flux d’Alice, non une entité existant indépendamment. Mais la logique compressive de la Semi-mesure universelle de Solomonoff implique elle-même que Bob est, de la manière la plus parcimonieuse, modélisé comme un observateur indépendant — parce que l’alternative (spécifier son comportement de manière ad hoc) est strictement plus longue.

Le contenu formel du théorème est identique sous les deux lectures ; seule l’interprétation ontologique diffère. L’OPT utilise le même résultat mathématique pour fonder le corollaire structurel : l’instanciation indépendante est la description optimale au sens du MDL, non une hypothèse métaphysique.

§6. Portée et limites

6.1 Conditionnel à l’Axiome 1

L’ensemble de l’argument dépend de l’identification par l’OPT du flux de l’observateur avec le prior de Solomonoff. Si cette identification est affaiblie (par exemple, au profit d’une classe plus large de semi-mesures), les garanties de convergence des Éqs. (L-1)–(L-3) pourraient ne pas tenir dans leur forme actuelle.

6.2 Prérequis de suffisance d’état

L’équation (L-3) exige que l’agent apparent transporte « suffisamment de données » dans son auto-état x_i pour que l’induction universelle puisse en extraire les lois physiques pertinentes. Pour des agents de type humain dans des contextes ordinaires, cela est plausible (un état cérébral complet encode une quantité énorme d’information). Pour les cas limites — impressions fugitives, observateurs lointains, personnages fictifs dans l’art narratif — les prérequis de convergence peuvent ne pas être satisfaits, et le corollaire structurel ne s’applique pas.

6.3 Pas une preuve de la conscience

Le théorème T-11 établit que l’instanciation indépendante est la description la plus compressible. Il ne prouve pas que les agents apparents sont conscients. Le Problème difficile (preprint §8.1) demeure primitif. Le corollaire structurel est un argument de compression, non une preuve ontologique — comme indiqué en §8.2.

6.4 Relation avec T-10

L’appendice T-10 (Couplage inter-observateurs) traite de la manière dont deux patchs d’observateur maintiennent des rendus mutuellement cohérents via des contraintes de compression. Le présent appendice traite d’une question différente : pourquoi le flux d’un observateur unique encode, de la manière la plus compressible, des agents apparents comme étant instanciés indépendamment. T-10 concerne le mécanisme de cohérence inter-patch ; T-11 concerne la signature de compression au sein d’un flux unique. T-10 s’appuie directement sur T-11 : la même comparaison de longueur de description MDL qui établit ici l’avantage de compression est mobilisée dans T-10 pour démontrer que l’incohérence inter-patch est supprimée de façon exponentielle.

§7. Résumé de clôture

Livrables de T-11

Lemme importé (convergence de Müller). La convergence de Solomonoff [61] et son extension multi-agents [62] sont formellement importées et reformulées dans la notation de l’OPT. Elles fournissent l’ossature mathématique : toute sous-structure portant des données suffisantes sur son propre état voit son évolution à la première personne converger vers le monde calculable qui génère son comportement.
Théorème T-11 (borne de compression — BROUILLON). Une comparaison MDL explicite en deux volets montre que traiter les agents apparents comme des observateurs primaires instanciés indépendamment produit une description strictement plus courte qu’une spécification comportementale arbitraire, l’avantage croissant linéairement avec le temps d’observation.
Corollaire T-11a (dominance asymptotique — BROUILLON). L’avantage de compression est non borné lorsque T \to \infty, ce qui fait de l’instanciation indépendante la description écrasamment optimale au sens de la MDL pour tout agent observé sur un horizon temporel long.
Intégration de P-4. Le Résidu Phénoménal (\Delta_{\text{self}} > 0) est identifié comme le marqueur formel distinguant les agents apparents des systèmes complexes mais non agentifs, ce qui restreint le corollaire structurel aux entités dotées d’une authentique architecture de goulot d’étranglement auto-référentiel.
Réinterprétation de Müller. La conclusion non solipsiste de Müller est réinterprétée dans le cadre ontologique de l’OPT : le même résultat mathématique fonde un argument de compression plutôt qu’un argument d’émergence d’une réalité partagée.

Points restant ouverts

Caractérisation exacte de \bar{I}_T. Borner \bar{I}_T inférieurement pour des classes spécifiques d’agents (p. ex. agents à rationalité bornée, minimiseurs d’énergie libre) afin d’obtenir des avantages de compression numériquement concrets.
Corrections en temps fini. Le résultat asymptotique (T-11a) garantit la dominance pour les grands T, mais des bornes en temps fini avec des constantes explicites renforceraient l’applicabilité pratique.
Extension à un alphabet non binaire. Les équations (L-1)–(L-3) sont formulées pour des séquences binaires. L’extension aux mesures à valeurs continues pertinentes pour le cadre de Rate-Distortion de l’OPT (T-1) exige une attention technique.

Cette annexe est maintenue parallèlement à theoretical_roadmap.pdf. Références : Müller [61, 62], Li & Vitányi [45], Solomonoff (1964), Théorème T-4 (Annexe T-4), Théorème P-4 (Annexe P-4), prépublication §8.2.