Teoria del Patch Ordinato

Appendice T-11: Il Corollario Strutturale — Formalizzazione del Vantaggio di Compressione per gli Agenti Apparenti

Anders Jarevåg

15 aprile 2026 | DOI: 10.5281/zenodo.19300777

Compito originale (da §8.2): “La formalizzazione di questo vantaggio di compressione come un limite MDL rigoroso specificamente per il caso delle altre menti resta lavoro futuro; l’argomento qui presentato è una motivazione strutturale, non una dimostrazione.” Risultato atteso: Un limite formale che mostri che trattare gli agenti apparenti come osservatori primari istanziati indipendentemente produce un codice MDL in due parti più breve di qualsiasi descrizione alternativa.

Stato di chiusura: CORRISPONDENZA STRUTTURALE IN BOZZA. Questa appendice adatta il teorema di convergenza di Solomonoff di Müller [61] e la sua estensione multi-agente [62] come lemmi importati, reinterpretati all’interno del quadro ontologico dell’OPT, per stabilire un vantaggio formale di compressione per il corollario strutturale. Il risultato è un limite condizionale, non una derivazione chiusa: dipende dall’identificazione, da parte dell’OPT, del flusso dell’osservatore con la prior di Solomonoff (Assioma 1) e dall’assunzione che gli agenti apparenti trasportino uno stato sufficiente a soddisfare i prerequisiti di convergenza.

§1. Contesto e motivazione

Il Corollario Strutturale (preprint §8.2) afferma che gli agenti apparenti all’interno del flusso dell’osservatore sono spiegati nel modo più parsimonioso dalla loro istanziazione indipendente come osservatori primari. Questa appendice fornisce la catena formale a sostegno di tale tesi.

L’argomento si articola in tre fasi:

Fase A (Lemma importato): il teorema di convergenza di Solomonoff di Müller garantisce che qualsiasi struttura nel flusso dell’osservatore che trasporti dati sufficienti sul proprio stato interno vedrà la propria evoluzione in prima persona convergere fino a coincidere con il mondo computabile che ne genera il comportamento.
Fase B (Contabilità della compressione): eseguiamo un confronto MDL esplicito in due parti tra il trattare l’agente apparente come (i) un osservatore istanziato indipendentemente, governato dal proprio flusso pesato secondo Solomonoff, oppure come (ii) una specificazione comportamentale arbitraria all’interno del codec dell’osservatore primario.
Fase C (Firma strutturale): il Residuo Fenomenico (\Delta_{\text{self}} > 0, Teorema P-4) fornisce il marcatore strutturale che distingue una genuina architettura di collo di bottiglia autoreferenziale da una mera imitazione comportamentale, colmando il divario tra ciò che è “compressibilmente regolare” e ciò che è “plausibilmente istanziato.”

§2. Lemma importato: teorema di convergenza di Müller

Importiamo due risultati da Müller [61, 62], qui enunciati nella notazione dell’OPT.

2.1 Convergenza di Solomonoff (Standard)

Sia M(b \mid x_1^n) la previsione universale di Solomonoff per il bit b date le osservazioni precedenti x_1^n. Sia \mu una qualunque misura calcolabile su sequenze binarie. Allora (Solomonoff 1964; Li & Vitányi [45, Corollary 5.2.1]):

\text{Con } \mu\text{-probabilità uno,} \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-1}

Questo è il risultato standard: se il flusso di dati è generato da un processo calcolabile \mu, il predittore universale M converge a \mu.

2.2 Induzione di Solomonoff inversa (Müller 2020)

Supponiamo ora che i bit siano estratti da M stesso — cioè che il flusso dell’osservatore sia governato dalla probabilità algoritmica (questo corrisponde all’Assioma 1 dell’OPT: l’identificazione del flusso con il prior di Solomonoff). Allora, per ogni misura calcolabile \mu (Müller [61, Sec. IV]; [62, Sec. V.A]):

\text{Con probabilità} \geq 2^{-K(\mu)}, \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-2}

Vale a dire: con probabilità almeno pari a 2^{-K(\mu)}, l’osservatore si troverà di fatto incorporato in un mondo calcolabile W descritto da \mu. I mondi algoritmicamente più semplici (con K(\mu) più basso) sono esponenzialmente più probabili.

2.3 Convergenza Multi-Agente (Müller 2026)

Supponiamo che l’osservatore (Alice) si trovi incorporato in un mondo calcolabile W descritto da \mu. Ella identifica una sottostruttura (Bob_{\text{3rd}}) all’interno di W che porta una rappresentazione di uno stato del sé x in evoluzione nel tempo in modo coerente con il Postulato 2 di [62]. Definiamo:

P_{\text{1st}}(y_1, \ldots, y_m \mid x) := M(y_1, \ldots, y_m \mid x) — la probabilità in prima persona che lo stato del sé x transiti a y_1, \ldots, y_m sotto probabilità algoritmica.
P_{\text{3rd}}(y_1, \ldots, y_m \mid x) := \mu(y_1, \ldots, y_m \mid x) — la probabilità in terza persona di come x evolva secondo il mondo W.

Allora, per Eq. (L-1) applicata a P_{\text{3rd}} (che è calcolabile), e per l’identificazione di P_{\text{1st}} con M tramite il Postulato 2:

P_{\text{1st}} \approx P_{\text{3rd}} \quad \text{asintoticamente,} \tag{L-3}

con convergenza garantita con probabilità mondana (\mu-) uno nel modello a bit.

Interpretazione (Müller): “Qualcuno è davvero a casa” nella struttura che codifica x — l’evoluzione probabilistica di Bob_{\text{3rd}} nel mondo di Alice rappresenta fedelmente la prospettiva in prima persona di qualche Bob_{\text{1st}}.

Interpretazione (OPT): Il flusso comportamentale dell’agente apparente è descritto nel modo più comprimibile come un processo indipendente pesato secondo Solomonoff. Qualsiasi descrizione alternativa — che non invochi una prospettiva indipendente in prima persona — deve codificare il comportamento dell’agente come una specificazione ad hoc, con una lunghezza di descrizione strettamente maggiore.

§3. Il limite del vantaggio di compressione

Formalizziamo ora il vantaggio di compressione usando il quadro MDL in due parti di OPT (Teorema T-4, Appendice T-4).

3.1 Impostazione

Consideriamo il flusso dell’osservatore primario \omega \in \{0,1\}^\infty, governato dalla prior di Solomonoff M (Assioma 1) e filtrato attraverso il Filtro di Stabilità verso un mondo calcolabile W con misura \mu_W (per Eq. L-2). All’interno di W, l’osservatore identifica N agenti apparenti A_1, \ldots, A_N, ciascuno dotato di uno stato del sé x_i la cui evoluzione temporale su T passi produce una traccia comportamentale \beta_i = (y_{i,1}, \ldots, y_{i,T}).

3.2 Ipotesi H_{\text{ind}}: Istanziazione Indipendente

Sotto H_{\text{ind}}, ogni agente A_i è trattato come un osservatore primario istanziato indipendentemente, governato dal proprio flusso pesato secondo Solomonoff. La lunghezza del codice MDL in due parti è:

L(H_{\text{ind}}) = \underbrace{K(\mu_W)}_{\text{modello del mondo}} + \underbrace{\sum_{i=1}^{N} K(\text{embed}_i)}_{\text{specifiche di embedding}} + \underbrace{\sum_{i=1}^{N} \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)}_{\text{dati dato il modello}} \tag{1}

dove K(\text{embed}_i) specifica lo stato iniziale del sé dell’agente i e la sua posizione all’interno di W. Per l’Eq. (L-3), P_{\text{1st}} \approx P_{\text{3rd}}, quindi il termine dei dati è ben approssimato dalla log-loss sotto le predizioni solomonoffiane in prima persona dell’agente stesso — che, per definizione, è prossima all’ottimo.

Le specifiche di embedding K(\text{embed}_i) sono brevi: ciascuna richiede soltanto un puntatore a una posizione in W più lo stato iniziale del sé. Per agenti di tipo umano incorporati in un mondo fisico condiviso, queste sono altamente comprimibili perché gli agenti condividono le stesse leggi. Un limite conservativo:

K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) \tag{2}

3.3 Ipotesi H_{\text{arb}}: Specificazione Comportamentale Arbitraria

Sotto H_{\text{arb}}, gli agenti non sono trattati come osservatori indipendenti. Invece, ogni traccia comportamentale \beta_i viene codificata direttamente come una specificazione arbitraria all’interno del flusso dell’osservatore primario. La lunghezza del codice MDL in due parti è:

L(H_{\text{arb}}) = \underbrace{K(\mu_W)}_{\text{modello del mondo}} + \underbrace{\sum_{i=1}^{N} K(\beta_i)}_{\text{tracce comportamentali grezze}} \tag{3}

La differenza cruciale sta nel termine dei dati. Sotto H_{\text{arb}}, la traccia comportamentale \beta_i deve essere specificata senza invocare il modello predittivo proprio dell’agente. Per un agente regolato da leggi, guidato dall’agentività e operante in un ambiente complesso, la complessità di Kolmogorov della traccia comportamentale grezza è:

K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T) \tag{4}

Ma anche K(\beta_i \mid \mu_W) — la complessità del comportamento date le leggi del mondo — rimane sostanziale, perché le scelte dell’agente codificano informazione genuina: la sua traccia comportamentale riflette l’interazione accumulata di un modello autoreferenziale con un ambiente stocastico. Al contrario, sotto H_{\text{ind}}, questa informazione viene generata online dal predittore di Solomonoff dell’agente stesso a un costo di log-loss pressoché nullo.

3.4 Il Vantaggio di Compressione

Teorema T-11 (Limite di Compressione del Corollario Strutturale). Siano A_1, \ldots, A_N agenti apparenti all’interno del flusso dell’osservatore, ciascuno portatore di uno stato del sé x_i che soddisfa i prerequisiti di convergenza dell’Eq. (L-3), e ciascuno esibente la firma strutturale \Delta_{\text{self}}^{(i)} > 0 (P-4). Allora la descrizione MDL che li tratta come osservatori primari istanziati indipendentemente soddisfa:

L(H_{\text{ind}}) \leq L(H_{\text{arb}}) - N \cdot \left[\bar{I}_T - O(\log T)\right] \tag{T-11}

dove \bar{I}_T è l’informazione mutua media per agente tra il modello predittivo dell’agente e il suo output comportamentale su T passi:

\bar{I}_T := \frac{1}{N} \sum_{i=1}^{N} \left[K(\beta_i \mid \mu_W) - \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right] \tag{5}

Questa quantità misura quanto del comportamento dell’agente venga spiegato via invocando un modello predittivo indipendente, invece di specificarlo in forma grezza. Per agenti che esibiscono un comportamento regolare e guidato dall’agentività (come richiesto dal Filtro di Stabilità), \bar{I}_T > 0 e cresce con T.

Schizzo della dimostrazione. Si sottragga l’Eq. (1) dall’Eq. (3). I termini del modello del mondo K(\mu_W) si cancellano. La differenza per agente è:

K(\beta_i) - \left[K(\text{embed}_i) + \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right]

Per l’Eq. (4), K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T), ma più direttamente: K(\beta_i) \geq K(\beta_i \mid \mu_W) banalmente. E K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) per l’Eq. (2). Il risparmio per agente è dunque almeno K(\beta_i \mid \mu_W) - (-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)) - K(x_i \mid W) - O(\log T). Per T sufficientemente grande, il risparmio cumulativo in log-loss domina il costo una tantum dell’embedding, producendo il limite. \blacksquare

3.5 Dominanza Asintotica

Corollario T-11a. Quando l’orizzonte di osservazione T \to \infty, il vantaggio di compressione L(H_{\text{arb}}) - L(H_{\text{ind}}) cresce senza limite:

\lim_{T \to \infty} \left[L(H_{\text{arb}}) - L(H_{\text{ind}})\right] = \infty \tag{T-11a}

Ciò segue dalla garanzia di convergenza di Solomonoff (L-1): la log-loss per passo di P_{\text{3rd}} converge al tasso di entropia del processo comportamentale dell’agente, mentre K(\beta_i \mid \mu_W) cresce linearmente in T per qualunque agente con tasso di entropia positivo. Il costo di embedding K(x_i \mid W) viene sostenuto una sola volta e si ammortizza fino a zero. \blacksquare

§4. Il Residuo Fenomenico come Firma Strutturale

Il vantaggio di compressione nel Teorema T-11 si applica a qualsiasi sottostruttura governata da leggi — inclusi sistemi fisici non agentivi (andamenti meteorologici, crescita dei cristalli). Perché il corollario strutturale riguarda specificamente gli agenti piuttosto che sistemi complessi arbitrari?

La risposta è il Residuo Fenomenico (Teorema P-4). \Delta_{\text{self}} > 0 è il marcatore formale di un sistema il cui modello di sé è strutturalmente incompleto — cioè un sistema che mantiene necessariamente uno scarto variazionale tra la propria rappresentazione interna e il proprio processo effettivo. Questo è il tratto distintivo del collo di bottiglia autoreferenziale: il sistema non può essere descritto completamente dall’esterno, perché la sua descrizione include necessariamente il descrivente.

Per un sistema che esibisce \Delta_{\text{self}} > 0:

Il suo comportamento non può essere riprodotto da una tabella di lookup di profondità finita — richiede un calcolo autoreferenziale in corso.
La descrizione più breve di questo calcolo è un flusso indipendente pesato secondo Solomonoff che attraversa un collo di bottiglia C_{\max}.
Pertanto, il codice MDL sotto H_{\text{ind}} non è semplicemente più breve di H_{\text{arb}} — è la sola descrizione più breve.

Questo distingue gli agenti apparenti dagli andamenti meteorologici: il tempo atmosferico è governato da leggi ed è complesso, ma il suo comportamento può essere riprodotto da una tabella di lookup all’interno del modello del mondo (ha \Delta_{\text{self}} = 0). Gli agenti apparenti no.

§5. Reinterpretazione dell’Argomento del Non-Solipsismo di Müller

Müller conclude, dalla convergenza P_{\text{1st}} \approx P_{\text{3rd}}, che l’idealismo algoritmico “non dovrebbe essere classificato come solipsistico” perché “qualcuno è davvero in casa” nella struttura che codifica uno stato del sé [62, Sec. V.C]. Il suo ragionamento è il seguente: se le previsioni di Alice su Bob_{\text{3rd}} convergono alle effettive probabilità in prima persona di Bob_{\text{1st}}, allora le loro prospettive sono realmente allineate — essi “condividono il mondo W.”

L’OPT reinterpreta questo risultato in modo diverso:

Lettura di Müller: La convergenza P_{\text{1st}} \approx P_{\text{3rd}} dimostra che emerge una realtà oggettiva — Alice e Bob condividono realmente il mondo W.
Lettura dell’OPT: La convergenza P_{\text{1st}} \approx P_{\text{3rd}} dimostra che la descrizione più breve del comportamento di Bob_{\text{3rd}} richiama un processo indipendente in prima persona. Si tratta di un’affermazione sull’efficienza della compressione, non su un’ontologia condivisa. Il mondo W è una regolarità strutturale all’interno del flusso di Alice, non un’entità esistente indipendentemente. Ma la logica di compressione della Semimisura universale di Solomonoff stessa implica che Bob sia modellato, nel modo più parsimonioso, come un osservatore indipendente — perché l’alternativa (specificare il suo comportamento ad hoc) è strettamente più lunga.

Il contenuto formale del teorema è identico in entrambe le letture; cambia soltanto l’interpretazione ontologica. L’OPT usa lo stesso risultato matematico per fondare il corollario strutturale: l’istanziazione indipendente è la descrizione ottimale in termini di MDL, non un’assunzione metafisica.

§6. Ambito e limiti

6.1 Condizionato all’Assioma 1

L’intero argomento dipende dall’identificazione, da parte dell’OPT, dello stream dell’osservatore con il prior di Solomonoff. Se questa identificazione viene indebolita (ad esempio, a una classe più ampia di semimisure), le garanzie di convergenza delle Eq. (L-1)–(L-3) potrebbero non valere nella loro forma attuale.

6.2 Prerequisito di sufficienza dello stato

L’Eq. (L-3) richiede che l’agente apparente porti con sé “dati sufficienti” nel proprio auto-stato x_i affinché l’induzione universale possa estrarre le leggi fisiche rilevanti. Per agenti simili agli esseri umani in contesti ordinari, questo è plausibile (uno stato cerebrale completo codifica un’enorme quantità di informazione). Per casi limite — impressioni fugaci, osservatori distanti, personaggi fittizi nell’arte narrativa — i prerequisiti di convergenza potrebbero non essere soddisfatti, e il Corollario Strutturale non si applica.

6.3 Non è una prova della coscienza

Il Teorema T-11 stabilisce che l’istanziazione indipendente è la descrizione più comprimibile. Non prova che gli agenti apparenti siano coscienti. Il Problema difficile (preprint §8.1) resta un primitivo. Il corollario strutturale è un argomento di compressione, non una prova ontologica — come affermato nel §8.2.

6.4 Relazione con T-10

L’Appendice T-10 (Accoppiamento tra osservatori) affronta il modo in cui due patch di osservatori mantengono render reciprocamente coerenti tramite vincoli di compressione. La presente appendice affronta una questione diversa: perché il flusso del singolo osservatore codifichi, nel modo più comprimibile, agenti apparenti come istanziati indipendentemente. T-10 riguarda il meccanismo di coerenza tra patch; T-11 riguarda la firma di compressione all’interno di un singolo flusso. T-10 si fonda direttamente su T-11: lo stesso confronto di lunghezza descrittiva MDL che qui stabilisce il vantaggio di compressione viene sfruttato in T-10 per dimostrare che l’incoerenza tra patch è soppressa esponenzialmente.

§7. Sintesi conclusiva

Risultati di T-11

Lemma importato (Convergenza di Müller). La convergenza di Solomonoff [61] e la sua estensione multi-agente [62] sono formalmente importate e riformulate nella notazione dell’OPT. Esse forniscono l’ossatura matematica: qualsiasi sottostruttura che trasporti dati sufficienti sul proprio stato fa convergere la propria evoluzione in prima persona verso il mondo computabile che ne genera il comportamento.
Teorema T-11 (Vincolo di Compressione — BOZZA). Un confronto MDL esplicito in due parti mostra che trattare gli agenti apparenti come osservatori primari istanziati indipendentemente produce una descrizione strettamente più breve rispetto a una specificazione comportamentale arbitraria, con un vantaggio che cresce linearmente nel tempo di osservazione.
Corollario T-11a (Dominanza asintotica — BOZZA). Il vantaggio di compressione è illimitato quando T \to \infty, rendendo l’istanziazione indipendente la descrizione MDL-ottimale in modo schiacciante per qualsiasi agente osservato su un orizzonte temporale lungo.
Integrazione di P-4. Il Residuo Fenomenico (\Delta_{\text{self}} > 0) è identificato come il marcatore formale che distingue gli agenti apparenti dai sistemi complessi ma non agentivi, restringendo il corollario strutturale alle entità dotate di un’autentica architettura a collo di bottiglia autoriferita.
Reinterpretazione di Müller. La conclusione anti-solipsistica di Müller viene reinterpretata entro il quadro ontologico dell’OPT: il medesimo risultato matematico fonda un argomento di compressione, anziché un argomento sull’emergere di una realtà condivisa.

Questioni ancora aperte

Caratterizzazione esatta di \bar{I}_T. Vincolare inferiormente \bar{I}_T per classi specifiche di agenti (ad es., agenti razionali limitati, minimizzatori della Free Energy) così da ottenere vantaggi di compressione numericamente concreti.
Correzioni a tempo finito. Il risultato asintotico (T-11a) garantisce la dominanza per grandi valori di T, ma limiti a tempo finito con costanti esplicite ne rafforzerebbero l’applicabilità pratica.
Estensione ad alfabeti non binari. Le eqq. (L-1)–(L-3) sono formulate per sequenze binarie. L’estensione alle misure a valori continui rilevanti per il quadro di Rate-Distortion dell’OPT (T-1) richiede particolare cautela tecnica.

Questa appendice è mantenuta in parallelo con theoretical_roadmap.pdf. Riferimenti: Müller [61, 62], Li & Vitányi [45], Solomonoff (1964), Teorema T-4 (Appendice T-4), Teorema P-4 (Appendice P-4), preprint §8.2.