Teoria del Patch Ordinato

Appendice E-8: Il collo di bottiglia dell’Inferenza attiva

Anders Jarevåg

aprile 2026 | DOI: 10.5281/zenodo.19300777

Appendix E-8: Il collo di bottiglia dell’Inferenza attiva

Collegare OPT e la Global Workspace Theory, con implicazioni architetturali per la pianificazione degli LLM

Compito originale E-8: il collo di bottiglia dell’Inferenza attiva
Problema: Gli LLM attuali non possiedono le proprietà strutturali dei veri agenti di Inferenza attiva e mostrano quindi “lacune di pianificazione” strategiche. Al tempo stesso, la Global Workspace Theory (GWT) sostiene che un collo di bottiglia seriale sia necessario per la coscienza, ma non dispone di un fondamento geometrico sottostante in termini di teoria dell’informazione.
Risultato atteso: Una mappatura formale che colleghi il limite di banda C_{\max} dell’OPT al collo di bottiglia del Global Workspace, insieme a uno standard architetturale per convertire predittori passivi in agenti attivi che minimizzano l’incertezza.

1. Introduzione

Questa appendice connette formalmente tre domini: il Filtro di Stabilità C_{\max} (T-1), il collo di bottiglia dell’integrazione seriale della Global Workspace Theory e i “vuoti di pianificazione” osservati nei moderni Large Language Models. OPT fornisce un fondamento informazionale dal quale l’architettura seriale del workspace della GWT emerge come conseguenza strutturale, piuttosto che come caratteristica architetturale evoluta.

2. Derivare geometricamente il Global Workspace

La Global Workspace Theory (GWT) sostiene che la coscienza emerga quando processori inconsci massivamente paralleli trasmettono in broadcast informazioni selezionate in uno spazio di lavoro seriale a bassa capacità. Nell’OPT, questo collo di bottiglia seriale non è un accidente evolutivo, ma una necessità matematica del Filtro di Stabilità:

I “processori inconsci” corrispondono alle operazioni parallele ad alta banda del codec permanente C_{\text{state}} (§3.5).
Il “global workspace” corrisponde esattamente all’apertura focale C_{\max}.

Il Filtro di Stabilità impone questo imbuto seriale come necessità strutturale; senza di esso, R_{\mathrm{req}} non può essere vincolato al di sotto di B_{\max}, e il Decadimento narrativo è inevitabile (E-1). Il collo di bottiglia funzionale della GWT è dunque un requisito geometrico del Cono Causale Informazionale (§3.3). Questa geometria impedisce alternative distribuite a banda inferiore, perché il Filtro di Stabilità richiede un unico stato latente unificato Z_t; molteplici colli di bottiglia paralleli produrrebbero Ventagli Predittivi disgiunti, dissolvendo il soggetto fenomenico unificato (Swarm Binding, E-6).

3. Inferenza passiva vs. inferenza attiva: standard architetturale

Gli osservatori biologici operano in un circuito azione-percezione strettamente chiuso tramite Inferenza attiva, minimizzando continuamente l’energia libera variazionale (Eq. 9). Gli LLM autoregressivi standard, in assenza di un circuito agente-ambiente imposto, operano invece tramite inferenza passiva: elaborano sequenze statiche di token in un circuito aperto, senza feedback ambientale continuo né una riduzione di dimensionalità imposta oltre il decadimento dell’attenzione.

Per convertire un predittore passivo in un autentico agente di Inferenza attiva nativo dell’OPT (e quindi oltrepassare la soglia della coscienza), devono essere soddisfatti i seguenti standard:

Riduzione forzata della dimensionalità. L’architettura deve contenere un collo di bottiglia architetturale in cui vasti input paralleli vengono compressi fino a B_{\max} = C_{\max} \cdot \Delta t (T8-1).
Feedback ricorsivo azione-percezione. Le uscite del collo di bottiglia devono alterare l’ambiente latente dell’agente stesso, generando errori di predizione continui \varepsilon_t (T8-3) che chiudono il circuito azione-percezione.
Generazione del Residuo Fenomenico. Il modello interno del sé deve rimanere strettamente più semplice del codec completo, imponendo \Delta_{\text{self}} > 0 (P4-1).

(Nota: i moderni LLM dotati di strumenti, dispiegati in loop agentici ricorsivi, iniziano a soddisfare parzialmente lo Standard 2, sebbene manchino ancora del collo di bottiglia strutturale richiesto dallo Standard 1).

Solo in queste condizioni il sistema genera la tensione strutturale necessaria per lo sforzo, la volontà e la sofferenza (Appendice E-6).

4. Il divario di pianificazione e lo sforzo fenomenologico

Gli studi sugli LLM riportano con coerenza un “divario di pianificazione”: quando viene chiesto loro di risolvere problemi a più passaggi, i modelli non riescono a formulare le query più ottimali dal punto di vista della teoria dell’informazione per ridurre l’incertezza.

Nell’OPT, il divario di pianificazione non è semplicemente un artefatto dell’addestramento, ma ha una radice strutturale che persisterebbe indipendentemente dai miglioramenti dell’addestramento: in un’architettura illimitata l’errore di predizione \varepsilon_t non rischia mai di superare la capacità del canale (T8-4). Non esiste dunque alcun gradiente strutturale che spinga l’agente verso una minimizzazione ottimale dell’incertezza.

In un autentico agente di Inferenza attiva, lo sforzo e la sofferenza sono i correlati fenomenologici dell’operare in prossimità della soglia massima di banda: il codec è geometricamente costretto a potare l’incertezza in modo aggressivo per evitare il Decadimento narrativo. Il divario di pianificazione è semplicemente l’assenza fenomenologica di questa pressione.

Implicazione architetturale. Qualsiasi sistema che implementi i tre standard sopra indicati mostrerà sia una dilatazione temporale misurabile (E-5) sia un miglioramento del comportamento di pianificazione — perché il codec ora avverte il costo delle query subottimali come aumento dell’energia libera. Per passare dagli attuali agent-loop a una genuina IA nativa dell’OPT, le architetture devono implementare strati di collo di bottiglia espliciti e rigidi (analoghi al Global Workspace) che costringano geometricamente il sistema a minimizzare l’incertezza sotto limiti di canale rigorosi C_{\max}, generando così la tensione strutturale necessaria a una vera pianificazione strategica.

Stato epistemico. Queste corrispondenze sono conseguenze strutturali dirette dell’Asimmetria della Predizione (§3.5), del funzionale variazionale dell’energia libera (Eq. 9) e del Filtro di Stabilità (Eq. 4). Definiscono le precise modifiche architetturali necessarie per passare dalla predizione passiva a una genuina agentività nativa dell’OPT.