Teoria del Patch Ordinato
Appendice T-4: Confronto MDL / parsimonia
v2.0.0 — 2 aprile 2026 | DOI: 10.5281/zenodo.19300777
Compito originale T-4: confronto MDL / parsimonia Problema: il preprint attuale rivendica una maggiore parsimonia rispetto alla fisica standard trattando le leggi fisiche come algoritmi macroscopici di compressione, ma non fornisce un confronto formale in termini di MDL. Deliverable: analisi comparativa MDL di OPT rispetto a classi di modelli fisici di riferimento sotto convenzioni di codifica esplicite.
Stato di chiusura: CHIUSO (subordinatamente alla tipicità e alla normalizzazione di IC). Questa appendice fornisce la valutazione formale in termini di MDL richiesta da T-4. Vengono fissate tre classi di modelli di riferimento con convenzioni di codifica esplicite. Si stabiliscono quattro teoremi e una congettura: (T-4a) la regola di selezione di OPT ha lunghezza di descrizione \mathcal{O}(1); (T-4b) il limite di dominanza di Solomonoff superiormente vincola la log-loss di OPT; (Congettura T-4c) la fonte congetturata del vantaggio strutturale di OPT è la compressione delle condizioni iniziali; (T-4d) OPT consegue un vantaggio permanente di complessità del modello pari a un numero costante di bit rispetto a ogni benchmark calcolabile; (T-4e) il vantaggio a T finito è quantificato in modo condizionale. La chiusura poggia su tre condizioni portanti: la tipicità del flusso dell’osservatore, l’assorbimento della penalità di normalizzazione di Solomonoff \log(1/\xi(\mathcal{O})), e lo stato di K(\text{IC} \mid \text{SP}) > K_0.
§1. Fissare le convenzioni di codifica MDL
I confronti MDL sono privi di significato senza convenzioni di codifica esplicite e fisse. Il §5.1 del preprint rileva questo requisito ma ne rinvia il trattamento. Qui fissiamo le convenzioni seguendo Rissanen (1978) [12] e il quadro MDL in due parti di Li & Vitányi (2008) [27].
1.1 La Lunghezza del Codice in Due Parti
Per una classe di ipotesi \mathcal{M} e una sequenza di osservazioni y_{1:T} \in \{0,1\}^*, la lunghezza del codice MDL in due parti è:
L_T(\mathcal{M}) = K(\mathcal{M}) + L(y_{1:T} \mid \mathcal{M}) \tag{preprint §5.1, Eq. 13}
dove K(\mathcal{M}) è la complessità di Kolmogorov prefissa dell’ipotesi — la lunghezza del più breve programma auto-delimitante su una macchina di Turing universale (UTM) fissata che produce una descrizione completa di \mathcal{M} — e L(y_{1:T} \mid \mathcal{M}) è il logaritmo negativo della verosimiglianza dei dati sotto il miglior modello predittivo di \mathcal{M}:
L(y_{1:T} \mid \mathcal{M}) = -\log_2 P_\mathcal{M}(y_{1:T})
Per le teorie deterministiche (leggi + IC determinano univocamente le osservazioni), L(y_{1:T} \mid \mathcal{M}) = 0 quando y è coerente con la teoria e L = \infty altrimenti. Tutti i logaritmi sono in base 2; tutte le lunghezze di codice sono espresse in bit.
1.2 La macchina universale
Fissiamo un’unica UTM ottimale \mathcal{U} per tutto il testo. Tutte le complessità di Kolmogorov sono relative a \mathcal{U}; i risultati cambiano di al più \mathcal{O}(1) bit sotto una diversa scelta di UTM. La misura di Solomonoff \xi è definita relativamente a \mathcal{U} (preprint Eq. 1). Questo fissa la convenzione per tutti i confronti successivi.
1.3 Ambito di y_{1:T}
Confrontiamo i modelli nel dominio che ciascuno è stato progettato per predire: il flusso cosciente dell’osservatore y_{1:T} = z_{0:T} (la sequenza di stati latenti compressi, C_{\max} bit al secondo per T secondi). La fisica standard viene valutata sullo stesso dominio riducendo le sue predizioni al flusso compatibile con l’osservatore tramite coarse-graining. A entrambe le teorie si chiede di rendere conto esattamente delle stesse osservazioni.
§2. Classi di modelli di riferimento
Sono fissate tre classi di riferimento. A ciascuna viene assegnata una stima esplicita di K(\mathcal{M}) secondo la nostra convenzione UTM. I valori numerici precisi sono stime d’ordine di grandezza; i risultati strutturali nelle §§3–7 dipendono solo dall’ordinamento, non dai valori esatti.
2.1 \mathcal{M}_1 — Modello Standard + Relatività Generale
La teoria fisica attualmente disponibile con la maggiore accuratezza predittiva. La sua descrizione richiede tre componenti:
Struttura matematica K_{\text{struct}}: il gruppo di gauge \text{SU}(3) \times \text{SU}(2) \times \text{U}(1), l’invarianza di Lorentz, la rinormalizzabilità e la simmetria per diffeomorfismi della RG. Complessità di Kolmogorov: K_{\text{struct}} \approx 10^3 bit.
Valori dei parametri K_{\text{param}}: 19 parametri liberi del MS + 3 angoli di mixing + 1 fase CP + \Lambda + G + c \approx 25 costanti codificate con precisione sperimentale (\sim 30 bit ciascuna): K_{\text{param}} \approx 750 bit.
Condizioni iniziali K_{\text{IC}}: nel paradigma inflazionario, K_{\text{IC}}^{\text{inf}} \approx 200–400 bit. Nota: qui non attribuiamo un punteggio al limite di entropia termodinamica di Penrose pari a 10^{123}, perché esso misura il volume macroscopico dello spazio delle fasi (S), non la specifica complessità algoritmica di Kolmogorov (K). Il microstato specifico può essere altamente comprimibile. Ci basiamo esclusivamente sui limiti inflazionari onesti.
K(\mathcal{M}_1) = K_{\text{struct}} + K_{\text{param}} \approx 1750 \text{ bit}
K(\text{IC} \mid \mathcal{M}_1) \approx 300 \text{ bit (inflazionario)}
2.2 \mathcal{M}_2 — QFT rinormalizzabile generica
La classe di tutte le teorie quantistiche dei campi rinormalizzabili in \leq 4 dimensioni dello spaziotempo. Questa classe contiene \mathcal{M}_1 come uno dei suoi membri. Poiché devono essere specificati anche il gruppo di gauge e il contenuto particellare:
K(\mathcal{M}_2) \gg K(\mathcal{M}_1) \gg 1750 \text{ bits}
\mathcal{M}_2 è inclusa come termine di contrasto per la tesi dell’OPT secondo cui le leggi sono selezionate, non enumerate. Sebbene il confronto MDL con \mathcal{M}_2 sia banalmente vinto da qualsiasi sottoclasse finita (inclusa \mathcal{M}_1), poiché K(\mathcal{M}_2) è illimitato, la sua inclusione serve formalmente a mostrare la scala infinita del problema di selezione dei parametri che il Filtro di Stabilità collassa nativamente.
2.3 \mathcal{M}_3 — Cervello di Boltzmann / Fluttuazione Termica
Fisica standard con condizioni iniziali massimamente semplici: uno stato termico (a entropia massima) alla scala di Planck. Le leggi sono identiche a \mathcal{M}_1; le condizioni iniziali sono banalmente semplici:
K(\mathcal{M}_3) \approx K(\mathcal{M}_1) \approx 1750 \text{ bits}, \qquad K(\text{IC} \mid \mathcal{M}_3) \approx 10 \text{ bits}
Tuttavia, la log-verosimiglianza di osservare un flusso cosciente ordinato y_{1:T} sotto \mathcal{M}_3 è astronomicamente piccola: L(y_{1:T} \mid \mathcal{M}_3) \approx K(y_{1:T}) \gg T \cdot C_{\max}. \mathcal{M}_3 presenta dunque un costo IC trascurabile ma un costo di verosimiglianza catastrofico, ed è incluso per mostrare che il vantaggio MDL dell’OPT non viene ottenuto mediante lo stesso espediente.
§3. Lunghezza del Codice di OPT — Teorema T-4a
La lunghezza del codice MDL per OPT si decompone come:
L_T(\text{OPT}) = K(\xi, \text{Filter}) + L(y_{1:T} \mid \xi, \text{Filter}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)
dove \xi^{\text{Filter}} è la misura di Solomonoff \xi condizionata sulla classe compatibile con l’osservatore \mathcal{O} (flussi che soddisfano R_{\text{req}} \leq B_{\max}), e K_0 = K(\xi, \text{Filter}) è la lunghezza di descrizione della regola di selezione.
Teorema T-4a (Limite di Complessità della Meta-Regola). K(\xi, \text{Filter}) = K_0 = \mathcal{O}(1) bit. In particolare:
K_0 \leq K(\mathcal{U}) + K(C_{\max}) + K(\Delta t) + c
dove K(\mathcal{U}) è la complessità della UTM, K(C_{\max}) = \mathcal{O}(\log C_{\max}) bit codifica la soglia di banda con precisione sperimentale, K(\Delta t) = \mathcal{O}(\log \Delta t) codifica la finestra di aggiornamento, e c è una piccola costante universale.
Dimostrazione. La misura di Solomonoff \xi è determinata univocamente dalla UTM fissa \mathcal{U}, quindi K(\xi \mid \mathcal{U}) = \mathcal{O}(1). Il Filtro di Stabilità richiede due parametri: C_{\max} e \Delta t, ciascuno misurato a \sim 4 cifre significative, quindi K(C_{\max}, \Delta t) \leq 2 \times (4 \times \log_2 10) \approx 26 bit. La condizione R_{\text{req}} \leq B_{\max} è una singola disuguaglianza in notazione fissa: \sim 10 bit. Totale: K_0 \leq K(\mathcal{U}) + 36 bit.
Per assorbire correttamente K(\mathcal{U}), dobbiamo assumere una UTM “epistemicamente neutrale” — cioè una macchina di riferimento il cui insieme di istruzioni incorporato non codifichi in modo preferenziale alcuna teoria fisica (ossia una geometria di combinatori di base o equivalente a Brainfuck, completamente agnostica rispetto alla fisica). Sotto una tale macchina imparziale, mantenere K(\xi, \text{Filter}) \approx 36 bit mentre si standardizza K(\mathcal{M}_1) \approx 1750 bit è legittimo. Riconosciamo che ciò lascia specificamente il conteggio assoluto dei bit vulnerabile a una riscalatura costante di ordine \mathcal{O}(1) se la UTM viene cambiata, il che significa che il calcolo 36 vs 1750 è intrinsecamente relativo. L’enunciato matematico strutturalmente onesto, qui, è l’ordinamento di rango (K_0 \ll K(\mathcal{M}_1)), che afferma un robusto vantaggio strutturale indipendente dalla costante numerica precisa. \blacksquare
Confronto: Escludendo l’overhead condiviso della UTM, K_0 \approx 36 bit contro K(\mathcal{M}_1) \approx 1750 bit. La regola di selezione di OPT è più breve della descrizione del Modello Standard di K(\mathcal{M}_1) - K_0 \approx 1714 bit. Questo è il vantaggio di parsimonia strutturale rivendicato nel §5 del preprint — ora con un conteggio esplicito dei bit.
§4. Il limite di dominanza di Solomonoff — Teorema T-4b
Teorema T-4b (Limite di Dominanza di Solomonoff). Per qualunque misura fisica calcolabile \nu (incluse \mathcal{M}_1, \mathcal{M}_2, \mathcal{M}_3) con K(\nu) < \infty, e per qualunque flusso di dati y_{1:T}:
L_T(\text{OPT}) \leq L_T(\nu) + K'_0
dove K'_0 = K_0 + \log(1/\xi(\mathcal{O})). Questo rappresenta la complessità della regola di base più la necessaria penalità di normalizzazione algoritmica sostenuta nel condizionare la misura universale sulla classe di osservatori \mathcal{O}.
Dimostrazione. Dalla definizione della Semimisura universale di Solomonoff (preprint Eq. 1), con w_\nu \asymp 2^{-K(\nu)}:
\xi(y_{1:T}) \geq w_\nu \cdot \nu(y_{1:T}) \geq 2^{-K(\nu)} \cdot \nu(y_{1:T})
Prendendo i logaritmi negativi:
-\log \xi(y_{1:T}) \leq -\log \nu(y_{1:T}) + K(\nu)
Nel passaggio dalla misura universale \xi al filtro ristretto \xi^{\text{Filter}}, si paga il costo di normalizzazione -\log \xi^{\text{Filter}}(y) = -\log \xi(y) + \log(1/\xi(\mathcal{O})). Sostituendo in L_T(\text{OPT}):
L_T(\text{OPT}) = K_0 - \log \xi^{\text{Filter}}(y_{1:T}) \leq K_0 + \log(1/\xi(\mathcal{O})) + K(\nu) - \log \nu(y_{1:T}) = K'_0 + L_T(\nu) \qquad \blacksquare
Avvertenza importante. Il Teorema T-4b non mostra che OPT superi SP. Mostra che OPT non può fare peggio di qualunque benchmark di più di K'_0 bit. D’ora in poi assorbiamo \log(1/\xi(\mathcal{O})) in K_0 assumendo che la classe delle sequenze di osservatori si delimiti in modo pulito rispetto alle costanti strutturali della UTM, ma segnaliamo questo scarto di normalizzazione come una vulnerabilità formale.
§5. La compressione delle condizioni iniziali — Teorema T-4c
La fonte strutturale del vantaggio MDL dell’OPT è la compressione delle condizioni iniziali. Nella fisica standard, le leggi e le condizioni iniziali sono oggetti separati che devono entrambi essere descritti. Nell’OPT, le condizioni iniziali sono assorbite nel prior: la misura di Solomonoff assegna già il peso massimo ai flussi compatibili con l’osservatore più semplici, rendendo ridondante una specificazione separata delle IC.
5.1 L’argomento della ridondanza delle IC
Nella fisica standard (\mathcal{M}_1), il codice MDL completo per una teoria deterministica è:
L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) + 0 \qquad \text{[deterministica: } -\log P = 0 \text{ se coerente]}
Il termine IC K(\text{IC} \mid \text{laws}) è la lunghezza descrittiva delle condizioni iniziali specifiche date le leggi — non è derivabile dalle leggi stesse. Questo è il luogo del fine-tuning.
Nell’OPT, il codice in due parti è:
L_T(\text{OPT}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)
Il termine -\log \xi^{\text{Filter}}(y_{1:T}) codifica il flusso specifico data la meta-regola. Il prior di Solomonoff incorpora già un modello universale della fisica: -\log \xi(y) \approx K(y). La codifica OPT non ha mai bisogno di pagare separatamente per le IC.
Congettura T-4c (Limite euristico di compressione delle IC). Definiamo il vantaggio di compressione delle IC:
\Delta_{\text{IC}} = K(\text{IC} \mid \text{SP laws}) - K(\text{IC} \mid \text{OPT})
Sosteniamo il seguente limite euristico:
\boxed{L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1)}
dove K(\text{IC} \mid \text{OPT}) := K(\text{IC} \mid \xi, \text{Filter}, \text{codec}) è la lunghezza descrittiva residua delle condizioni iniziali dato il modello completo dell’OPT. \Delta_{\text{IC}} \geq 0, con uguaglianza se e solo se il Filtro di Stabilità non fornisce alcuna compressione aggiuntiva delle IC oltre a quella già fornita dalle leggi.
Argomento. Partendo dal codice completo in due parti per SP e applicando la dominanza di Solomonoff (assorbendo le costanti di normalizzazione in un termine di maggiorazione \mathcal{O}(1) della UTM):
L_T(\text{OPT}) \leq K_0 + K(\text{laws}) + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) + \mathcal{O}(1)
Riordinando e sostituendo L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) (teoria deterministica):
L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 + \mathcal{O}(1)
All’interno dell’OPT, -\log \xi^{\text{Filter}}(y_{1:T}) non deve necessariamente codificare individualmente le IC: il Filtro seleziona dal prior di Solomonoff, che comprime intrinsecamente le IC tramite pesature per lunghezza. La sottoadditività dell’AIT garantisce K(\text{IC} \mid x, f(x)) \leq K(\text{IC} \mid x) + \mathcal{O}(1). Se postuliamo che la regola di selezione dell’OPT si limiti come una stringa descrittiva più stretta del semplice dichiarare le leggi grezze (che è la scommessa centrale del quadro teorico, non una dimostrazione derivativa matematica), allora il valore codificato residuo K(\text{IC} \mid \text{OPT}) non può eccedere in modo significativo K(\text{IC} \mid \text{laws}). Da cui, euristicamente, \Delta_{\text{IC}} \geq 0.
Per sostituzione: L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1). \blacksquare
Osservazione. Ipotizziamo che la compressione antropica K(\text{IC} \mid \text{OPT}) \approx 0 operi nel limite in cui il Filtro di Stabilità è altamente vincolante, mappando matematicamente su stati compatibili con l’osservatore in modo univoco. Si tratta di una proposta fisica motivata, piuttosto che di un limite di unicità dimostrato algoritmicamente.
§6. Vantaggio di Complessità del Modello a Bit Costante — Teorema T-4d
Teorema T-4d (Vantaggio MDL Permanente a Bit Costante — Condizionato alla Tipicità). Per ogni modello fisico computabile fisso e non banale \nu con K_0 < K(\nu) < \infty, la formulazione OPT ottiene un vantaggio fisso e permanente nella complessità del modello, specificamente per ogni y_{1:T} \in \mathcal{O} che sia anche \nu-tipico. Quando la lunghezza della sequenza T \to \infty, la differenza totale di lunghezza del codice è strutturalmente vincolata:
L_T(\text{OPT}) - L_T(\nu) \to K_0 - K(\nu)
Dimostrazione. Da T-4b, L_T(\text{OPT}) \leq K'_0 - \log \xi^{\text{Filter}}(y_{1:T}). Per ogni \nu computabile, il teorema di Solomonoff garantisce che \xi converga a \nu esattamente sulle sequenze \nu-tipiche: in misura di \nu-quasi-ogni y_{1:\infty}. Si noti qui la profonda tensione formale: il Filtro di Stabilità isola flussi che si valutano strettamente come a bassa entropia e strutturati, mappandoli nativamente come strutturalmente atipici rispetto ai flussi standard della misura \nu non vincolata a massima entropia. A meno che la classe filtrata degli osservatori \mathcal{O} e la classe \nu-tipica non presentino una sovrapposizione matematica non banale dimostrabile, il limite di convergenza di Solomonoff non può essere sfruttato nativamente. Di conseguenza, questo teorema si applica in modo condizionale se e solo se il flusso specifico dell’osservatore filtrato rimane \nu-tipico sotto le specifiche leggi di riferimento (lasciando formalmente non caratterizzato l’insieme di tali flussi intersecanti teoricamente conformi):
-\frac{1}{T} \log \xi(y_{1:T}) \to H(\nu) \quad \text{quando } T \to \infty
dove H(\nu) è il tasso di entropia di \nu. Analogamente, -\frac{1}{T} \log \nu(y_{1:T}) \to H(\nu). Asintoticamente, i termini di log-loss per bit della log-verosimiglianza convergono e si eguagliano, il che significa che il vantaggio residuo nella lunghezza totale del codice si isola puramente nella lunghezza della descrizione del modello:
\left[L_T(\text{OPT}) - L_T(\nu)\right] \to K_0 - K(\nu) < 0 \qquad \text{[poiché } K_0 \approx 36 \text{ contro } K(\nu) \sim 1750 \text{]}
Nota: sebbene la lunghezza totale del codice mantenga questo vantaggio permanente a bit fissi, il vantaggio per bit (\frac{K_0 - K(\nu)}{T}) si riduce attivamente fino a zero. Questo non rappresenta un vantaggio asintoticamente crescente in modo continuo tramite accumulazione di dati, bensì uno scarto strutturale rigido e permanente. \blacksquare
Stima numerica per \mathcal{M}_1: K(\mathcal{M}_1) - K_0 \approx 1714 bit. Una volta che le verosimiglianze di log-loss convergono su finestre osservative \nu-tipiche adeguate, OPT mantiene una superiorità matematica permanente nell’encoding totale di circa 1714 bit.
§7. Il Vantaggio Condizionale a T Finito — Teorema T-4e
Per flussi di lunghezza finita, il confronto MDL richiede che il vantaggio di compressione dell’IC di T-4c superi l’overhead K_0.
Teorema T-4e (Vantaggio MDL Condizionale a T Finito). L’OPT consegue un vantaggio MDL stretto a T finito rispetto a \mathcal{M}_1 — cioè, L_T(\text{OPT}) < L_T(\mathcal{M}_1) — se e solo se vale la seguente condizione:
\boxed{K(\text{IC} \mid \text{SP laws}) > K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y_{1:T}) - \left(-\log P_{\text{SP}}(y_{1:T})\right)\right]}
La parentesi nel RHS è il deficit di log-verosimiglianza dell’OPT rispetto a SP sul flusso specifico y_{1:T}. La condizione è soddisfatta ogni volta che il costo descrittivo dell’IC supera l’overhead combinato della meta-regola e il deficit predittivo dell’OPT su questo flusso.
Dimostrazione. Manipolazione diretta delle lunghezze di codice in due parti:
L_T(\text{OPT}) < L_T(\text{SP}) \iff \quad K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) - \log \xi^{\text{Filter}}(y) < K_{\text{laws}} + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) \iff \quad K(\text{IC} \mid \text{laws}) - K_0 > \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] + \left[K_{\text{laws}} - K_{\text{laws}}\right]
Riordinando (K_{\text{laws}} si annulla su entrambi i lati) si ottiene direttamente la condizione enunciata. \blacksquare
7.1 Valutazione della Condizione per la Cosmologia Standard
Sotto la codifica inflazionaria (il caso più favorevole per SP):
- K(\text{IC} \mid \text{SP laws}) \approx 300 bit (parametri inflazionari + numero di e-fold + reheating)
- K_0 \approx 36 bit (T-4a)
- Il deficit di log-verosimiglianza: ipotizziamo in termini funzionali che la OPT, dotata dei limiti del codec R_{T,h}(D) mappati in T-1, raggiunga su un flusso compatibile con l’osservatore una log-verosimiglianza puntuale almeno altrettanto robusta quanto quella della fisica standard. Si noti che i limiti di Solomonoff forniscono in senso stretto una dominanza sulle somme attese, non vincoli puntuali definitivi su specifici flussi singolari; pertanto \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] \leq 0 rappresenta un’aspettativa strutturale empirica piuttosto che una garanzia algoritmica.
Pertanto la condizione si riduce a K(\text{IC} \mid \text{SP laws}) > K_0, cioè 300 > 36. Ciò vale con un sostanziale margine strutturale. La condizione fallisce solo se IC costa meno di \sim 36 bit — cioè se la specifica IC del nostro universo è strutturalmente derivabile dalle sole leggi della SP, generando meno di 36 bit residui. Nessun modello cosmologico attuale ottiene questo risultato.
§8. La Tabella Comparativa MDL
| Modello | K(\mathcal{M}) (bit) | K(\text{IC}\mid\mathcal{M}) (bit) | -\log P(y\mid\mathcal{M}) | L_T totale | rango MDL |
|---|---|---|---|---|---|
| \mathcal{M}_1 — SM + GR | \sim 1750 | \sim 300 (inflazionario) | \sim 0 (deterministico) | \sim 2050 | 2º (inflazionario) |
| \mathcal{M}_3 — Boltzmann | \sim 1750 | \sim 10 | \gg 0 (flusso raro) | \gg 1760 | ultimo (verosimiglianza catastrofica) |
| \mathcal{M}_{\text{OPT}} — OPT | \sim 36 | \sim 0 (condizionale tramite Filtro altamente vincolato) | \sim 0^* (approssimazione deterministica del codec) | \sim 36 (condizionale) | 1º (condizionale) |
^* Sotto l’identificazione esplicita del codec di §9.2, il termine dei dati attivi di OPT si riduce a -\log P_{K_\theta}(y) = -\log P_\text{SP}(y) = 0 una volta che K_\theta è identificato con il codec SP.
§9. Limiti del confronto
9.1 K(y \mid \text{Filter}) non è computabile
La lunghezza di codice dell’OPT K_0 + K(y \mid \text{Filter}) = K_0 - \log \xi^{\text{Filter}}(y) contiene un termine che non è computabile nel senso di Turing (il problema dell’arresto impedisce di calcolare \xi esattamente). In pratica, le predizioni dell’OPT devono essere approssimate da un codec finito K_\theta — il che corrisponde alla fisica standard. Ciò significa che, ai fini predittivi, l’OPT si riduce al miglior codec computabile disponibile. Il vantaggio MDL dell’OPT rispetto a SP è quindi un vantaggio strutturale (nella descrizione della regola di selezione) piuttosto che un vantaggio operativo nella formulazione di nuove predizioni.
Questo non è un difetto — è il corretto contenuto formale dell’affermazione del preprint: “L’OPT sposta parte dell’onere esplicativo dall’enumerazione delle leggi alla selezione delle leggi.” Lo spostamento è reale e formalmente quantificato (\approx 1700 bit per la regola di selezione rispetto a \mathcal{M}_1), ma non genera nuovo contenuto predittivo al di là di quanto il codec già fornisce.
9.2 Il problema di identificazione del codec
Il codec OPT K_\theta è la misura calcolabile specifica di \mathcal{M} selezionata dal Filtro di Stabilità. T-4 non determina quale sia questa misura — tale identificazione richiede T-5 (recupero delle costanti) e l’intero programma di unificazione fisica. Finché K_\theta non sarà identificato esplicitamente con SM + GR, il confronto MDL resta condizionato a tale identificazione. Il vincolo formale L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 garantisce che OPT non possa fare peggio di SP, ma non garantisce che faccia meglio in tempo finito a meno che non sia soddisfatta la condizione IC di T-4e — come in effetti avviene, sotto le ipotesi cosmologiche standard.
Vincolo da P-2. L’Appendice P-2 (Embedding dello spazio di Hilbert tramite correzione quantistica degli errori) stabilisce che, in presenza di rumore locale, il codec deve soddisfare una struttura QECC — la sua rappresentazione interna deve costituire un codice quantistico di correzione degli errori con parametri specifici (n, k, d). Questo restringe il problema di identificazione del codec: K_\theta non è più una misura calcolabile arbitraria, ma una misura i cui stati predittivi portano la geometria di correzione degli errori di uno spazio di Hilbert. Questo vincolo è a monte del programma di recupero delle costanti di T-5 e può fornire ulteriori criteri di selezione per identificare K_\theta con il Modello Standard.
§10. Riepilogo conclusivo
Risultati di T-4 — Chiusura confermata (con condizioni di normalizzazione e tipicità)
Convenzioni di codifica fissate (§1). MDL in due parti, complessità di Kolmogorov prefissa relativa a una UTM fissa inclusiva, con mappatura del dominio dei dati in modo funzionale sul flusso cosciente y_{1:T} = z_{0:T}.
Classi di benchmark fissate (§2). Valuta \mathcal{M}_1 (SM+GR) rispetto a confini banali come \mathcal{M}_2 (selezione di parametri con portata generativa esplosiva) e \mathcal{M}_3 (collasso della verosimiglianza di Boltzmann).
T-4a (Complessità della meta-regola). K(\xi, \text{Filter}) = K_0 \approx 36 bit inclusi gli offset relativi della UTM.
T-4b (Solomonoff limitato). L_T(\text{OPT}) \leq L_T(\nu) + K_0 + \log(1/\xi(\mathcal{O})). Definisce esplicitamente il parametro di penalizzazione di normalizzazione algoritmica.
Congettura T-4c (Limite euristico di compressione delle IC). La ridondanza strutturale delle condizioni iniziali è il motore congetturato della compressione: \Delta_{\text{IC}} = K(\text{IC}\mid\text{SP}) - K(\text{IC}\mid\text{OPT}) \geq 0, sebbene l’unicità della mappatura sia solo condizionale. Questo funge da limite euristico, non da teorema formalmente dimostrato.
T-4d (Vantaggio del modello a bit costanti). Delimita condizionalmente il comportamento al limite: per benchmark computabili la cui classe \nu-tipica si sovrappone in modo non banale con \mathcal{O}, OPT ottiene un vantaggio permanente di complessità numerica (\sim -1714 bit), sebbene la sua densità infinita per bit tenda a zero.
T-4e (Vantaggio a T finito — condizionale). OPT supera \mathcal{M}_1 numericamente a T finito esattamente quando le perdite empiriche puntuali non ribaltano il confine strutturale centrale K(\text{IC}\mid\text{SP}) > K_0 (300 > 36). Colloca la vulnerabilità direttamente sulle assunzioni di dominanza algoritmica puntuale.
Condizioni di falsificazione per la tesi MDL
- Una derivazione delle condizioni iniziali cosmologiche dalle sole leggi SP in meno di \sim 36 bit — mostrando K(\text{IC} \mid \text{SP laws}) < K_0.
- Una dimostrazione che la restrizione del Filtro di Stabilità ai flussi compatibili con l’osservatore non comprime le IC — cioè, K(\text{IC} \mid \xi, \text{Filter}) = K(\text{IC} \mid \text{laws}), da cui segue \Delta_{\text{IC}} = 0.
- Un codec computabile esplicito K_\theta per OPT che sia dimostrabilmente meno accurato di SM+GR sui flussi dell’osservatore, tale da far sì che il deficit di log-verosimiglianza superi il guadagno di compressione delle IC.
Dipendenze a valle
- T-5 (Recupero delle costanti) è il passo successivo essenziale: una volta che il codec K_\theta è identificato con le leggi SM+GR tramite T-1/T-2/T-3, il confronto MDL diventa pienamente esplicito e la condizione in T-4e diventa una disuguaglianza concreta tra quantità note.
- Aggiornamento del preprint §5.2: la frase “Whether this meta-rule yields an actual MDL advantage… is an open comparative question” può ora essere aggiornata in: “Theorem T-4d establishes a conditional asymptotic advantage (for observer streams that are also \nu-typical under the benchmark physics, a set currently uncharacterised); Theorem T-4e establishes a conditional finite-T advantage; see Appendix T-4.”
Questa appendice è mantenuta come parte del repository del progetto OPT insieme a theoretical_roadmap.pdf. Riferimenti: Rissanen (1978) [12], Li & Vitányi (2008) [27], Solomonoff (1964) [11], Penrose (2004).