Järjestetyn patchin teoria
Liite T-4: MDL / parsimoniavertailu
v2.0.0 — 2. huhtikuuta 2026 | DOI: 10.5281/zenodo.19300777
Alkuperäinen tehtävä T-4: MDL- / parsimoniavertailu Ongelma: Julkaistu preprint-vaiheen käsikirjoitus väittää olevansa standardifysiikkaa parsimonisempi käsittelemällä fysikaalisia lakeja makroskooppisina pakkausalgoritmeina, mutta ei esitä muodollista MDL-vertailua. Toimitettava tuotos: OPT:n ja vertailukohtana käytettävien fysiikan malliluokkien vertaileva MDL-analyysi eksplisiittisten koodaussopimusten puitteissa.
Sulkemisstatus: SULJETTU (ehdollisesti tyypillisyyden ja IC-normalisoinnin varassa). Tämä liite esittää T-4:n edellyttämän muodollisen MDL-arvioinnin. Kolme vertailumalliluokkaa kiinnitetään eksplisiittisin koodaussopimuksin. Todistetaan neljä lausetta ja yksi konjektuuri: (T-4a) OPT:n valintasäännöllä on \mathcal{O}(1)-mittainen kuvauspituus; (T-4b) Solomonoff-dominanssi rajoittaa OPT:n log-lossin ylhäältä; (Konjektuuri T-4c) OPT:n rakenteellisen edun oletettu lähde on alkuehtojen pakkaus; (T-4d) OPT saavuttaa pysyvän vakio-bittisen mallikompleksisuusedun jokaiseen laskettavaan vertailumalliin nähden; (T-4e) äärellisen-T:n etu kvantifioidaan ehdollisesti. Sulkeminen nojaa kolmeen kantavaan ehtoon: havaitsijavirran tyypillisyyteen, Solomonoff-normalisointirangaistuksen \log(1/\xi(\mathcal{O})) absorptioon sekä siihen, että K(\text{IC} \mid \text{SP}) > K_0.
§1. MDL-koodauskonventioiden kiinnittäminen
MDL-vertailut ovat merkityksettömiä ilman eksplisiittisiä, kiinteitä koodauskonventioita. Preprintin §5.1 huomauttaa tästä vaatimuksesta mutta lykkää sitä. Kiinnitämme konventiot tässä Rissasen (1978) [12] ja Li & Vitányin (2008) [27] kaksiosaisen MDL-kehyksen mukaisesti.
1.1 Kaksiosaisen koodin pituus
Hypoteesiluokalle \mathcal{M} ja havaintosekvenssille y_{1:T} \in \{0,1\}^* kaksiosaisen MDL-koodin pituus on:
L_T(\mathcal{M}) = K(\mathcal{M}) + L(y_{1:T} \mid \mathcal{M}) \tag{preprint §5.1, Eq. 13}
missä K(\mathcal{M}) on hypoteesin prefiksinen Kolmogorov-kompleksisuus — lyhimmän itseään rajaavan ohjelman pituus kiinnitetyllä universaalilla Turingin koneella (UTM), joka tuottaa täydellisen kuvauksen \mathcal{M}:stä — ja L(y_{1:T} \mid \mathcal{M}) on datan negatiivinen log-todennäköisyys \mathcal{M}:n parhaan prediktiivisen mallin alaisuudessa:
L(y_{1:T} \mid \mathcal{M}) = -\log_2 P_\mathcal{M}(y_{1:T})
Deterministisille teorioille (lait + IC määräävät havainnot yksikäsitteisesti) L(y_{1:T} \mid \mathcal{M}) = 0, kun y on teorian kanssa yhteensopiva, ja L = \infty muulloin. Kaikki logaritmit ovat kantalukua 2; kaikki koodinpituudet bitteinä.
1.2 Universaali kone
Kiinnitämme koko tarkastelun ajan yhden optimaalisen UTM:n \mathcal{U}. Kaikki Kolmogorovin kompleksisuudet ovat suhteessa \mathcal{U}:hun; tulokset muuttuvat enintään \mathcal{O}(1) bittiä eri UTM-valinnan alla. Solomonoffin puolimitta \xi määritellään suhteessa \mathcal{U}:hun (preprintin yhtälö 1). Tämä vahvistaa konvention kaikille myöhemmille vertailuille.
1.3 y_{1:T}:n soveltamisala
Vertaamme malleja sillä alueella, jota kukin on suunniteltu ennustamaan: havaitsijan tietoisen virran alueella y_{1:T} = z_{0:T} (pakattujen latenttien tilojen jono, C_{\max} bittiä sekunnissa T sekunnin ajan). Standardifysiikkaa arvioidaan samalla alueella redusoimalla sen ennusteet havaitsijayhteensopivaan virtaan karkeistuksen avulla. Molempia teorioita pyydetään selittämään täsmälleen samat havainnot.
§2. Vertailumalliluokat
Kolme vertailuluokkaa kiinnitetään. Kullekin annetaan eksplisiittinen arvio K(\mathcal{M}):lle UTM-konventiomme puitteissa. Tarkat numeeriset arvot ovat kertaluokka-arvioita; rakenteelliset tulokset kohdissa §§3–7 riippuvat vain järjestyksestä, eivät tarkoista arvoista.
2.1 \mathcal{M}_1 — Standardimalli + yleinen suhteellisuusteoria
Tällä hetkellä saatavilla oleva fysikaalinen teoria, jolla on suurin prediktiivinen tarkkuus. Sen kuvaus edellyttää kolmea komponenttia:
Matemaattinen rakenne K_{\text{struct}}: mittaryhmä \text{SU}(3) \times \text{SU}(2) \times \text{U}(1), Lorentz-invarianssi, renormalisoituvuus ja yleisen suhteellisuusteorian diffeomorfismisymmetria. Kolmogorov-kompleksisuus: K_{\text{struct}} \approx 10^3 bittiä.
Parametriarvot K_{\text{param}}: 19 standardimallin vapaata parametria + 3 sekoituskulmaa + 1 CP-vaihe + \Lambda + G + c \approx 25 kokeelliseen tarkkuuteen koodattua vakiota (\sim 30 bittiä kukin): K_{\text{param}} \approx 750 bittiä.
Alkuehdot K_{\text{IC}}: inflaatioparadigman puitteissa K_{\text{IC}}^{\text{inf}} \approx 200–400 bittiä. Huom.: Emme pisteytä tässä Penrosen termodynaamisen entropian rajaa 10^{123}, koska se mittaa makroskooppisen faasiavaruuden tilavuutta (S), ei spesifiä algoritmista Kolmogorov-kompleksisuutta (K). Spesifi mikrotila voi olla hyvin pakattavissa. Tukeudumme yksinomaan rehellisiin inflaation asettamiin rajoihin.
K(\mathcal{M}_1) = K_{\text{struct}} + K_{\text{param}} \approx 1750 \text{ bittiä}
K(\text{IC} \mid \mathcal{M}_1) \approx 300 \text{ bittiä (inflaatioperäinen)}
2.2 \mathcal{M}_2 — Geneerinen renormalisoituva QFT
Kaikkien renormalisoituvien kvanttikenttäteorioiden luokka \leq 4:ssä aika-avaruusulottuvuudessa. Tämä luokka sisältää \mathcal{M}_1:n yhtenä jäsenenään. Koska myös mittaryhmä ja hiukkassisältö on määritettävä:
K(\mathcal{M}_2) \gg K(\mathcal{M}_1) \gg 1750 \text{ bits}
\mathcal{M}_2 sisällytetään kontrastitapaukseksi OPT:n väitteelle, jonka mukaan lait valikoituvat eivätkä ole luetteloituja. Vaikka MDL-vertailu \mathcal{M}_2:een nähden voitetaan triviaalisti millä tahansa äärellisellä alaluokalla (mukaan lukien \mathcal{M}_1), koska K(\mathcal{M}_2) on rajoittamaton, sen sisällyttäminen palvelee muodollisesti sen osoittamista, kuinka äärettömän laaja parametrien valintaongelma on kyseessä — ongelma, jonka Stabiilisuussuodatin romahtaa luontaisesti.
2.3 \mathcal{M}_3 — Boltzmannin aivot / terminen fluktuaatio
Standardifysiikka maksimaalisen yksinkertaisilla alkuehdoilla: terminen (maksimientropinen) tila Planckin skaalassa. Lait ovat identtiset \mathcal{M}_1:n kanssa; alkuehdot ovat triviaalin yksinkertaiset:
K(\mathcal{M}_3) \approx K(\mathcal{M}_1) \approx 1750 \text{ bits}, \qquad K(\text{IC} \mid \mathcal{M}_3) \approx 10 \text{ bits}
Kuitenkin järjestyneen tietoisen virran y_{1:T} havaitsemisen log-likelihood \mathcal{M}_3:n alaisuudessa on astronomisen pieni: L(y_{1:T} \mid \mathcal{M}_3) \approx K(y_{1:T}) \gg T \cdot C_{\max}. Siten \mathcal{M}_3:lla on mitätön IC-kustannus mutta katastrofaalinen likelihood-kustannus, ja se sisällytetään osoittamaan, ettei OPT:n MDL-etu saavuteta samalla tempulla.
§3. OPT:n koodipituus — Teoreema T-4a
OPT:n MDL-koodipituus hajoaa muotoon:
L_T(\text{OPT}) = K(\xi, \text{Filter}) + L(y_{1:T} \mid \xi, \text{Filter}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)
missä \xi^{\text{Filter}} on Solomonoffin mitta \xi ehdollistettuna havaitsijayhteensopivaan luokkaan \mathcal{O} (virrat, jotka toteuttavat ehdon R_{\text{req}} \leq B_{\max}), ja K_0 = K(\xi, \text{Filter}) on valintasäännön kuvauspituus.
Teoreema T-4a (metasäännön kompleksisuusraja). K(\xi, \text{Filter}) = K_0 = \mathcal{O}(1) bittiä. Tarkemmin:
K_0 \leq K(\mathcal{U}) + K(C_{\max}) + K(\Delta t) + c
missä K(\mathcal{U}) on UTM:n kompleksisuus, K(C_{\max}) = \mathcal{O}(\log C_{\max}) bittiä koodaa kaistanleveyden kynnysarvon kokeellisella tarkkuudella, K(\Delta t) = \mathcal{O}(\log \Delta t) koodaa päivitysikkunan, ja c on pieni universaali vakio.
Todistus. Solomonoffin mitta \xi määräytyy yksikäsitteisesti kiinteän UTM:n \mathcal{U} perusteella, joten K(\xi \mid \mathcal{U}) = \mathcal{O}(1). Stabiilisuussuodatin vaatii kaksi parametria: C_{\max} ja \Delta t, joista kumpikin mitataan noin \sim 4 merkitsevän numeron tarkkuudella, joten K(C_{\max}, \Delta t) \leq 2 \times (4 \times \log_2 10) \approx 26 bittiä. Ehto R_{\text{req}} \leq B_{\max} on yksi epäyhtälö kiinteässä notaatiomuodossa: \sim 10 bittiä. Yhteensä: K_0 \leq K(\mathcal{U}) + 36 bittiä.
Jotta K(\mathcal{U}) voidaan sisällyttää reilusti, meidän on oletettava “episteemisesti neutraali” UTM — eli viitekone, jonka sisäänrakennettu käskykanta ei koodaa mitään fysikaalista teoriaa etuoikeutetusti (ts. peruskombinaattori- tai Brainfuck-ekvivalentti geometria, täysin fysiikka-agnostinen). Tällaisen puolueettoman koneen tapauksessa on pätevää säilyttää K(\xi, \text{Filter}) \approx 36 bittiä samalla kun standardoidaan K(\mathcal{M}_1) \approx 1750 bittiä. Tunnustamme nimenomaisesti, että tämä jättää absoluuttisen bittimäärän alttiiksi \mathcal{O}(1)-vakioskaalaukselle, jos UTM vaihdetaan, mikä tarkoittaa, että laskelma 36 vs 1750 on luonteeltaan väistämättä suhteellinen. Rakenteellisesti rehellinen matemaattinen väite tässä on järjestysvertailu (K_0 \ll K(\mathcal{M}_1)), joka väittää robustin rakenteellisen edun riippumatta täsmällisestä numeerisesta vakiosta. \blacksquare
Vertailu: Jaetun UTM-ylikuorman pois lukien K_0 \approx 36 bittiä vs. K(\mathcal{M}_1) \approx 1750 bittiä. OPT:n valintasääntö on lyhyempi kuin Standardimallin kuvaus määrällä K(\mathcal{M}_1) - K_0 \approx 1714 bittiä. Tämä on se rakenteellinen parsimoniaetu, jota preprintin §5:ssä väitetään — nyt eksplisiittisellä bittimäärällä.
§4. Solomonoffin dominanssiraja — Teoreema T-4b
Teoreema T-4b (Solomonoffin dominanssiraja). Mille tahansa laskettavalle fysiikkamitalle \nu (mukaan lukien \mathcal{M}_1, \mathcal{M}_2, \mathcal{M}_3), jolle pätee K(\nu) < \infty, ja mille tahansa datavirralle y_{1:T}:
L_T(\text{OPT}) \leq L_T(\nu) + K'_0
missä K'_0 = K_0 + \log(1/\xi(\mathcal{O})). Tämä edustaa perussäännön kompleksisuutta sekä välttämätöntä algoritmista normalisointirangaistusta, joka aiheutuu siitä, että universaali mitta ehdollistetaan havaitsijaluokkaan \mathcal{O}.
Todistus. Solomonoffin mitan määritelmästä (preprintin yhtälö 1), kun w_\nu \asymp 2^{-K(\nu)}:
\xi(y_{1:T}) \geq w_\nu \cdot \nu(y_{1:T}) \geq 2^{-K(\nu)} \cdot \nu(y_{1:T})
Ottamalla negatiiviset logaritmit:
-\log \xi(y_{1:T}) \leq -\log \nu(y_{1:T}) + K(\nu)
Siirryttäessä universaalista mitasta \xi rajoitettuun suodattimeen \xi^{\text{Filter}}, maksetaan normalisointikustannus -\log \xi^{\text{Filter}}(y) = -\log \xi(y) + \log(1/\xi(\mathcal{O})). Sijoittamalla tämä lausekkeeseen L_T(\text{OPT}):
L_T(\text{OPT}) = K_0 - \log \xi^{\text{Filter}}(y_{1:T}) \leq K_0 + \log(1/\xi(\mathcal{O})) + K(\nu) - \log \nu(y_{1:T}) = K'_0 + L_T(\nu) \qquad \blacksquare
Tärkeä varaus. Teoreema T-4b ei osoita, että OPT suoriutuu paremmin kuin SP. Se osoittaa, että OPT ei voi suoriutua mitään vertailukohtaa huonommin enempää kuin K'_0 bittiä. Tästä eteenpäin sisällytämme termin \log(1/\xi(\mathcal{O})) vakioon K_0 olettamalla, että havaitsijasekvenssien luokka rajautuu siististi suhteessa rakenteellisiin UTM-vakioihin, mutta huomioimme tämän normalisointikuilun formaalina haavoittuvuutena.
§5. Alkuehtojen pakkaus — teoreema T-4c
OPT:n MDL-edun rakenteellinen lähde on alkuehtojen pakkaus. Standardifysiikassa lait ja alkuehdot ovat erillisiä objekteja, jotka molemmat on kuvattava. OPT:ssa alkuehdot absorboituvat prioriinsa: Solomonoffin mitta antaa jo suurimman painon yksinkertaisimmille havaitsijayhteensopiville virroille, mikä tekee erillisestä IC-määrittelystä redundantin.
5.1 IC-redundanssiargumentti
Standardifysiikan (\mathcal{M}_1) puitteissa deterministisen teorian täydellinen MDL-koodi on:
L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) + 0 \qquad \text{[deterministinen: } -\log P = 0 \text{ jos konsistentti]}
IC-termi K(\text{IC} \mid \text{laws}) on spesifisten alkuehtojen kuvauspituus annettuna lait — sitä ei voida johtaa itse laeista. Tämä on hienosäädön sijaintipaikka.
OPT:n puitteissa kaksiosainen koodi on:
L_T(\text{OPT}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)
Termi -\log \xi^{\text{Filter}}(y_{1:T}) koodaa spesifisen virran annettuna metasääntö. Solomonoffin universaali puolimitta sisältää jo universaalin fysiikan mallin: -\log \xi(y) \approx K(y). OPT-koodauksen ei koskaan tarvitse erikseen maksaa IC:stä.
Konjektuuri T-4c (IC-pakkauksen heuristinen raja). Määritellään IC-pakkausetu:
\Delta_{\text{IC}} = K(\text{IC} \mid \text{SP laws}) - K(\text{IC} \mid \text{OPT})
Esitämme seuraavan heuristisen rajan:
\boxed{L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1)}
missä K(\text{IC} \mid \text{OPT}) := K(\text{IC} \mid \xi, \text{Filter}, \text{codec}) on alkuehtojen residuaalinen kuvauspituus annettuna OPT:n täysi malli. \Delta_{\text{IC}} \geq 0, ja yhtäsuuruus pätee täsmälleen silloin, kun Stabiilisuussuodatin ei tarjoa mitään lisäpakkausta IC:lle sen yli, minkä lait jo antavat.
Argumentti. Lähtien SP:n täydestä kaksiosaisesta koodista ja soveltaen Solomonoff-dominanssia (absorboiden normalisointivakiot \mathcal{O}(1)-luokan UTM-rajaustermiin):
L_T(\text{OPT}) \leq K_0 + K(\text{laws}) + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) + \mathcal{O}(1)
Järjestelemällä uudelleen ja korvaamalla L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) (deterministinen teoria):
L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 + \mathcal{O}(1)
OPT:n sisällä -\log \xi^{\text{Filter}}(y_{1:T}) ei tarvitse koodata IC:tä erikseen: Suodatin valikoi Solomonoffin universaalista puolimitasta, joka pakkaa IC:n sisäsyntyisesti pituuspainotusten kautta. AIT:n subadditiivisuus takaa, että K(\text{IC} \mid x, f(x)) \leq K(\text{IC} \mid x) + \mathcal{O}(1). Jos oletamme, että OPT:n valintasääntö rajautuu tiukemmaksi kuvailevaksi merkkijonoksi kuin pelkkä raakojen lakien julistaminen (mikä on viitekehyksen ydinveto, ei matemaattinen derivatiivinen todistus), niin residuaalisesti koodattu K(\text{IC} \mid \text{OPT}) ei voi merkittävästi ylittää arvoa K(\text{IC} \mid \text{laws}). Tästä seuraa heuristisesti \Delta_{\text{IC}} \geq 0.
Sijoittamalla saadaan: L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1). \blacksquare
Huomautus. Oletamme, että antrooppinen pakkaus K(\text{IC} \mid \text{OPT}) \approx 0 toimii rajassa, jossa Stabiilisuussuodatin on voimakkaasti rajoittava ja kuvaa matemaattisesti yksikäsitteisesti havaitsijayhteensopiviin tiloihin. Tämä on motivoitu fysikaalinen väite eikä algoritmisesti todistettu yksikäsitteisyysraja.
§6. Vakiobittinen etu mallikompleksisuudessa — Lause T-4d
Lause T-4d (Pysyvä vakiobittinen MDL-etu — tyypillisyysehdolla). Jokaiselle kiinteälle, ei-triviaalille laskettavalle fysiikkamallille \nu, jolle pätee K_0 < K(\nu) < \infty, OPT-formulaatio saavuttaa kiinteän, pysyvän edun mallikompleksisuudessa nimenomaan kaikille sellaisille y_{1:T} \in \mathcal{O}, jotka ovat myös \nu-tyypillisiä. Kun sekvenssin pituus T \to \infty, kokonaiskoodipituuksien erotus on rakenteellisesti sidottu:
L_T(\text{OPT}) - L_T(\nu) \to K_0 - K(\nu)
Todistus. Lauseesta T-4b seuraa, että L_T(\text{OPT}) \leq K'_0 - \log \xi^{\text{Filter}}(y_{1:T}). Jokaiselle laskettavalle \nu:lle Solomonoffin teoreema takaa, että \xi suppenee kohti \nu:ta täsmälleen \nu-tyypillisillä sekvensseillä: mitattuna \nu-melkein-kaikilla y_{1:\infty}. Tässä on syvä muodollinen jännite: Stabiilisuussuodatin eristää virtoja, jotka arvioituvat aidosti matalaentropisiksi ja rakenteisiksi, ja sijoittaa ne siten rakenteellisesti epätyypillisiksi verrattuna standardeihin rajoittamattomiin maksimi-entropian \nu-mitan virtoihin. Ellei suodatetun havaitsijaluokan \mathcal{O} ja \nu-tyypillisen luokan välillä ole osoitettavissa ei-triviaalia matemaattista päällekkäisyyttä, Solomonoffin suppenemisrajaa ei voida suoraan hyödyntää. Tämän vuoksi tämä lause pätee ehdollisesti silloin ja vain silloin, kun kyseinen suodatettu havaitsijavirta pysyy \nu-tyypillisenä kyseisten vertailulakien alaisuudessa (jättäen tällaisten teoreettisesti yhteensopivien leikkaavien virtojen joukon muodollisesti karakterisoimatta):
-\frac{1}{T} \log \xi(y_{1:T}) \to H(\nu) \quad \text{kun } T \to \infty
missä H(\nu) on \nu:n entropianopeus. Samoin -\frac{1}{T} \log \nu(y_{1:T}) \to H(\nu). Asymptoottisesti bittikohtaiset log-loss-log-uskottavuustermit suppenevat ja yhtyvät, mikä tarkoittaa, että jäljelle jäävä kokonaiskoodipituuden etu eristyy puhtaasti mallin kuvauspituuteen:
\left[L_T(\text{OPT}) - L_T(\nu)\right] \to K_0 - K(\nu) < 0 \qquad \text{[koska } K_0 \approx 36 \text{ vs } K(\nu) \sim 1750 \text{]}
Huomautus: Vaikka kokonaiskoodipituus säilyttää tämän pysyvän kiinteän bittiedun, bittikohtainen etu (\frac{K_0 - K(\nu)}{T}) kutistuu aktiivisesti kohti nollaa. Tämä ei merkitse asymptoottisesti jatkuvasti kasvavaa etua datan kertymisen kautta, vaan pikemminkin pysyvää jäykkää rakenteellista siirtymää. \blacksquare
Numeerinen arvio mallille \mathcal{M}_1: K(\mathcal{M}_1) - K_0 \approx 1714 bittiä. Kun log-loss-uskottavuudet suppenevat riittävän pitkissä \nu-tyypillisissä havaintoikkunoissa, OPT säilyttää pysyvän matemaattisen kokonaiskoodauksen ylivertaisuuden, joka on noin 1714 bittiä.
§7. Äärellisen-T:n ehdollinen etu — Lause T-4e
Äärellisen pituisten virtojen tapauksessa MDL-vertailu edellyttää, että T-4c:n IC-pakkausetu ylittää K_0-ylikustannuksen.
Lause T-4e (Äärellisen-T:n ehdollinen MDL-etu). OPT saavuttaa aidon äärellisen-T:n MDL-edun suhteessa malliin \mathcal{M}_1 — eli L_T(\text{OPT}) < L_T(\mathcal{M}_1) — jos ja vain jos seuraava ehto pätee:
\boxed{K(\text{IC} \mid \text{SP laws}) > K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y_{1:T}) - \left(-\log P_{\text{SP}}(y_{1:T})\right)\right]}
Oikean puolen hakasulkeissa oleva termi on OPT:n log-likelihood-vaje suhteessa SP:hen kyseisellä virralla y_{1:T}. Ehto täyttyy aina, kun IC:n kuvailukustannus ylittää metasäännön ja OPT:n tällä virralla ilmenevän ennustevajeen yhteenlasketun ylikustannuksen.
Todistus. Kahden osan koodipituuksien suora manipulointi:
L_T(\text{OPT}) < L_T(\text{SP}) \iff \quad K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) - \log \xi^{\text{Filter}}(y) < K_{\text{laws}} + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) \iff \quad K(\text{IC} \mid \text{laws}) - K_0 > \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] + \left[K_{\text{laws}} - K_{\text{laws}}\right]
Uudelleenjärjestelyllä (K_{\text{laws}} supistuu pois molemmilta puolilta) saadaan väitetty ehto suoraan. \blacksquare
7.1 Ehdon arviointi standardikosmologialle
Inflaatioenkoodauksen alaisuudessa (SP:n kannalta suotuisin tapaus):
- K(\text{IC} \mid \text{SP laws}) \approx 300 bittiä (inflaatioparametrit + e-kertymien lukumäärä + uudelleenlämpeneminen)
- K_0 \approx 36 bittiä (T-4a)
- Log-likelihood-vaje: Oletamme funktionaalisesti, että OPT, varustettuna T-1:ssä kuvatuilla R_{T,h}(D)-koodekkirajoilla, saavuttaa vähintään yhtä vahvan pistekohtaisen log-likelihoodin kuin standardifysiikka havaitsijayhteensopivalla virralla. Huomaa, että Solomonoffin rajat tuottavat tiukasti ottaen dominanssin odotettujen summien yli, eivät lopullisia pistekohtaisia rajoja tietyille yksittäisille virroille; joten \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] \leq 0 edustaa empiiristä rakenteellista odotusta eikä algoritmista takuuta.
Siksi ehto pelkistyy muotoon K(\text{IC} \mid \text{SP laws}) > K_0, eli 300 > 36. Tämä pätee huomattavalla rakenteellisella marginaalilla. Ehto epäonnistuu vain, jos IC maksaa vähemmän kuin \sim 36 bittiä — toisin sanoen jos universumimme spesifi IC on rakenteellisesti johdettavissa pelkästään SP:n laeista siten, että residuaaliksi jää alle 36 bittiä. Mikään nykyinen kosmologinen malli ei saavuta tätä.
§8. Vertaileva MDL-taulukko
| Malli | K(\mathcal{M}) (bittiä) | K(\text{IC}\mid\mathcal{M}) (bittiä) | -\log P(y\mid\mathcal{M}) | L_T yhteensä | MDL-sijoitus |
|---|---|---|---|---|---|
| \mathcal{M}_1 — SM + GR | \sim 1750 | \sim 300 (inflationaarinen) | \sim 0 (deterministinen) | \sim 2050 | 2. (inflationaarinen) |
| \mathcal{M}_3 — Boltzmann | \sim 1750 | \sim 10 | \gg 0 (harvinainen virta) | \gg 1760 | viimeinen (katastrofaalinen uskottavuus) |
| \mathcal{M}_{\text{OPT}} — OPT | \sim 36 | \sim 0 (ehdollinen erittäin rajoitetun Suodattimen kautta) | \sim 0^* (deterministinen koodekkiapproksimaatio) | \sim 36 (ehdollinen) | 1. (ehdollinen) |
^* §9.2:n eksplisiittisen koodekki-identifikaation nojalla OPT:n aktiivinen datatermi supistuu muotoon -\log P_{K_\theta}(y) = -\log P_\text{SP}(y) = 0, kun K_\theta identifioidaan SP-koodekin kanssa.
§9. Vertailun rajat
9.1 K(y \mid \text{Filter}) ei ole laskettavissa
OPT:n koodipituus K_0 + K(y \mid \text{Filter}) = K_0 - \log \xi^{\text{Filter}}(y) sisältää termin, joka ei ole laskettavissa Turingin mielessä (pysähtymisongelma estää \xi:n tarkan laskemisen). Käytännössä OPT:n ennusteita on approksimoitava äärellisellä koodekilla K_\theta — mikä on standardia fysiikkaa. Tämä tarkoittaa, että prediktiivisissä tarkoituksissa OPT palautuu parhaaseen saatavilla olevaan laskettavaan koodekkiin. OPT:n MDL-etu suhteessa SP:hen on siis rakenteellinen etu (valintasäännön kuvauksessa) eikä operationaalinen etu uusien ennusteiden tekemisessä.
Tämä ei ole puute — se on preprintin väitteen oikea formaali sisältö: “OPT siirtää osan selitysrasitteesta lakien luetteloinnista lakien valintaan.” Siirtymä on todellinen ja formaalisti kvantifioitu (\approx 1700 bittiä valintasäännölle vs. \mathcal{M}_1), mutta se ei tuota uutta prediktiivistä sisältöä sen lisäksi, mitä koodekki jo tarjoaa.
9.2 Koodekin identifiointiongelma
OPT-koodekki K_\theta on se tietty laskettava mitta joukosta \mathcal{M}, jonka Stabiilisuussuodatin valitsee. T-4 ei määritä, mikä mitta tämä on — sen identifiointi edellyttää T-5:tä (vakioiden palautusta) ja koko fysikaalisen yhdistämisen ohjelmaa. Kunnes K_\theta on eksplisiittisesti identifioitu SM:n + GR:n kanssa, MDL-vertailu on ehdollinen tälle identifioinnille. Formaali raja L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 takaa, ettei OPT voi suoriutua SP:tä huonommin, mutta ei takaa, että se suoriutuu paremmin äärellisessä ajassa, ellei T-4e:n IC-ehto täyty — ja standardien kosmologisten oletusten vallitessa se täyttyy.
Rajoite kohdasta P-2. Liite P-2 (Hilbert-avaruuden upotus kvanttivirheenkorjauksen kautta) osoittaa, että paikallisen kohinan alaisuudessa koodekin on toteutettava QECC-rakenne — sen sisäisen representaation on muodostettava kvanttivirheenkorjauskoodi tietyillä parametreilla (n, k, d). Tämä kaventaa koodekin identifiointiongelmaa: K_\theta ei enää ole mielivaltainen laskettava mitta, vaan sellainen, jonka prediktiiviset tilat kantavat Hilbert-avaruuden virheenkorjaavaa geometriaa. Tämä rajoite on T-5:n vakioiden palautusohjelmaa edeltävä ja voi tarjota lisävalintakriteerejä K_\theta:n identifioimiseksi Standardimallin kanssa.
§10. Yhteenveto sulkemisesta
T-4:n tuotokset — vahvistetusti suljettu (normalisointi- ja tyypillisyysreunaehdoin)
Koodauskonventiot kiinnitetty (§1). Kaksiosainen MDL, etuliite-Kolmogorovin kompleksisuus suhteessa inklusiiviseen kiinteään UTM:ään, joka kuvaa data-alueen funktionaalisesti tietoisuusvirtaan y_{1:T} = z_{0:T}.
Vertailuluokat kiinnitetty (§2). Arvioi \mathcal{M}_1:tä (SM+GR) suhteessa triviaaleihin rajoihin kuten \mathcal{M}_2 (räjähtävä generatiivisen laajuuden parametrivalinta) ja \mathcal{M}_3 (Boltzmannin uskottavuusromahdus).
T-4a (Metasäännön kompleksisuus). K(\xi, \text{Filter}) = K_0 \approx 36 bittiä, mukaan lukien suhteelliset UTM-siirtymät.
T-4b (Solomonoff rajattu). L_T(\text{OPT}) \leq L_T(\nu) + K_0 + \log(1/\xi(\mathcal{O})). Määrittelee algoritmisen normalisointirangaistusparametrin eksplisiittisesti.
Konjektuuri T-4c (IC-pakkauksen heuristinen raja). Rakenteellinen alkuehtoredundanssi on oletettu pakkauksen moottori: \Delta_{\text{IC}} = K(\text{IC}\mid\text{SP}) - K(\text{IC}\mid\text{OPT}) \geq 0, vaikka kuvaus on ehdollisesti yksikäsitteinen. Tämä toimii heuristisena rajana, ei muodollisesti todistettuna lauseena.
T-4d (Vakio-bittisen mallin etu). Rajaa ehdollisesti raja-arvokäyttäytymistä: laskettaville vertailumalleille, joiden \nu-tyypillinen luokka leikkaa ei-triviaalisti joukon \mathcal{O} kanssa, OPT saavuttaa pysyvän numeerisen kompleksisuusedun (\sim -1714 bittiä), vaikka sen ääretön bittikohtainen tiheys skaalautuu nollaan.
T-4e (Äärellisen-T:n etu — ehdollinen). OPT päihittää \mathcal{M}_1:n numeerisesti äärellisellä T:llä täsmälleen silloin, kun empiiriset pistekohtaiset häviöt eivät kumoa ydinehtoa K(\text{IC}\mid\text{SP}) > K_0 koskevaa rakenteellista rajaa (300 > 36). Kohdistaa haavoittuvuuden suoraan algoritmista pistekohtaista dominanssia koskeviin oletuksiin.
MDL-väitteen falsifiointiehdot
- Kosmologisten alkuehtojen johtaminen pelkistä SP-laeista alle \sim 36:ssa bitissä — osoittaen, että K(\text{IC} \mid \text{SP laws}) < K_0.
- Osoitus siitä, että Stabiilisuussuodattimen rajoitus havaitsijayhteensopiviin virtoihin ei pakkaa IC:tä — eli K(\text{IC} \mid \xi, \text{Filter}) = K(\text{IC} \mid \text{laws}), jolloin \Delta_{\text{IC}} = 0.
- Eksplisiittinen laskettava koodekki K_\theta OPT:lle, joka on osoitettavasti epätarkempi kuin SM+GR havaitsijavirroilla, niin että log-uskottavuusvaje ylittää IC-pakkauksen tuoton.
Jatkoriippuvuudet
- T-5 (Vakioiden palautus) on olennainen seuraava askel: kun koodekki K_\theta identifioidaan SM+GR-lakien kanssa T-1/T-2/T-3:n kautta, MDL-vertailusta tulee täysin eksplisiittinen ja T-4e:n ehto muuttuu konkreettiseksi epäyhtälöksi tunnettujen suureiden välillä.
- Preprint §5.2 -päivitys: ilmaus “Whether this meta-rule yields an actual MDL advantage… is an open comparative question” voidaan nyt päivittää muotoon: “Theorem T-4d establishes a conditional asymptotic advantage (for observer streams that are also \nu-typical under the benchmark physics, a set currently uncharacterised); Theorem T-4e establishes a conditional finite-T advantage; see Appendix T-4.”
Tätä liitettä ylläpidetään osana OPT-projektin repositoriota yhdessä theoretical_roadmap.pdf:n kanssa. Viitteet: Rissanen (1978) [12], Li & Vitányi (2008) [27], Solomonoff (1964) [11], Penrose (2004).