A rendezett patch elmélete
T-4. függelék: MDL / takarékossági összehasonlítás
v2.0.0 — 2026. április 2. | DOI: 10.5281/zenodo.19300777
Eredeti T-4 feladat: MDL- / takarékossági összehasonlítás Probléma: Az élő preprint azt állítja, hogy a standard fizikánál takarékosabb, mivel a fizikai törvényeket makroszkopikus tömörítési algoritmusokként kezeli, de nem ad formális MDL-összehasonlítást. Eredmény: Az OPT és az etalon fizikai modellosztályok összehasonlító MDL-elemzése explicit kódolási konvenciók mellett.
Lezárási státusz: LEZÁRVA (a tipikusság és az IC-normalizáció feltételével). Ez a függelék megadja a T-4 által megkövetelt formális MDL-kiértékelést. Három etalon modellosztály van rögzítve explicit kódolási konvenciókkal. Négy tétel és egy sejtés kerül megállapításra: (T-4a) az OPT szelekciós szabályának leíráshossza \mathcal{O}(1); (T-4b) a Solomonoff-dominancia felülről korlátozza az OPT log-lossát; (T-4c sejtés) az OPT strukturális előnyének feltételezett forrása a kezdeti feltételek tömörítése; (T-4d) az OPT minden kiszámítható etalonhoz képest tartós, konstans bites előnyt ér el a modellkomplexitásban; (T-4e) a véges-T előny feltételesen kvantifikált. A lezárás három teherhordó feltételen nyugszik: a megfigyelői folyam tipikusságán, a Solomonoff-normalizációs büntetés \log(1/\xi(\mathcal{O})) elnyelésén, valamint azon az állapoton, hogy K(\text{IC} \mid \text{SP}) > K_0.
§1. Az MDL-kódolási konvenciók rögzítése
Az MDL-összehasonlítások értelmetlenek explicit, rögzített kódolási konvenciók nélkül. A preprint 5.1. §-a megjegyzi ezt a követelményt, de elhalasztja. Itt rögzítjük a konvenciókat Rissanen (1978) [12] és Li & Vitányi (2008) [27] kétrészes MDL-keretrendszere nyomán.
1.1 A kétrészes kódhossz
Egy \mathcal{M} hipotézisosztály és egy y_{1:T} \in \{0,1\}^* megfigyelésszekvencia esetén a kétrészes MDL-kódhossz:
L_T(\mathcal{M}) = K(\mathcal{M}) + L(y_{1:T} \mid \mathcal{M}) \tag{preprint §5.1, Eq. 13}
ahol K(\mathcal{M}) a hipotézis prefix Kolmogorov-komplexitása — annak a legrövidebb önhatároló programnak a hossza egy rögzített univerzális Turing-gépen (UTM), amely \mathcal{M} teljes leírását előállítja —, míg L(y_{1:T} \mid \mathcal{M}) az adatok negatív log-likelihoodja \mathcal{M} legjobb prediktív modellje alatt:
L(y_{1:T} \mid \mathcal{M}) = -\log_2 P_\mathcal{M}(y_{1:T})
Determinisztikus elméletek esetén (amikor a törvények + IC egyértelműen meghatározzák a megfigyeléseket) L(y_{1:T} \mid \mathcal{M}) = 0, ha y összhangban van az elmélettel, és egyébként L = \infty. Minden logaritmus 2-es alapú; minden kódhossz bitben értendő.
1.2 Az univerzális gép
Végig egyetlen optimális UTM-et, \mathcal{U}-t rögzítünk. Minden Kolmogorov-komplexitás \mathcal{U}-hoz viszonyított; az eredmények legfeljebb \mathcal{O}(1) bittel változnak más UTM-választás esetén. A Solomonoff-mérték \xi definíciója \mathcal{U}-hoz viszonyított (preprint, 1. egyenlet). Ez rögzíti a konvenciót minden további összehasonlításhoz.
1.3 A y_{1:T} hatóköre
A modelleket azon a tartományon hasonlítjuk össze, amelynek előrejelzésére tervezték őket: a megfigyelő tudatos folyamán, y_{1:T} = z_{0:T} (a tömörített látens állapotok sorozata, másodpercenként C_{\max} biten, T másodpercen át). A standard fizikát ugyanazon a tartományon értékeljük úgy, hogy előrejelzéseit durva szemcsézés révén a megfigyelő-kompatibilis folyamra redukáljuk. Mindkét elméletnek pontosan ugyanazokat a megfigyeléseket kell számot adnia.
§2. Referencia-modellosztályok
Három referenciaosztályt rögzítünk. Mindegyikhez explicit K(\mathcal{M}) becslést rendelünk az általunk használt UTM-konvenció szerint. A pontos numerikus értékek nagyságrendi becslések; a §§3–7 strukturális eredményei csak a sorrendtől függenek, nem a pontos értékektől.
2.1 \mathcal{M}_1 — Standard Modell + általános relativitáselmélet
A jelenleg rendelkezésre álló, prediktív szempontból legpontosabb fizikai elmélet. Leírásához három összetevő szükséges:
Matematikai struktúra K_{\text{struct}}: a \text{SU}(3) \times \text{SU}(2) \times \text{U}(1) mértékcsoport, Lorentz-invariancia, renormalizálhatóság és az általános relativitáselmélet diffeomorfizmus-szimmetriája. Kolmogorov-komplexitás: K_{\text{struct}} \approx 10^3 bit.
Paraméterértékek K_{\text{param}}: 19 SM-szabad paraméter + 3 keveredési szög + 1 CP-fázis + \Lambda + G + c \approx 25, kísérleti pontossággal kódolt állandó (\sim 30 bit mindegyik): K_{\text{param}} \approx 750 bit.
Kezdeti feltételek K_{\text{IC}}: az inflációs paradigma szerint K_{\text{IC}}^{\text{inf}} \approx 200–400 bit. Megjegyzés: itt nem pontozzuk Penrose 10^{123}-es termodinamikai entrópia-korlátját, mert az a makroszkopikus fázistér térfogatát (S) méri, nem a specifikus algoritmikus Kolmogorov-komplexitást (K). A konkrét mikroállapot erősen tömöríthető lehet. Kizárólag a korrekt inflációs korlátokra támaszkodunk.
K(\mathcal{M}_1) = K_{\text{struct}} + K_{\text{param}} \approx 1750 \text{ bits}
K(\text{IC} \mid \mathcal{M}_1) \approx 300 \text{ bits (inflationary)}
2.2 \mathcal{M}_2 — Általános renormalizálható QFT
Az összes renormalizálható kvantumtérelmélet osztálya \leq 4 téridő-dimenzióban. Ez az osztály \mathcal{M}_1-et is tartalmazza mint egyik elemét. Mivel a mértékcsoportot és a részecsketartalmat is meg kell adni:
K(\mathcal{M}_2) \gg K(\mathcal{M}_1) \gg 1750 \text{ bits}
\mathcal{M}_2 ellenpontként szerepel az OPT azon állításához, hogy a törvények kiválasztódnak, nem pedig felsorolás útján adódnak. Jóllehet az MDL-összevetést \mathcal{M}_2-vel triviálisan megnyeri bármely véges alosztály (beleértve \mathcal{M}_1-et is), mivel K(\mathcal{M}_2) korlátlan, a beemelése formálisan annak demonstrálására szolgál, hogy a paraméterkiválasztási probléma végtelen léptékét a Stabilitási szűrő inherens módon omlasztja össze.
2.3 \mathcal{M}_3 — Boltzmann-agy / termikus fluktuáció
Standard fizika maximálisan egyszerű kezdeti feltételekkel: egy termikus (maximális entrópiájú) állapot a Planck-skálán. A törvények azonosak \mathcal{M}_1-gyel; a kezdeti feltételek triviálisan egyszerűek:
K(\mathcal{M}_3) \approx K(\mathcal{M}_1) \approx 1750 \text{ bits}, \qquad K(\text{IC} \mid \mathcal{M}_3) \approx 10 \text{ bits}
Mindazonáltal egy rendezett tudatos folyam y_{1:T} megfigyelésének log-likelihoodja \mathcal{M}_3 alatt csillagászatilag kicsi: L(y_{1:T} \mid \mathcal{M}_3) \approx K(y_{1:T}) \gg T \cdot C_{\max}. \mathcal{M}_3-nak így elhanyagolható az IC-költsége, viszont katasztrofális a likelihood-költsége; ezt azért vesszük fel, hogy megmutassuk: az OPT MDL-előnye nem ugyanazzal a trükkel valósul meg.
§3. Az OPT kódhossza — T-4a tétel
Az OPT MDL-kódhossza a következőképpen bontható fel:
L_T(\text{OPT}) = K(\xi, \text{Filter}) + L(y_{1:T} \mid \xi, \text{Filter}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)
ahol \xi^{\text{Filter}} a \xi Solomonoff-mérték a megfigyelő-kompatibilis \mathcal{O} osztályra kondicionálva (azok a streamek, amelyekre R_{\text{req}} \leq B_{\max} teljesül), és K_0 = K(\xi, \text{Filter}) a kiválasztási szabály leíráshossza.
T-4a tétel (A metaszabály komplexitási korlátja). K(\xi, \text{Filter}) = K_0 = \mathcal{O}(1) bit. Konkrétabban:
K_0 \leq K(\mathcal{U}) + K(C_{\max}) + K(\Delta t) + c
ahol K(\mathcal{U}) az UTM komplexitása, K(C_{\max}) = \mathcal{O}(\log C_{\max}) bit az experimental precisionnek megfelelő sávszélesség-küszöböt kódolja, K(\Delta t) = \mathcal{O}(\log \Delta t) a frissítési ablakot kódolja, és c egy kicsi univerzális konstans.
Bizonyítás. A \xi Solomonoff-mértéket az rögzített \mathcal{U} UTM egyértelműen meghatározza, ezért K(\xi \mid \mathcal{U}) = \mathcal{O}(1). A Stabilitási szűrő két paramétert igényel: C_{\max} és \Delta t, mindkettőt \sim 4 szignifikáns számjegy pontossággal mérve, így K(C_{\max}, \Delta t) \leq 2 \times (4 \times \log_2 10) \approx 26 bit. Az R_{\text{req}} \leq B_{\max} feltétel egyetlen egyenlőtlenség rögzített jelöléssel: \sim 10 bit. Összesen: K_0 \leq K(\mathcal{U}) + 36 bit.
Ahhoz, hogy K(\mathcal{U})-t méltányosan nyeljük el, fel kell tételeznünk egy „episztemikusan semleges” UTM-et — vagyis egy olyan referenciagépet, amelynek beépített utasításkészlete semmilyen fizikai elméletet nem kódol preferenciálisan (azaz egy alapvető kombinátor- vagy Brainfuck-ekvivalens geometriát, amely teljesen agnosztikus a fizikával szemben). Egy ilyen torzítatlan gép mellett érvényes az, hogy K(\xi, \text{Filter}) \approx 36 bit marad, miközben K(\mathcal{M}_1) \approx 1750 bit standardizált. Kifejezetten elismerjük, hogy ez az abszolút bitszámot sebezhetővé teszi egy \mathcal{O}(1) konstans skálázással szemben, ha az UTM megváltozik, ami azt jelenti, hogy a 36 vs 1750 számítás eleve relatív. Az itt strukturálisan őszinte matematikai állítás a rangsorolás (K_0 \ll K(\mathcal{M}_1)), amely a pontos numerikus konstanstól függetlenül egy robusztus strukturális előnyt állít. \blacksquare
Összehasonlítás: A megosztott UTM-többletköltséget kizárva K_0 \approx 36 bit, míg K(\mathcal{M}_1) \approx 1750 bit. Az OPT kiválasztási szabálya rövidebb, mint a Standard Modell leírása, mégpedig K(\mathcal{M}_1) - K_0 \approx 1714 bittel. Ez az a strukturális takarékossági előny, amelyre a preprint 5. §-a hivatkozik — immár explicit bitszámmal.
§4. A Solomonoff-dominancia korlátja — T-4b tétel
T-4b tétel (Solomonoff-dominancia korlátja). Bármely számítható fizikai mértékre \nu (beleértve \mathcal{M}_1, \mathcal{M}_2, \mathcal{M}_3) amelyre K(\nu) < \infty, valamint bármely y_{1:T} adatfolyamra:
L_T(\text{OPT}) \leq L_T(\nu) + K'_0
ahol K'_0 = K_0 + \log(1/\xi(\mathcal{O})). Ez az alapszabály komplexitását, valamint azt a szükséges algoritmikus normalizációs büntetést fejezi ki, amely az univerzális mértéknek a megfigyelőosztályra \mathcal{O} való kondicionálásából adódik.
Bizonyítás. A Solomonoff-mérték definíciójából (preprint, 1. egyenlet), ahol w_\nu \asymp 2^{-K(\nu)}:
\xi(y_{1:T}) \geq w_\nu \cdot \nu(y_{1:T}) \geq 2^{-K(\nu)} \cdot \nu(y_{1:T})
Negatív logaritmust véve:
-\log \xi(y_{1:T}) \leq -\log \nu(y_{1:T}) + K(\nu)
Amikor az univerzális \xi mértékről az \xi^{\text{Filter}} korlátozott szűrőre térünk át, megfizetjük a normalizációs költséget: -\log \xi^{\text{Filter}}(y) = -\log \xi(y) + \log(1/\xi(\mathcal{O})). Ezt behelyettesítve L_T(\text{OPT})-be:
L_T(\text{OPT}) = K_0 - \log \xi^{\text{Filter}}(y_{1:T}) \leq K_0 + \log(1/\xi(\mathcal{O})) + K(\nu) - \log \nu(y_{1:T}) = K'_0 + L_T(\nu) \qquad \blacksquare
Fontos megszorítás. A T-4b tétel nem azt mutatja meg, hogy az OPT felülteljesíti az SP-t. Azt mutatja meg, hogy az OPT legfeljebb K'_0 bittel lehet rosszabb bármely viszonyítási alapnál. A továbbiakban \log(1/\xi(\mathcal{O})) tagot beolvasztjuk K_0-ba, feltételezve, hogy a megfigyelői szekvenciák osztálya tisztán korlátozható a strukturális UTM-konstansokhoz viszonyítva, de ezt a normalizációs rést formális sérülékenységként megjegyezzük.
§5. A kezdeti feltételek tömörítése — T-4c tétel
Az OPT MDL-előnyének strukturális forrása a kezdeti feltételek tömörítése. A standard fizikában a törvények és a kezdeti feltételek külön objektumok, amelyeket egyaránt le kell írni. Az OPT-ben a kezdeti feltételek beépülnek a priorba: a Solomonoff-mérték már eleve a legegyszerűbb, megfigyelő-kompatibilis streameknek adja a legnagyobb súlyt, így egy külön IC-specifikáció redundánssá válik.
5.1 Az IC-redundancia érve
A standard fizika (\mathcal{M}_1) alatt egy determinisztikus elmélet teljes MDL-kódja:
L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) + 0 \qquad \text{[deterministic: } -\log P = 0 \text{ if consistent]}
Az IC-tag, K(\text{IC} \mid \text{laws}), a specifikus kezdeti feltételek leíráshossza a törvények adottsága mellett — nem vezethető le magukból a törvényekből. Itt található a finomhangolás helye.
OPT alatt a kétrészes kód:
L_T(\text{OPT}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)
A -\log \xi^{\text{Filter}}(y_{1:T}) tag a specifikus adatfolyamot kódolja a metaszabály adott volta mellett. A Solomonoff-prior már eleve magában foglalja a fizika univerzális modelljét: -\log \xi(y) \approx K(y). Az OPT-kódolásnak soha nem kell külön „megfizetnie” az IC-t.
T-4c sejtés (az IC-tömörítés heurisztikus korlátja). Definiáljuk az IC-tömörítési előnyt:
\Delta_{\text{IC}} = K(\text{IC} \mid \text{SP laws}) - K(\text{IC} \mid \text{OPT})
A következő heurisztikus korlát mellett érvelünk:
\boxed{L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1)}
ahol K(\text{IC} \mid \text{OPT}) := K(\text{IC} \mid \xi, \text{Filter}, \text{codec}) a kezdeti feltételek reziduális leíráshossza az OPT teljes modellje mellett. \Delta_{\text{IC}} \geq 0, egyenlőség pedig akkor és csak akkor áll fenn, ha a Stabilitási szűrő nem nyújt további tömörítést az IC-re azon túl, amit a törvények már eleve adnak.
Érv. Az SP teljes kétrészes kódjából kiindulva, és alkalmazva a Solomonoff-dominanciát (a normalizációs konstansokat egy \mathcal{O}(1) UTM-korláttagba nyelve el):
L_T(\text{OPT}) \leq K_0 + K(\text{laws}) + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) + \mathcal{O}(1)
Átrendezve, és behelyettesítve, hogy L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) (determinisztikus elmélet):
L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 + \mathcal{O}(1)
OPT-n belül a -\log \xi^{\text{Filter}}(y_{1:T})-nek nem kell külön-külön kódolnia az IC-t: a Szűrő a Solomonoff-priorból választ, amely a hosszsúlyozások révén inherensen tömöríti az IC-t. Az AIT szubadditivitása garantálja, hogy K(\text{IC} \mid x, f(x)) \leq K(\text{IC} \mid x) + \mathcal{O}(1). Ha azt posztuláljuk, hogy az OPT kiválasztási szabálya szorosabb leíró karakterláncként korlátoz, mint a nyers törvények egyszerű deklarálása (ami a keretrendszer központi tétele, nem pedig matematikai levezetéses bizonyítás), akkor a kódolt reziduális K(\text{IC} \mid \text{OPT}) nem haladhatja meg számottevően a K(\text{IC} \mid \text{laws}) értékét. Ez heurisztikusan \Delta_{\text{IC}} \geq 0-t eredményez.
Behelyettesítéssel: L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1). \blacksquare
Megjegyzés. Azt feltételezzük, hogy az antropikus tömörítés, K(\text{IC} \mid \text{OPT}) \approx 0, abban a határesetben működik, amikor a Stabilitási szűrő erősen megszorító, és matematikailag egyértelműen megfigyelő-kompatibilis állapotokra képez le. Ez egy motivált fizikai állítás, nem pedig algoritmikusan bizonyított egyértelműségi korlát.
§6. Állandó bites modellkomplexitási előny — T-4d tétel
T-4d tétel (Tartós állandó bites MDL-előny — tipikusság feltétele mellett). Minden rögzített, nem triviális, kiszámítható fizikai modellre \nu, amelyre K_0 < K(\nu) < \infty, az OPT-formuláció rögzített, tartós modellkomplexitási előnyt ér el, mégpedig kifejezetten minden olyan y_{1:T} \in \mathcal{O} esetén, amely egyben \nu-tipikus is. Ahogy a sorozathossz T \to \infty, a teljes kódhossz különbsége strukturálisan korlátos:
L_T(\text{OPT}) - L_T(\nu) \to K_0 - K(\nu)
Bizonyítás. T-4b alapján L_T(\text{OPT}) \leq K'_0 - \log \xi^{\text{Filter}}(y_{1:T}). Bármely kiszámítható \nu esetén Solomonoff tétele garantálja, hogy \xi pontosan a \nu-tipikus sorozatokon konvergál \nu-hoz: mértékelméleti értelemben a \nu-majdnem-minden y_{1:\infty} esetén. Itt fontos egy mély formális feszültséget megjegyezni: a Stabilitási szűrő olyan adatfolyamokat izolál, amelyek szigorúan alacsony entrópiájúként és strukturáltként értékelődnek, ezáltal strukturálisan atipikusnak minősülnek a standard, nem korlátozott, maximális entrópiájú \nu-mérték szerinti adatfolyamokhoz képest. Hacsak a szűrt megfigyelőosztály \mathcal{O} és a \nu-tipikus osztály között nincs igazolható, nem triviális matematikai átfedés, a Solomonoff-konvergencia határesete nem használható ki közvetlenül. Következésképpen ez a tétel feltételesen, akkor és csak akkor alkalmazható, ha az adott szűrt megfigyelői adatfolyam az adott referencia-törvények alatt továbbra is \nu-tipikus marad (miközben az ilyen, elméletileg kompatibilis metsző adatfolyamok halmaza formálisan továbbra sincs karakterizálva):
-\frac{1}{T} \log \xi(y_{1:T}) \to H(\nu) \quad \text{as } T \to \infty
ahol H(\nu) a \nu entrópiarátája. Hasonlóképpen, -\frac{1}{T} \log \nu(y_{1:T}) \to H(\nu). Aszimptotikusan az egy bitre jutó log-loss log-likelihood tagok konvergálnak és egyenlővé válnak, ami azt jelenti, hogy a fennmaradó teljes kódhossz-előny tisztán a modell leírási hosszára redukálódik:
\left[L_T(\text{OPT}) - L_T(\nu)\right] \to K_0 - K(\nu) < 0 \qquad \text{[mivel } K_0 \approx 36 \text{ míg } K(\nu) \sim 1750 \text{]}
Megjegyzés: Miközben a teljes kódhossz fenntartja ezt a tartós, rögzített bites előnyt, az egy bitre jutó előny (\frac{K_0 - K(\nu)}{T}) aktívan nullához zsugorodik. Ez nem az adatok felhalmozásán keresztül aszimptotikusan folyamatosan növekvő előnyt jelent, hanem inkább egy tartós, merev strukturális eltolást. \blacksquare
Numerikus becslés \mathcal{M}_1 esetére: K(\mathcal{M}_1) - K_0 \approx 1714 bit. Miután a log-loss likelihoodok kellően hosszú, \nu-tipikus megfigyelési ablakokon konvergálnak, az OPT körülbelül 1714 bitnyi tartós matematikai fölényt tart fenn a teljes kódolásban.
§7. A véges-T feltételes előny — T-4e tétel
Véges hosszúságú streamek esetén az MDL-összehasonlítás megköveteli, hogy a T-4c IC-tömörítési előnye meghaladja a K_0 többletet.
T-4e tétel (Véges-T feltételes MDL-előny). Az OPT szigorú véges-T MDL-előnyt ér el \mathcal{M}_1-gyel szemben — azaz L_T(\text{OPT}) < L_T(\mathcal{M}_1) — akkor és csak akkor, ha a következő feltétel teljesül:
\boxed{K(\text{IC} \mid \text{SP laws}) > K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y_{1:T}) - \left(-\log P_{\text{SP}}(y_{1:T})\right)\right]}
A jobb oldali zárójeles tag az OPT log-likelihood-hiánya az SP-hez képest az adott y_{1:T} streamen. A feltétel akkor teljesül, amikor az IC leírási költsége meghaladja a metaszabály és az OPT ezen a streamen mutatott predikciós hiányának együttes többletét.
Bizonyítás. A két részből álló kódhosszak közvetlen átalakítása:
L_T(\text{OPT}) < L_T(\text{SP}) \iff \quad K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) - \log \xi^{\text{Filter}}(y) < K_{\text{laws}} + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) \iff \quad K(\text{IC} \mid \text{laws}) - K_0 > \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] + \left[K_{\text{laws}} - K_{\text{laws}}\right]
Átrendezve (K_{\text{laws}} mindkét oldalon kiesik) közvetlenül adódik a kimondott feltétel. \blacksquare
7.1 A standard kozmológiára vonatkozó feltétel értékelése
Az inflációs kódolás alatt (az SP szempontjából legkedvezőbb esetben):
- K(\text{IC} \mid \text{SP laws}) \approx 300 bit (inflációs paraméterek + e-fold szám + újramelegedés)
- K_0 \approx 36 bit (T-4a)
- A log-likelihood hiány: Funkcionális hipotézisként feltételezzük, hogy az OPT, a T-1-ben leképezett R_{T,h}(D) kodekkorlátokkal felszerelve, egy megfigyelő-kompatibilis streamen legalább olyan robusztus pontonkénti log-likelihoodot ér el, mint a standard fizika. Megjegyzendő, hogy a Solomonoff-korlátok szigorúan véve csak a várt összegek feletti dominanciát adják, nem pedig definitív pontonkénti korlátokat konkrét egyedi streamekre; ezért a \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] \leq 0 egy empirikus strukturális várakozást fejez ki, nem algoritmikus garanciát.
Ezért a feltétel arra redukálódik, hogy K(\text{IC} \mid \text{SP laws}) > K_0, azaz 300 > 36. Ez jelentős strukturális ráhagyással teljesül. A feltétel csak akkor bukik meg, ha az IC költsége kevesebb mint \sim 36 bit — vagyis ha a mi univerzumunk konkrét IC-je strukturálisan levezethető pusztán az SP törvényeiből úgy, hogy 36-nál kevesebb reziduális bit marad. Jelenleg egyetlen kozmológiai modell sem éri ezt el.
§8. Az összehasonlító MDL-táblázat
| Modell | K(\mathcal{M}) (bit) | K(\text{IC}\mid\mathcal{M}) (bit) | -\log P(y\mid\mathcal{M}) | L_T összesen | MDL-rangsor |
|---|---|---|---|---|---|
| \mathcal{M}_1 — SM + GR | \sim 1750 | \sim 300 (inflációs) | \sim 0 (determinisztikus) | \sim 2050 | 2. (inflációs) |
| \mathcal{M}_3 — Boltzmann | \sim 1750 | \sim 10 | \gg 0 (ritka folyam) | \gg 1760 | Utolsó (katasztrofális likelihood) |
| \mathcal{M}_{\text{OPT}} — OPT | \sim 36 | \sim 0 (feltételes, az erősen korlátozott Szűrőn keresztül) | \sim 0^* (determinisztikus kodek-közelítés) | \sim 36 (feltételes) | 1. (feltételes) |
^* A §9.2-ben adott explicit kodekazonosítás mellett az OPT aktív adatterme -\log P_{K_\theta}(y) = -\log P_\text{SP}(y) = 0-ra redukálódik, amint K_\theta az SP-kodekkel azonosításra kerül.
§9. Az összehasonlítás korlátai
9.1 A K(y \mid \text{Filter}) nem számítható ki
Az OPT kódhossza, K_0 + K(y \mid \text{Filter}) = K_0 - \log \xi^{\text{Filter}}(y), tartalmaz egy olyan tagot, amely Turing-értelemben nem számítható ki (a megállási probléma megakadályozza \xi pontos kiszámítását). A gyakorlatban az OPT előrejelzéseit egy véges K_\theta kodekkel kell közelíteni — ami a fizikában bevett eljárás. Ez azt jelenti, hogy prediktív célokra az OPT a legjobb elérhető, kiszámítható kodekre redukálódik. Az OPT MDL-előnye az SP-vel szemben ezért strukturális előny (a kiválasztási szabály leírásában), nem pedig operatív előny új előrejelzések létrehozásában.
Ez nem hiba — éppen ez a preprint állításának helyes formális tartalma: „az OPT az értelmező teher egy részét a törvények felsorolásáról a törvények kiválasztására helyezi át.” Az eltolódás valós és formálisan számszerűsített (\approx 1700 bit a kiválasztási szabály esetén, szemben a \mathcal{M}_1-gyel), de nem hoz létre új prediktív tartalmat azon felül, amit a kodek már eleve biztosít.
9.2 A kodek azonosításának problémája
Az OPT-kodek K_\theta az a specifikus kiszámítható mérték \mathcal{M}-ből, amelyet a Stabilitási szűrő kiválaszt. A T-4 nem határozza meg, hogy ez pontosan melyik mérték — ennek azonosításához a T-5-re (az állandók visszanyerésére) és a teljes fizikai egyesítési programra van szükség. Amíg K_\theta nincs kifejezetten azonosítva az SM + GR-rel, addig az MDL-összehasonlítás ezen azonosítás feltételéhez kötött. A formális korlát L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 garantálja, hogy az OPT nem teljesíthet rosszabbul, mint az SP, de nem garantálja, hogy véges idő alatt jobban is teljesít, hacsak a T-4e IC-feltétele nem teljesül — ami standard kozmológiai feltevések mellett teljesül.
Megkötés a P-2-ből. A P-2 függelék (Hilbert-tér beágyazása kvantumhiba-korrekción keresztül) megállapítja, hogy lokális zaj mellett a kodeknek meg kell felelnie a QECC-struktúrának — belső reprezentációjának egy meghatározott (n, k, d) paraméterekkel rendelkező kvantumhiba-javító kódot kell alkotnia. Ez szűkíti a kodek azonosításának problémáját: K_\theta többé nem egy tetszőleges kiszámítható mérték, hanem olyan, amelynek prediktív állapotai egy Hilbert-tér hibajavító geometriáját hordozzák. Ez a megkötés megelőzi a T-5 állandó-visszanyerési programját, és további szelekciós kritériumokat adhat K_\theta Standard Modellel való azonosításához.
§10. Záró összefoglaló
T-4 teljesítendők — megerősítetten lezárva (normalizálási és tipikussági feltételekkel)
A kódolási konvenciók rögzítve (§1). Kétrészes MDL, prefix Kolmogorov-komplexitás egy inkluzív rögzített UTM-hez viszonyítva, amely a adattartományt funkcionálisan a tudatos folyamra képezi le: y_{1:T} = z_{0:T}.
A benchmarkosztályok rögzítve (§2). \mathcal{M}_1-et (SM+GR) értékeli olyan triviális határokkal szemben, mint \mathcal{M}_2 (a generatív hatókörparaméter-választás felrobbanása) és \mathcal{M}_3 (Boltzmann-féle valószínűségi összeomlás).
T-4a (Meta-szabály komplexitása). K(\xi, \text{Filter}) = K_0 \approx 36 bit, beleértve a relatív UTM-eltolásokat.
T-4b (Solomonoff korlátos). L_T(\text{OPT}) \leq L_T(\nu) + K_0 + \log(1/\xi(\mathcal{O})). Explicit módon definiálja az algoritmikus normalizálási büntetőparamétert.
T-4c sejtés (IC-tömörítési heurisztikus korlát). A strukturális kezdetifeltétel-redundancia a tömörítés feltételezett motorja: \Delta_{\text{IC}} = K(\text{IC}\mid\text{SP}) - K(\text{IC}\mid\text{OPT}) \geq 0, bár a leképezés egyértelműsége csak feltételesen áll fenn. Ez heurisztikus korlátként szolgál, nem formálisan bizonyított tételként.
T-4d (Konstansbites modell-előny). Feltételesen korlátozza a határeseti viselkedést: olyan kiszámítható benchmarkok esetén, amelyeknél a \nu-tipikus osztály nem triviálisan átfed \mathcal{O}-val, az OPT tartós numerikus komplexitáselőnyt biztosít (\sim -1714 bit), noha végtelen per-bites sűrűsége nullára skálázódik.
T-4e (Véges-T előny — feltételes). Az OPT véges T mellett numerikusan azonos módon felülmúlja \mathcal{M}_1-et, amennyiben az empirikus pontonkénti veszteségek nem írják felül a központi K(\text{IC}\mid\text{SP}) > K_0 strukturális határt (300 > 36). A sebezhetőséget közvetlenül az algoritmikus pontonkénti dominanciafeltevésekre összpontosítja.
Az MDL-állítás cáfolati feltételei
- A kozmológiai kezdeti feltételek levezetése pusztán az SP-törvényekből kevesebb mint \sim 36 bitben — megmutatva, hogy K(\text{IC} \mid \text{SP laws}) < K_0.
- Annak kimutatása, hogy a Stabilitási szűrő megfigyelő-kompatibilis folyamokra való korlátozása nem tömöríti az IC-t — azaz K(\text{IC} \mid \xi, \text{Filter}) = K(\text{IC} \mid \text{laws}), amiből \Delta_{\text{IC}} = 0 következik.
- Egy explicit, kiszámítható OPT-beli K_\theta kodek megadása, amely bizonyíthatóan kevésbé pontos, mint az SM+GR a megfigyelői folyamokon, úgy, hogy a log-likelihood-hiány meghaladja az IC-tömörítés nyereségét.
További függőségek
- T-5 (Konstansok visszanyerése) a következő lényegi lépés: amint a K_\theta kodeket T-1/T-2/T-3 révén az SM+GR törvényeivel azonosítjuk, az MDL-összehasonlítás teljesen explicitté válik, és a T-4e-ben szereplő feltételesség ismert mennyiségek közötti konkrét egyenlőtlenséggé alakul.
- Preprint §5.2 frissítés: a „Whether this meta-rule yields an actual MDL advantage… is an open comparative question” kifejezés most így frissíthető: „A T-4d tétel egy feltételes aszimptotikus előnyt állapít meg (olyan megfigyelői folyamokra, amelyek egyben a benchmarkfizika alatt \nu-tipikusak is, egy jelenleg még nem jellemzett halmazon); a T-4e tétel egy feltételes véges-T előnyt állapít meg; lásd a T-4 függeléket.”
Ez a függelék az OPT projekt repozitóriumának részeként kerül karbantartásra a theoretical_roadmap.pdf mellett. Hivatkozások: Rissanen (1978) [12], Li & Vitányi (2008) [27], Solomonoff (1964) [11], Penrose (2004).