Kenningin um raðaðan patch (OPT)
Viðauki T-4: MDL / samanburður á sparsni
v2.0.0 — 2. apríl 2026 | DOI: 10.5281/zenodo.19300777
Upprunalegt verkefni T-4: MDL / samanburður á sparsni Vandamál: Virka forprentið heldur því fram að OPT sé sparneytnara en staðlað eðlisfræði með því að líta á eðlislögmál sem stórsæjar þjöppunarreiknirit, en leggur ekki fram formlegan MDL-samanburð. Afhending: Samanburðargreining á MDL fyrir OPT gagnvart viðmiðunarklösum eðlisfræðilíkana undir skýrt skilgreindum kóðunarskilmálum.
Lokunarstaða: LOKAÐ (með fyrirvara um dæmigerðni og IC-normaliseringu). Þessi viðauki setur fram það formlega MDL-mat sem T-4 krafðist. Þrír viðmiðunarklasar líkana eru festir með skýrt skilgreindum kóðunarskilmálum. Fjórar setningar og ein tilgáta eru settar fram: (T-4a) valregla OPT hefur lýsingarlengd af stærðargráðunni \mathcal{O}(1); (T-4b) yfirráð Solomonoffs setja efri mörk á log-tap OPT; (Tilgáta T-4c) hin áætlaða uppspretta formgerðarlegs forskots OPT er þjöppun upphafsskilyrða; (T-4d) OPT nær varanlegu forskoti í líkanflækju sem nemur föstum fjölda bita umfram hvert reiknanlegt viðmiðunarlíkan; (T-4e) forskotið fyrir endanlegt T er magngreint með skilyrðum. Lokunin hvílir á þremur burðarskilyrðum: dæmigerðni straums athugandans, innfellingu normaliseringarrefsingar Solomonoffs \log(1/\xi(\mathcal{O})), og stöðu K(\text{IC} \mid \text{SP}) > K_0.
§1. Festing MDL-kóðunarvenja
MDL-samanburður er merkingarlaus án skýrra, fastra kóðunarvenja. §5.1 í forprentinu nefnir þessa kröfu en frestar henni. Hér festum við venjurnar í samræmi við Rissanen (1978) [12] og tvíþætta MDL-ramma Li & Vitányi (2008) [27].
1.1 Tvíþætt kóðalengd
Fyrir tilgátuflokk \mathcal{M} og athuganarunu y_{1:T} \in \{0,1\}^* er tvíþætta MDL-kóðalengdin:
L_T(\mathcal{M}) = K(\mathcal{M}) + L(y_{1:T} \mid \mathcal{M}) \tag{preprint §5.1, Eq. 13}
þar sem K(\mathcal{M}) er forskeytt Kolmogorov-flækjustig tilgátunnar — lengd stysta sjálfafmarkandi forritsins á fastri algildri Turing-vél (UTM) sem skilar fullkominni lýsingu á \mathcal{M} — og L(y_{1:T} \mid \mathcal{M}) er neikvæða log-líkindið fyrir gögnin undir besta forspárlíkani \mathcal{M}:
L(y_{1:T} \mid \mathcal{M}) = -\log_2 P_\mathcal{M}(y_{1:T})
Fyrir ákvörðuð fræði (lögmál + IC ákvarða athuganir ótvírætt) gildir að L(y_{1:T} \mid \mathcal{M}) = 0 þegar y er samræmanlegt fræðunum, en L = \infty annars. Allir logra eru með grunntöluna 2; allar kóðalengdir eru í bitum.
1.2 Algilda vélin
Við föstum eina bestu UTM-vél \mathcal{U} í gegnum allt verkið. Allar Kolmogorov-flækjur eru miðaðar við \mathcal{U}; niðurstöður breytast um mest \mathcal{O}(1) bita við annað val á UTM. Mæling Solomonoffs \xi er skilgreind miðað við \mathcal{U} (forprent jöfnu 1). Þetta festir venjuna fyrir allan samanburð sem á eftir kemur.
1.3 Umfang y_{1:T}
Við berum saman líkön á því sviði sem hvert þeirra var hannað til að spá fyrir um: meðvitaðan straum athugandans y_{1:T} = z_{0:T} (röð þjappaðra duldra ástanda, C_{\max} bitar á sekúndu yfir T sekúndur). Stöðluð eðlisfræði er metin á sama sviði með því að draga spár hennar niður í straum sem er samrýmanlegur athuganda með grófkornun. Báðar kenningar eru beðnar um að skýra nákvæmlega sömu athuganir.
§2. Viðmiðunarlíkanaflokkar
Þrír viðmiðunarflokkar eru festir. Hverjum þeirra er úthlutað skýru mati á K(\mathcal{M}) samkvæmt UTM-skilgreiningu okkar. Nákvæm tölugildi eru stærðargráðumat; formgerðarniðurstöðurnar í §§3–7 ráðast aðeins af röðuninni, ekki nákvæmum gildum.
2.1 \mathcal{M}_1 — Staðlaða líkanið + almenn afstæðiskenning
Sú eðlisfræðikenning sem nú er tiltæk og hefur mesta forspárnákvæmni. Lýsing hennar krefst þriggja þátta:
Stærðfræðileg formgerð K_{\text{struct}}: mæligrúppan \text{SU}(3) \times \text{SU}(2) \times \text{U}(1), Lorentz-óbreytileiki, endurstaðlanleiki og diffeómorfíusamhverfa almennrar afstæðiskenningar. Kolmogorov-flækjustig: K_{\text{struct}} \approx 10^3 bitar.
Stikagildi K_{\text{param}}: 19 frjálsir stikar SM + 3 blöndunarhorn + 1 CP-fasi + \Lambda + G + c \approx 25 fastar kóðaðar með tilraunanákvæmni (\sim 30 bitar hver): K_{\text{param}} \approx 750 bitar.
Upphafsskilyrði K_{\text{IC}}: innan verðgubólguhugmyndarinnar er K_{\text{IC}}^{\text{inf}} \approx 200–400 bitar. Athugið: Við metum ekki varmafræðileg entropíumörk Penrose, 10^{123}, hér vegna þess að þau mæla stórsæja rúmmál fasa-rýmis (S), en ekki sértæka algrímslega Kolmogorov-flækju (K). Hið sértæka örástand getur verið mjög þjappanlegt. Við styðjumst eingöngu við heiðarleg verðgubólgumörk.
K(\mathcal{M}_1) = K_{\text{struct}} + K_{\text{param}} \approx 1750 \text{ bitar}
K(\text{IC} \mid \mathcal{M}_1) \approx 300 \text{ bitar (verðgubólga)}
2.2 \mathcal{M}_2 — Almenn endurstaðlanleg skammtasviðakenning
Flokkur allra endurstaðlanlegra skammtasviðakenninga í \leq 4 rúmtímavíddum. Þessi flokkur inniheldur \mathcal{M}_1 sem eitt stak. Þar sem einnig þarf að tilgreina mæliflokka og agnainnihald:
K(\mathcal{M}_2) \gg K(\mathcal{M}_1) \gg 1750 \text{ bitar}
\mathcal{M}_2 er tekin með sem andstæða við þá fullyrðingu OPT að lögmál séu valin, ekki talin upp. Þótt MDL-samanburðurinn við \mathcal{M}_2 vinnist með augljósum hætti af sérhverjum endanlegum undirflokki (þar á meðal \mathcal{M}_1), vegna þess að K(\mathcal{M}_2) er ótakmarkað, þjónar innsetning hennar því formlega hlutverki að sýna fram á hinn óendanlega kvarða þess vandamáls sem felst í vali stika og sem Stöðugleikasía fellir innbyggt saman.
2.3 \mathcal{M}_3 — Boltzmann-heili / varmasveifla
Stöðluð eðlisfræði með upphafsskilyrðum sem eru eins einföld og hugsast getur: varmaástand (hámarksendurófsástand) á Planck-kvarða. Lögmálin eru þau sömu og í \mathcal{M}_1; upphafsskilyrðin eru á hinn bóginn frumstætt einföld:
K(\mathcal{M}_3) \approx K(\mathcal{M}_1) \approx 1750 \text{ bits}, \qquad K(\text{IC} \mid \mathcal{M}_3) \approx 10 \text{ bits}
Hins vegar er log-líkindi þess að athuga skipulagðan meðvitaðan straum y_{1:T} undir \mathcal{M}_3 stjarnfræðilega lítil: L(y_{1:T} \mid \mathcal{M}_3) \approx K(y_{1:T}) \gg T \cdot C_{\max}. \mathcal{M}_3 hefur því hverfandi kostnað í IC en skelfilegan líkindakostnað, og er tekin með til að sýna að MDL-forskot OPT næst ekki með sama bragði.
§3. Kóðalengd OPT — Setning T-4a
MDL-kóðalengd OPT sundrast sem:
L_T(\text{OPT}) = K(\xi, \text{Filter}) + L(y_{1:T} \mid \xi, \text{Filter}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)
þar sem \xi^{\text{Filter}} er mæling Solomonoffs \xi skilyrt á athuganda-samhæfa flokknum \mathcal{O} (straumar sem uppfylla R_{\text{req}} \leq B_{\max}), og K_0 = K(\xi, \text{Filter}) er lýsingarlengd valreglunnar.
Setning T-4a (Efri mörk á flækju metareglu). K(\xi, \text{Filter}) = K_0 = \mathcal{O}(1) bitar. Nánar tiltekið:
K_0 \leq K(\mathcal{U}) + K(C_{\max}) + K(\Delta t) + c
þar sem K(\mathcal{U}) er flækja UTM, K(C_{\max}) = \mathcal{O}(\log C_{\max}) bitar táknar bandbreiddarþröskuldinn með tilraunanákvæmni, K(\Delta t) = \mathcal{O}(\log \Delta t) táknar uppfærslugluggann, og c er lítill algildur fasti.
Sönnun. Mæling Solomonoffs \xi ræðst ótvírætt af föstu UTM-vélinni \mathcal{U}, þannig að K(\xi \mid \mathcal{U}) = \mathcal{O}(1). Stöðugleikasían krefst tveggja stika: C_{\max} og \Delta t, hvort tveggja mælt með \sim 4 marktækum tölustöfum, svo K(C_{\max}, \Delta t) \leq 2 \times (4 \times \log_2 10) \approx 26 bitar. Skilyrðið R_{\text{req}} \leq B_{\max} er ein stök ójafna í fastri táknun: \sim 10 bitar. Samtals: K_0 \leq K(\mathcal{U}) + 36 bitar.
Til að innlima K(\mathcal{U}) á sanngjarnan hátt verðum við að gera ráð fyrir „þekkingarfræðilega hlutlausri“ UTM — það er viðmiðunarvél þar sem innbyggt skipanasafn kóðar enga eðlisfræðikenningu með forgangi (þ.e. grunnhneppi eða Brainfuck-jafngilda rúmfræði, fullkomlega óháða eðlisfræði). Undir slíkri óhlutdrægri vél er réttmætt að viðhalda K(\xi, \text{Filter}) \approx 36 bitum á meðan K(\mathcal{M}_1) \approx 1750 bitar er staðlað. Við viðurkennum sérstaklega að þetta gerir algilda bitafjöldann viðkvæman fyrir \mathcal{O}(1) fastaskölun ef UTM er breytt, sem þýðir að útreikningurinn 36 á móti 1750 er í eðli sínu afstæður. Stærðfræðilega heiðarlega fullyrðingin hér er röðunin eftir stærð (K_0 \ll K(\mathcal{M}_1)), sem staðhæfir traust formgerðarlegt forskot óháð nákvæmum tölulegum fasta. \blacksquare
Samanburður: Að frátöldum sameiginlegum UTM-yfirbyggingarkostnaði er K_0 \approx 36 bitar á móti K(\mathcal{M}_1) \approx 1750 bitum. Valregla OPT er styttri en lýsing Staðallíkansins um K(\mathcal{M}_1) - K_0 \approx 1714 bita. Þetta er það formgerðarlega sparnaðarforskot sem haldið er fram í §5 í forprentinu — nú með skýrum bitafjölda.
§4. Yfirburðamörk Solomonoffs — Setning T-4b
Setning T-4b (Yfirburðamörk Solomonoffs). Fyrir sérhvern reiknanlegan eðlisfræðilegan mæli \nu (þar með talið \mathcal{M}_1, \mathcal{M}_2, \mathcal{M}_3) með K(\nu) < \infty, og fyrir sérhvern gagnastraum y_{1:T}:
L_T(\text{OPT}) \leq L_T(\nu) + K'_0
þar sem K'_0 = K_0 + \log(1/\xi(\mathcal{O})). Þetta táknar grunnflækju reglunnar að viðbættri þeirri nauðsynlegu algrímslegu normaliseringarrefsingu sem hlýst af því að skilyrða algildu hálfmælinguna á flokk athugenda \mathcal{O}.
Sönnun. Af skilgreiningu Algildrar hálfmælingar Solomonoffs (jöfnu forprentunar 1), með w_\nu \asymp 2^{-K(\nu)}:
\xi(y_{1:T}) \geq w_\nu \cdot \nu(y_{1:T}) \geq 2^{-K(\nu)} \cdot \nu(y_{1:T})
Með því að taka neikvæða logra:
-\log \xi(y_{1:T}) \leq -\log \nu(y_{1:T}) + K(\nu)
Þegar farið er frá algildu hálfmælingunni \xi yfir í takmörkuðu síuna \xi^{\text{Filter}}, greiðum við normaliseringarkostnaðinn -\log \xi^{\text{Filter}}(y) = -\log \xi(y) + \log(1/\xi(\mathcal{O})). Setjum þetta inn í L_T(\text{OPT}):
L_T(\text{OPT}) = K_0 - \log \xi^{\text{Filter}}(y_{1:T}) \leq K_0 + \log(1/\xi(\mathcal{O})) + K(\nu) - \log \nu(y_{1:T}) = K'_0 + L_T(\nu) \qquad \blacksquare
Mikilvægur fyrirvari. Setning T-4b sýnir ekki að OPT standi sig betur en SP. Hún sýnir að OPT getur ekki staðið sig verr en neitt viðmið um meira en K'_0 bita. Héðan í frá fellum við \log(1/\xi(\mathcal{O})) inn í K_0 með því að gera ráð fyrir að flokkur athugandaraða sé hreinlega afmarkaður miðað við formgerðarfastana í UTM, en tökum fram þetta normaliseringarbil sem formlegan veikleika.
§5. Þjöppun upphafsskilyrða — Setning T-4c
Formgerðarleg uppspretta MDL-forskots OPT er þjöppun upphafsskilyrða. Í hefðbundinni eðlisfræði eru lögmálin og upphafsskilyrðin aðskildir hlutir sem báðum þarf að lýsa. Í OPT eru upphafsskilyrðin gleypt inn í fyrirframdreifinguna: mæling Solomonoffs úthlutar þegar mestu vægi til einföldustu athugandasamhæfu straumanna, sem gerir sérstaka IC-tilgreiningu óþarfa.
5.1 Rökin um offramsetningu IC
Samkvæmt staðlaðri eðlisfræði (\mathcal{M}_1) er fullt MDL-kóðamál fyrir ákvörðuð kenningu:
L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) + 0 \qquad \text{[ákvörðuð: } -\log P = 0 \text{ ef samræmi er fyrir hendi]}
IC-liðurinn K(\text{IC} \mid \text{laws}) er lýsingarlengd hinna sértæku upphafsskilyrða að gefnum lögmálunum — hann er ekki afleiðanlegur af lögmálunum sjálfum. Hér liggur fínstillingin.
Samkvæmt OPT er tvíþætti kóðinn:
L_T(\text{OPT}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)
Liðurinn -\log \xi^{\text{Filter}}(y_{1:T}) kóðar hinn sértæka straum að gefinni metareglu. Solomonoff-forgangsdreifingin felur þegar í sér algilt líkan af eðlisfræði: -\log \xi(y) \approx K(y). OPT-kóðunin þarf aldrei að greiða sérstaklega fyrir IC.
Tilgáta T-4c (leiðsagnarmörk fyrir IC-þjöppun). Skilgreinum þjöppunarforskot IC:
\Delta_{\text{IC}} = K(\text{IC} \mid \text{SP laws}) - K(\text{IC} \mid \text{OPT})
Við færum rök fyrir eftirfarandi leiðsagnarmörkum:
\boxed{L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1)}
þar sem K(\text{IC} \mid \text{OPT}) := K(\text{IC} \mid \xi, \text{Filter}, \text{codec}) er leifarlýsingarlengd upphafsskilyrðanna að gefnu fullu líkani OPT. \Delta_{\text{IC}} \geq 0, með jöfnu aðeins þá og því aðeins að Stöðugleikasía veiti enga viðbótarþjöppun á IC umfram það sem lögmálin gefa þegar.
Röksemd. Byrjum á fullum tvíþættum kóða fyrir SP og beitum yfirráðum Solomonoffs (með því að gleypa normunarfastana inn í \mathcal{O}(1) UTM-mörkunarlið):
L_T(\text{OPT}) \leq K_0 + K(\text{laws}) + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) + \mathcal{O}(1)
Endurröðum og setjum inn L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) (ákvörðuð kenning):
L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 + \mathcal{O}(1)
Innan OPT þarf -\log \xi^{\text{Filter}}(y_{1:T}) ekki að kóða IC sérstaklega: Sían velur úr Solomonoff-forgangsdreifingunni, sem þjappar IC innbyggt með lengdarvigtunum. Undirsamlagning í AIT tryggir að K(\text{IC} \mid x, f(x)) \leq K(\text{IC} \mid x) + \mathcal{O}(1). Ef við gefum okkur að valregla OPT afmarkist sem þéttari lýsandi strengur en það eitt að lýsa yfir hráum lögmálum (sem er kjarnaáhætta rammans, en ekki stærðfræðileg afleiðslusönnun), þá getur leifarkóðað K(\text{IC} \mid \text{OPT}) ekki farið marktækt fram úr K(\text{IC} \mid \text{laws}). Það gefur leiðsagnarkennt \Delta_{\text{IC}} \geq 0.
Með innsetningu fæst: L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1). \blacksquare
Athugasemd. Við setjum fram þá tilgátu að mannhverf þjöppun K(\text{IC} \mid \text{OPT}) \approx 0 virki í markgildinu þar sem Stöðugleikasía er mjög þrengjandi og varpar stærðfræðilega á ótvírætt athugandasamrýmanleg ástand. Þetta er rökstudd eðlisfræðileg tillaga fremur en reikniritalega sannað ótvíræðnimark.
§6. Kostur líkansflækju með föstum bita — Setning T-4d
Setning T-4d (Varanlegur MDL-kostur með föstum bita — með fyrirvara um dæmigerðni). Fyrir hvert fast, ekki-þýðingarlaust reiknanlegt eðlisfræðilíkan \nu með K_0 < K(\nu) < \infty nær framsetning OPT fram föstum, varanlegum yfirburðum í líkansflækju, nánar tiltekið fyrir sérhvert y_{1:T} \in \mathcal{O} sem er jafnframt \nu-dæmigert. Þegar lengd rununnar T \to \infty, er mismunur heildarkóðalengdar bundinn af formgerð:
L_T(\text{OPT}) - L_T(\nu) \to K_0 - K(\nu)
Sönnun. Af T-4b leiðir að L_T(\text{OPT}) \leq K'_0 - \log \xi^{\text{Filter}}(y_{1:T}). Fyrir sérhvert reiknanlegt \nu tryggir setning Solomonoffs að \xi samleitist að \nu nákvæmlega á \nu-dæmigerðum runum: mælt sem \nu-næstum-öll y_{1:\infty}. Hér ber að taka eftir djúpri formlegri spennu: Stöðugleikasían einangrar strauma sem metast strangt tekið sem lág-óreiðukenndir og formgerðir, og kortleggur þá þar með sem formlega ódæmigerða miðað við staðlaða, ótakmarkaða hámarksentropíu-strauma undir \nu-mæli. Nema síaði flokkur athugenda \mathcal{O} og flokkur \nu-dæmigerðra runa hafi sýnanlega, ekki-þýðingarlausa stærðfræðilega skörun, er ekki unnt að nýta samleitimörk Solomonoffs með beinum hætti. Þar af leiðandi gildir þessi setning skilyrt þá og því aðeins að hinn tiltekni síaði athugandastraumur haldist \nu-dæmigerður undir hinum tilteknu viðmiðunarlögmálum (og skilur mengi slíkra fræðilega samrýmanlegra skörunarstrauma eftir formlega óeinkennt):
-\frac{1}{T} \log \xi(y_{1:T}) \to H(\nu) \quad \text{as } T \to \infty
þar sem H(\nu) er óreiðuhraði \nu. Á sama hátt gildir að -\frac{1}{T} \log \nu(y_{1:T}) \to H(\nu). Aðfellanlega samleita og jafnast liðirnir fyrir log-loss/log-líkindin á hvern bita, sem merkir að sá kostur sem eftir stendur í heildarkóðalengd einangrast hreint til lýsingarlengdar líkansins:
\left[L_T(\text{OPT}) - L_T(\nu)\right] \to K_0 - K(\nu) < 0 \qquad \text{[þar sem } K_0 \approx 36 \text{ á móti } K(\nu) \sim 1750 \text{]}
Athugið: Þótt heildarkóðalengdin viðhaldi þessum varanlega fasta bita-kosti, þá minnkar kosturinn á hvern bita (\frac{K_0 - K(\nu)}{T}) virkt niður í núll. Þetta felur ekki í sér að kosturinn vaxi stöðugt aðfellanlega með uppsöfnun gagna, heldur fremur varanlegt, stíft formgerðarfrávik. \blacksquare
Tölulegt mat fyrir \mathcal{M}_1: K(\mathcal{M}_1) - K_0 \approx 1714 bitar. Þegar log-loss-líkindin hafa samleitið yfir nægilega langa \nu-dæmigerða athugunarglugga, viðheldur OPT varanlegum stærðfræðilegum yfirburðum í heildarkóðun upp á um það bil 1714 bita.
§7. Skilyrt forskot fyrir endanlegt-T — Setning T-4e
Fyrir strauma af endanlegri lengd krefst MDL-samanburðurinn þess að IC-þjöppunarforskot T-4c fari fram úr yfirbyggingunni K_0.
Setning T-4e (Skilyrt MDL-forskot fyrir endanlegt-T). OPT nær ströngu MDL-forskoti fyrir endanlegt-T gagnvart \mathcal{M}_1 — það er, L_T(\text{OPT}) < L_T(\mathcal{M}_1) — þá og því aðeins að eftirfarandi skilyrði gildi:
\boxed{K(\text{IC} \mid \text{SP laws}) > K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y_{1:T}) - \left(-\log P_{\text{SP}}(y_{1:T})\right)\right]}
Hornklofinn á hægri hlið er log-líkindahallinn hjá OPT miðað við SP fyrir hinn tiltekna straum y_{1:T}. Skilyrðið er uppfyllt hvenær sem lýsingarkostnaður IC er meiri en samanlögð yfirbygging meta-reglunnar og forspárhalli OPT á þessum straumi.
Sönnun. Bein meðhöndlun á lengdum tveggja hluta kóðunarinnar:
L_T(\text{OPT}) < L_T(\text{SP}) \iff \quad K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) - \log \xi^{\text{Filter}}(y) < K_{\text{laws}} + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) \iff \quad K(\text{IC} \mid \text{laws}) - K_0 > \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] + \left[K_{\text{laws}} - K_{\text{laws}}\right]
Með endurröðun (þar sem K_{\text{laws}} fellur út báðum megin) fæst hið framsetta skilyrði beint. \blacksquare
7.1 Mat á skilyrðinu fyrir staðlaða heimsfræði
Undir verðbólgukóðuninni (hagstæðasta tilvikið fyrir SP):
- K(\text{IC} \mid \text{SP laws}) \approx 300 bitar (verðbólgustikar + fjöldi e-falda + endurhitun)
- K_0 \approx 36 bitar (T-4a)
- Log-líkindahallinn: Við setjum fram þá virku tilgátu að OPT, búið þeim mörkum Þjöppunarkóðara R_{T,h}(D) sem kortlögð eru í T-1, nái að minnsta kosti jafn traustri punktbundinni log-líkindi og staðaleflisfræði á athuganda-samhæfum straumi. Athugið að mörk Solomonoffs gefa strangt tekið aðeins yfirráð yfir væntum summum, en ekki afdráttarlaus punktbundin mörk á tilteknum einstökum straumum; þannig táknar \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] \leq 0 reynslubundna formgerðarvæntingu fremur en algrímslega tryggingu.
Því minnkar skilyrðið í K(\text{IC} \mid \text{SP laws}) > K_0, þ.e. 300 > 36. Þetta gildir með verulegu formgerðarlegu svigrúmi. Skilyrðið bregst aðeins ef IC kostar færri en um það bil 36 bita — þ.e. ef hið tiltekna IC alheims okkar er formgerðarlega afleiðanlegt af SP-lögmálunum einum saman þannig að eftir standi færri en 36 leifarbitar. Ekkert núverandi heimsfræðilíkan nær þessu.
§8. Samanburðartafla MDL
| Líkan | K(\mathcal{M}) (bitar) | K(\text{IC}\mid\mathcal{M}) (bitar) | -\log P(y\mid\mathcal{M}) | L_T samtals | MDL-röð |
|---|---|---|---|---|---|
| \mathcal{M}_1 — SM + GR | \sim 1750 | \sim 300 (verðbólgulíkan) | \sim 0 (ákvarðað) | \sim 2050 | 2. sæti (verðbólgulíkan) |
| \mathcal{M}_3 — Boltzmann | \sim 1750 | \sim 10 | \gg 0 (sjaldgæfur straumur) | \gg 1760 | Síðast (hörmulegar líkur) |
| \mathcal{M}_{\text{OPT}} — OPT | \sim 36 | \sim 0 (skilyrt í gegnum mjög skorðaða Síu) | \sim 0^* (ákvarðandi nálgun kóðara) | \sim 36 (skilyrt) | 1. sæti (skilyrt) |
^* Samkvæmt skýrri auðkenningu kóðarans í §9.2 minnkar virki gagnaliður OPT niður í -\log P_{K_\theta}(y) = -\log P_\text{SP}(y) = 0 þegar K_\theta er auðkennt sem SP-kóðarinn.
§9. Takmörk samanburðarins
9.1 K(y \mid \text{Filter}) er ekki reiknanlegt
Kóðalengd OPT, K_0 + K(y \mid \text{Filter}) = K_0 - \log \xi^{\text{Filter}}(y), inniheldur lið sem er ekki reiknanlegur í Turing-skilningi (stöðvunarvandinn kemur í veg fyrir að hægt sé að reikna \xi nákvæmlega). Í framkvæmd verða spár OPT að vera nálgaðar með endanlegum kóðara K_\theta — sem er staðlað verklag í eðlisfræði. Þetta þýðir að í forspárlegum tilgangi fellur OPT niður á besta reiknanlega kóðara sem völ er á. MDL-forskot OPT gagnvart SP er því formgerðarlegt forskot (í lýsingu á valreglunni) fremur en rekstrarlegt forskot við að setja fram nýjar spár.
Þetta er ekki galli — þetta er hið rétta formlega inntak fullyrðingar forprentunarinnar: „OPT flytur hluta af skýringarbyrðinni frá upptalningu lögmála yfir á val lögmála.“ Sú tilfærsla er raunveruleg og formlega magngreind (\approx 1700 bitar fyrir valregluna samanborið við \mathcal{M}_1), en hún býr ekki til nýtt forspárlegt inntak umfram það sem kóðarinn veitir þegar.
9.2 Vandinn við auðkenningu kóðarans
OPT-kóðarinn K_\theta er sú tiltekna reiknanlega mæling úr \mathcal{M} sem Stöðugleikasían velur. T-4 ákvarðar ekki hvaða mæling þetta er — sú auðkenning krefst T-5 (endurheimtar fasta) og alls eðlisfræðilega sameiningarverkefnisins. Þar til K_\theta hefur verið skilgreindur með skýrum hætti sem SM + GR er MDL-samanburðurinn skilyrtur af þessari auðkenningu. Formlegu mörkin L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 tryggja að OPT geti ekki staðið sig verr en SP, en tryggja ekki að hún standi sig betur á endanlegum tíma nema IC-skilyrði T-4e sé uppfyllt — sem það er, samkvæmt stöðluðum heimsfræðilegum forsendum.
Skorða frá P-2. Viðauki P-2 (Innfelling Hilbertrýmis með skammtaleiðréttingarkóða) sýnir að, undir staðbundnum suðtruflunum, verður kóðarinn að fullnægja QECC-formgerð — innri framsetning hans verður að mynda skammtaleiðréttingarkóða með tilteknum stikum (n, k, d). Þetta þrengir vandann við auðkenningu kóðarans: K_\theta er ekki lengur handahófskennd reiknanleg mæling, heldur slík mæling að forspárástand hennar beri villuleiðréttandi rúmfræði Hilbertrýmis. Þessi skorða liggur framar í rásinni en endurheimtarverkefni fasta í T-5 og kann að veita viðbótarvalviðmið til að auðkenna K_\theta með Staðallíkaninu.
§10. Lokaútdráttur
Afhendingaratriði T-4 — Staðfest lokað (með normaliseringar- og dæmigerðarskilyrðum)
Kóðunarsamþykktir festar (§1). Tvíþætt MDL, forskeytt Kolmogorov-flækjustig miðað við innifalinn fastan UTM, sem varpar gagnasviðinu á virkan hátt yfir á meðvitaða strauminn y_{1:T} = z_{0:T}.
Viðmiðunarflokkar festir (§2). Metur \mathcal{M}_1 (SM+GR) gagnvart léttvægum mörkum á borð við \mathcal{M}_2 (sprengivaxið val á stika fyrir myndandi umfang) og \mathcal{M}_3 (Boltzmann-hrun líkindafalls).
T-4a (Flækjustig metareglu). K(\xi, \text{Filter}) = K_0 \approx 36 bitar, að meðtöldum hliðrunum miðað við UTM.
T-4b (Solomonoff takmarkað). L_T(\text{OPT}) \leq L_T(\nu) + K_0 + \log(1/\xi(\mathcal{O})). Skilgreinir stika algrímslegrar normaliseringarrefsingu með skýrum hætti.
Tilgáta T-4c (Heurískt mark á IC-þjöppun). Formgerðarrík upphafsskilyrðis-endurtekning er tilgátubundin vél þjöppunar: \Delta_{\text{IC}} = K(\text{IC}\mid\text{SP}) - K(\text{IC}\mid\text{OPT}) \geq 0, þó með skilyrtri einsleitni vörpunar. Þetta þjónar sem heurískt mark, ekki sem formlega sönnuð setning.
T-4d (Kostur líkans með fastan bitafjölda). Takmarkar hegðun markgildis með skilyrðum: fyrir reiknanleg viðmið sem hafa \nu-dæmigerðan flokk sem skarast á óverulegan hátt við \mathcal{O} tryggir OPT varanlegt tölulegt forskot í flækjustigi (\sim -1714 bitar), þótt óendanleg þéttleiki þess á hvern bita skali niður í núll.
T-4e (Endanlegt-T forskot — skilyrt). OPT sigrar \mathcal{M}_1 tölulega fyrir endanlegt T nákvæmlega þegar reynslubundið punktbundið tap hnekkir ekki kjarnamörkum formgerðarinnar K(\text{IC}\mid\text{SP}) > K_0 (300 > 36). Beinir veikleikanum með afgerandi hætti að forsendum um algrímslega punktbundna yfirburði.
Hrekjanleikaskilyrði fyrir MDL-fullyrðinguna
- Afleiðsla á upphafsskilyrðum heimsfræðinnar út frá SP-lögmálum einum saman í færri en \sim 36 bitum — sem sýnir að K(\text{IC} \mid \text{SP laws}) < K_0.
- Sýning á því að takmörkun Stöðugleikasíu við strauma sem eru samrýmanlegir athuganda þjappi ekki IC — þ.e. að K(\text{IC} \mid \xi, \text{Filter}) = K(\text{IC} \mid \text{laws}), sem gefur \Delta_{\text{IC}} = 0.
- Skýr reiknanlegur kóðari K_\theta fyrir OPT sem er sannanlega ónákvæmari en SM+GR á straumum athuganda, þannig að halli log-líkindafallsins verði meiri en ávinningurinn af IC-þjöppun.
Niðurstreymisósjálfstæði
- T-5 (Endurheimt fasta) er næsta nauðsynlega skref: þegar kóðarinn K_\theta hefur verið auðkenndur með SM+GR-lögmálum í gegnum T-1/T-2/T-3 verður MDL-samanburðurinn fullkomlega skýr og skilyrðið í T-4e verður að áþreifanlegum ójöfnuði milli þekktra stærða.
- Uppfærsla á forprentun §5.2: orðalagið “Whether this meta-rule yields an actual MDL advantage… is an open comparative question” má nú uppfæra í: “Theorem T-4d establishes a conditional asymptotic advantage (for observer streams that are also \nu-typical under the benchmark physics, a set currently uncharacterised); Theorem T-4e establishes a conditional finite-T advantage; see Appendix T-4.”
Þessum viðauka er viðhaldið sem hluta af OPT-verkefnageymslunni samhliða theoretical_roadmap.pdf. Heimildir: Rissanen (1978) [12], Li & Vitányi (2008) [27], Solomonoff (1964) [11], Penrose (2004).