Teoria uporządkowanego patcha (OPT)

Aneks T-4: Porównanie MDL / oszczędności opisu

Anders Jarevåg

v2.0.0 — 2 kwietnia 2026 | DOI: 10.5281/zenodo.19300777

Pierwotne zadanie T-4: porównanie MDL / oszczędnościowości Problem: Aktualny preprint deklaruje przewagę pod względem oszczędnościowości nad standardową fizyką, traktując prawa fizyczne jako makroskopowe algorytmy kompresji, lecz nie przedstawia formalnego porównania MDL. Rezultat: Porównawcza analiza MDL OPT względem referencyjnych klas modeli fizycznych przy jawnie określonych konwencjach kodowania.

Status zamknięcia: ZAMKNIĘTE (warunkowo, przy założeniu typowości i normalizacji IC). Niniejszy aneks przedstawia formalną ocenę MDL wymaganą przez T-4. Ustalono trzy referencyjne klasy modeli wraz z jawnymi konwencjami kodowania. Ustanowiono cztery twierdzenia i jedną hipotezę: (T-4a) reguła selektora OPT ma długość opisu rzędu \mathcal{O}(1); (T-4b) dominacja Solomonoffa ogranicza z góry log-loss OPT; (Hipoteza T-4c) przypuszczalnym źródłem strukturalnej przewagi OPT jest kompresja warunków początkowych; (T-4d) OPT osiąga trwałą przewagę złożoności modelu o stałą liczbę bitów nad każdym obliczalnym modelem referencyjnym; (T-4e) przewaga dla skończonego T zostaje warunkowo skwantyfikowana. Domknięcie opiera się na trzech warunkach nośnych: typowości strumienia obserwatora, absorpcji kary normalizacyjnej Solomonoffa \log(1/\xi(\mathcal{O})) oraz stanie K(\text{IC} \mid \text{SP}) > K_0.

§1. Ustalenie konwencji kodowania MDL

Porównania MDL są bez znaczenia bez jawnych, ustalonych konwencji kodowania. §5.1 preprintu odnotowuje ten wymóg, lecz go odracza. Ustalamy tu konwencje zgodnie z Rissanenem (1978) [12] oraz dwuczęściowymi ramami MDL Li i Vitányiego (2008) [27].

1.1 Dwuczęściowa długość kodu

Dla klasy hipotez \mathcal{M} oraz sekwencji obserwacji y_{1:T} \in \{0,1\}^*, dwuczęściowa długość kodu MDL wynosi:

L_T(\mathcal{M}) = K(\mathcal{M}) + L(y_{1:T} \mid \mathcal{M}) \tag{preprint §5.1, Eq. 13}

gdzie K(\mathcal{M}) jest prefiksową złożonością Kołmogorowa hipotezy — długością najkrótszego samoodgraniczającego się programu na ustalonej uniwersalnej maszynie Turinga (UTM), który generuje pełny opis \mathcal{M} — a L(y_{1:T} \mid \mathcal{M}) jest ujemnym logarytmem wiarygodności danych przy najlepszym modelu predykcyjnym należącym do \mathcal{M}:

L(y_{1:T} \mid \mathcal{M}) = -\log_2 P_\mathcal{M}(y_{1:T})

Dla teorii deterministycznych (prawa + IC jednoznacznie wyznaczają obserwacje), L(y_{1:T} \mid \mathcal{M}) = 0, gdy y jest zgodne z teorią, a w przeciwnym razie L = \infty. Wszystkie logarytmy mają podstawę 2; wszystkie długości kodu są wyrażone w bitach.

1.2 Uniwersalna maszyna

Ustalamy jedną optymalną UTM \mathcal{U} na całej przestrzeni wywodu. Wszystkie złożoności Kołmogorowa są określone względem \mathcal{U}; przy innym wyborze UTM wyniki zmieniają się najwyżej o \mathcal{O}(1) bitów. Miara Solomonoffa \xi jest zdefiniowana względem \mathcal{U} (preprint, równ. 1). Ustala to konwencję dla wszystkich dalszych porównań.

1.3 Zakres y_{1:T}

Porównujemy modele w obrębie domeny, do której przewidywania każdy z nich został zaprojektowany: świadomego strumienia obserwatora y_{1:T} = z_{0:T} (sekwencji skompresowanych stanów ukrytych, C_{\max} bitów na sekundę przez T sekund). Standardową fizykę ocenia się w tej samej domenie przez sprowadzenie jej przewidywań do strumienia zgodnego z obserwatorem za pomocą gruboziarnienia. Od obu teorii wymaga się wyjaśnienia dokładnie tych samych obserwacji.

§2. Referencyjne klasy modeli

Ustalono trzy klasy referencyjne. Każdej przypisano jawne oszacowanie K(\mathcal{M}) w ramach naszej konwencji UTM. Dokładne wartości liczbowe są oszacowaniami rzędu wielkości; wyniki strukturalne w §§3–7 zależą wyłącznie od porządku, a nie od dokładnych wartości.

2.1 \mathcal{M}_1 — Model Standardowy + ogólna teoria względności

Najbardziej predykcyjnie trafna teoria fizyczna, jaką obecnie dysponujemy. Jej opis wymaga trzech składników:

Struktura matematyczna K_{\text{struct}}: grupa cechowania \text{SU}(3) \times \text{SU}(2) \times \text{U}(1), niezmienniczość Lorentza, renormalizowalność oraz symetria dyfeomorfizmów OTW. Złożoność Kołmogorowa: K_{\text{struct}} \approx 10^3 bitów.
Wartości parametrów K_{\text{param}}: 19 swobodnych parametrów MS + 3 kąty mieszania + 1 faza CP + \Lambda + G + c \approx 25 stałych zakodowanych z dokładnością eksperymentalną (\sim 30 bitów każda): K_{\text{param}} \approx 750 bitów.
Warunki początkowe K_{\text{IC}}: w ramach paradygmatu inflacyjnego, K_{\text{IC}}^{\text{inf}} \approx 200–400 bitów. Uwaga: nie uwzględniamy tu ograniczenia entropii termodynamicznej Penrose’a 10^{123}, ponieważ mierzy ono makroskopową objętość przestrzeni fazowej (S), a nie specyficzną algorytmiczną złożoność Kołmogorowa (K). Konkretny mikrostan może być wysoce kompresowalny. Opieramy się wyłącznie na rzetelnych ograniczeniach inflacyjnych.

K(\mathcal{M}_1) = K_{\text{struct}} + K_{\text{param}} \approx 1750 \text{ bits}

K(\text{IC} \mid \mathcal{M}_1) \approx 300 \text{ bits (inflationary)}

2.2 \mathcal{M}_2 — Ogólna renormalizowalna QFT

Klasa wszystkich renormalizowalnych kwantowych teorii pola w \leq 4 wymiarach czasoprzestrzennych. Klasa ta zawiera \mathcal{M}_1 jako jeden ze swoich elementów. Ponieważ należy również określić grupę cechowania oraz zawartość cząstkową:

K(\mathcal{M}_2) \gg K(\mathcal{M}_1) \gg 1750 \text{ bits}

\mathcal{M}_2 uwzględniono jako kontrast dla tezy OPT, że prawa są wybierane, a nie wyliczane. Chociaż porównanie MDL z \mathcal{M}_2 jest w sposób trywialny wygrywane przez każdą skończoną podklasę (w tym \mathcal{M}_1), ponieważ K(\mathcal{M}_2) jest nieograniczone, jego uwzględnienie służy formalnie wykazaniu nieskończonej skali problemu doboru parametrów, który Filtr stabilności w sposób natywny redukuje.

2.3 \mathcal{M}_3 — Mózg Boltzmanna / Fluktuacja termiczna

Standardowa fizyka z maksymalnie prostymi warunkami początkowymi: stan termiczny (maksymalnej entropii) w skali Plancka. Prawa są identyczne jak w \mathcal{M}_1; warunki początkowe są trywialnie proste:

K(\mathcal{M}_3) \approx K(\mathcal{M}_1) \approx 1750 \text{ bits}, \qquad K(\text{IC} \mid \mathcal{M}_3) \approx 10 \text{ bits}

Jednak log-wiarygodność obserwacji uporządkowanego świadomego strumienia y_{1:T} w modelu \mathcal{M}_3 jest astronomicznie mała: L(y_{1:T} \mid \mathcal{M}_3) \approx K(y_{1:T}) \gg T \cdot C_{\max}. \mathcal{M}_3 ma zatem pomijalny koszt IC, lecz katastrofalny koszt wiarygodności, i została uwzględniona po to, by pokazać, że przewaga MDL w OPT nie jest osiągana za pomocą tego samego zabiegu.

§3. Długość kodu OPT — Twierdzenie T-4a

Długość kodu MDL dla OPT rozkłada się następująco:

L_T(\text{OPT}) = K(\xi, \text{Filter}) + L(y_{1:T} \mid \xi, \text{Filter}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

gdzie \xi^{\text{Filter}} jest miarą Solomonoffa \xi warunkowaną na klasie zgodnej z obserwatorem \mathcal{O} (strumienie spełniające R_{\text{req}} \leq B_{\max}), a K_0 = K(\xi, \text{Filter}) jest długością opisu reguły selekcji.

Twierdzenie T-4a (Ograniczenie złożoności metareguły). K(\xi, \text{Filter}) = K_0 = \mathcal{O}(1) bitów. Dokładniej:

K_0 \leq K(\mathcal{U}) + K(C_{\max}) + K(\Delta t) + c

gdzie K(\mathcal{U}) jest złożonością UTM, K(C_{\max}) = \mathcal{O}(\log C_{\max}) bitów koduje próg przepustowości z dokładnością eksperymentalną, K(\Delta t) = \mathcal{O}(\log \Delta t) koduje okno aktualizacji, a c jest małą uniwersalną stałą.

Dowód. Miara Solomonoffa \xi jest jednoznacznie wyznaczona przez ustaloną UTM \mathcal{U}, zatem K(\xi \mid \mathcal{U}) = \mathcal{O}(1). Filtr stabilności wymaga dwóch parametrów: C_{\max} i \Delta t, z których każdy jest mierzony z dokładnością do \sim 4 cyfr znaczących, więc K(C_{\max}, \Delta t) \leq 2 \times (4 \times \log_2 10) \approx 26 bitów. Warunek R_{\text{req}} \leq B_{\max} jest pojedynczą nierównością w ustalonej notacji: \sim 10 bitów. Łącznie: K_0 \leq K(\mathcal{U}) + 36 bitów.

Aby uczciwie uwzględnić K(\mathcal{U}), musimy założyć „epistemicznie neutralną” UTM — to znaczy maszynę odniesienia, której wbudowany zestaw instrukcji nie koduje preferencyjnie żadnej teorii fizycznej (tj. podstawową geometrię kombinatorową lub odpowiednik Brainfucka, całkowicie agnostyczny wobec fizyki). Przy takiej nieobciążonej maszynie utrzymanie K(\xi, \text{Filter}) \approx 36 bitów przy jednoczesnej standaryzacji K(\mathcal{M}_1) \approx 1750 bitów jest zasadne. Uznajemy wyraźnie, że pozostawia to bezwzględną liczbę bitów podatną na skalowanie przez stałą \mathcal{O}(1) w przypadku zmiany UTM, co oznacza, że obliczenie 36 vs 1750 ma z natury charakter relatywny. Strukturalnie uczciwe sformułowanie matematyczne dotyczy tu uporządkowania rangowego (K_0 \ll K(\mathcal{M}_1)), które stwierdza solidną przewagę strukturalną niezależną od dokładnej stałej numerycznej. \blacksquare

Porównanie: Po wyłączeniu wspólnego narzutu UTM, K_0 \approx 36 bitów wobec K(\mathcal{M}_1) \approx 1750 bitów. Reguła selekcji OPT jest krótsza od opisu Modelu Standardowego o K(\mathcal{M}_1) - K_0 \approx 1714 bitów. To właśnie przewaga parsymonii strukturalnej deklarowana w §5 preprintu — teraz z jawnym przeliczeniem na bity.

§4. Ograniczenie dominacji Solomonoffa — Twierdzenie T-4b

Twierdzenie T-4b (Ograniczenie dominacji Solomonoffa). Dla dowolnej obliczalnej miary fizyki \nu (w tym \mathcal{M}_1, \mathcal{M}_2, \mathcal{M}_3) takiej, że K(\nu) < \infty, oraz dla dowolnego strumienia danych y_{1:T}:

L_T(\text{OPT}) \leq L_T(\nu) + K'_0

gdzie K'_0 = K_0 + \log(1/\xi(\mathcal{O})). Wyraża to złożoność reguły bazowej powiększoną o konieczną karę normalizacji algorytmicznej, ponoszoną przy warunkowaniu miary uniwersalnej względem klasy obserwatorów \mathcal{O}.

Dowód. Z definicji miary Solomonoffa (preprint, równ. 1), przy w_\nu \asymp 2^{-K(\nu)}:

\xi(y_{1:T}) \geq w_\nu \cdot \nu(y_{1:T}) \geq 2^{-K(\nu)} \cdot \nu(y_{1:T})

Po wzięciu ujemnych logarytmów:

-\log \xi(y_{1:T}) \leq -\log \nu(y_{1:T}) + K(\nu)

Przy przejściu od miary uniwersalnej \xi do ograniczonego filtra \xi^{\text{Filter}}, ponosimy koszt normalizacji -\log \xi^{\text{Filter}}(y) = -\log \xi(y) + \log(1/\xi(\mathcal{O})). Podstawiając do L_T(\text{OPT}):

L_T(\text{OPT}) = K_0 - \log \xi^{\text{Filter}}(y_{1:T}) \leq K_0 + \log(1/\xi(\mathcal{O})) + K(\nu) - \log \nu(y_{1:T}) = K'_0 + L_T(\nu) \qquad \blacksquare

Ważne zastrzeżenie. Twierdzenie T-4b nie pokazuje, że OPT przewyższa SP. Pokazuje ono, że OPT nie może wypaść gorzej od żadnego benchmarku o więcej niż K'_0 bitów. Od tej chwili absorbujemy \log(1/\xi(\mathcal{O})) do K_0, zakładając, że klasa sekwencji obserwatorów daje się czysto ograniczyć względem strukturalnych stałych UTM, lecz odnotowujemy tę lukę normalizacyjną jako formalną podatność.

§5. Kompresja warunków początkowych — Twierdzenie T-4c

Strukturalnym źródłem przewagi OPT w sensie MDL jest kompresja warunków początkowych. W standardowej fizyce prawa i warunki początkowe są odrębnymi obiektami, które oba muszą zostać opisane. W OPT warunki początkowe zostają wchłonięte przez prior: miara Solomonoffa już przypisuje najwyższą wagę najprostszym strumieniom zgodnym z obserwatorem, czyniąc odrębną specyfikację IC zbędną.

5.1 Argument nadmiarowości IC

W standardowej fizyce (\mathcal{M}_1) pełny kod MDL dla teorii deterministycznej ma postać:

L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) + 0 \qquad \text{[deterministyczna: } -\log P = 0 \text{, jeśli spójna]}

Składnik IC, K(\text{IC} \mid \text{laws}), jest długością opisu specyficznych warunków początkowych przy danych prawach — nie daje się go wyprowadzić z samych praw. To właśnie tutaj lokuje się fine-tuning.

W ramach OPT kod dwuczęściowy ma postać:

L_T(\text{OPT}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

Wyraz -\log \xi^{\text{Filter}}(y_{1:T}) koduje konkretny strumień przy danej metaregle. Prior Solomonoffa zawiera już uniwersalny model fizyki: -\log \xi(y) \approx K(y). Kodowanie OPT nigdy nie musi osobno „płacić” za IC.

Hipoteza T-4c (heurystyczne ograniczenie kompresji IC). Zdefiniujmy przewagę kompresji IC:

\Delta_{\text{IC}} = K(\text{IC} \mid \text{SP laws}) - K(\text{IC} \mid \text{OPT})

Twierdzimy, że zachodzi następujące heurystyczne ograniczenie:

\boxed{L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1)}

gdzie K(\text{IC} \mid \text{OPT}) := K(\text{IC} \mid \xi, \text{Filter}, \text{codec}) jest resztkową długością opisu warunków początkowych przy pełnym modelu OPT. \Delta_{\text{IC}} \geq 0, z równością wtedy i tylko wtedy, gdy Filtr stabilności nie zapewnia żadnej dodatkowej kompresji IC ponad to, co dają już same prawa.

Argument. Wychodząc od pełnego kodu dwuczęściowego dla SP i stosując dominację Solomonoffa (wchłaniając stałe normalizacyjne do składnika ograniczającego UTM rzędu \mathcal{O}(1)), otrzymujemy:

L_T(\text{OPT}) \leq K_0 + K(\text{laws}) + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) + \mathcal{O}(1)

Po przekształceniu i podstawieniu L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) (teoria deterministyczna):

L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 + \mathcal{O}(1)

W ramach OPT składnik -\log \xi^{\text{Filter}}(y_{1:T}) nie musi indywidualnie kodować IC: Filtr wybiera z prioru Solomonoffa, który kompresuje IC w sposób immanentny poprzez ważenia długości. Subaddytywność AIT gwarantuje, że K(\text{IC} \mid x, f(x)) \leq K(\text{IC} \mid x) + \mathcal{O}(1). Jeśli postulujemy, że reguła selekcji OPT daje się ograniczyć przez ściślejszy ciąg opisowy niż samo zadeklarowanie surowych praw (co stanowi centralny zakład tego frameworku, a nie matematyczny dowód pochodny), to resztkowo zakodowane K(\text{IC} \mid \text{OPT}) nie może istotnie przekraczać K(\text{IC} \mid \text{laws}). Heurystycznie otrzymujemy więc \Delta_{\text{IC}} \geq 0.

Przez podstawienie: L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1). \blacksquare

Uwaga. Stawiamy hipotezę, że kompresja antropiczna K(\text{IC} \mid \text{OPT}) \approx 0 działa w granicy, w której Filtr stabilności jest silnie ograniczający, mapując matematycznie na jednoznacznie zgodne z obserwatorem stany. Jest to umotywowana propozycja fizyczna, a nie algorytmicznie dowiedzione ograniczenie jednoznaczności.

§6. Przewaga złożoności modelu o stałej liczbie bitów — Twierdzenie T-4d

Twierdzenie T-4d (Trwała przewaga MDL o stałej liczbie bitów — pod warunkiem typowości). Dla każdego ustalonego, nietrywialnego obliczalnego modelu fizyki \nu spełniającego K_0 < K(\nu) < \infty, sformułowanie OPT osiąga ustaloną, trwałą przewagę złożoności modelu, konkretnie dla każdego y_{1:T} \in \mathcal{O}, który jest zarazem typowy względem \nu. Gdy długość sekwencji T \to \infty, różnica całkowitej długości kodu jest strukturalnie ograniczona:

L_T(\text{OPT}) - L_T(\nu) \to K_0 - K(\nu)

Dowód. Z T-4b wynika, że L_T(\text{OPT}) \leq K'_0 - \log \xi^{\text{Filter}}(y_{1:T}). Dla dowolnego obliczalnego \nu twierdzenie Solomonoffa gwarantuje, że \xi zbiega do \nu dokładnie na sekwencjach typowych względem \nu: w sensie \nu-prawie wszystkich y_{1:\infty}. Należy tu zauważyć głębokie napięcie formalne: Filtr stabilności izoluje strumienie oceniane ściśle jako niskoentropijne i ustrukturyzowane, mapując je tym samym strukturalnie jako nietypowe względem standardowych, nieograniczonych strumieni miary \nu o maksymalnej entropii. O ile nie da się wykazać nietrywialnego matematycznego nakładania się między filtrowaną klasą obserwatorów \mathcal{O} a klasą typową względem \nu, granica zbieżności Solomonoffa nie może zostać wykorzystana w sposób natywny. W konsekwencji twierdzenie to ma zastosowanie warunkowo wtedy i tylko wtedy, gdy konkretny filtrowany strumień obserwatora pozostaje typowy względem \nu przy danych benchmarkowych prawach (przy czym zbiór takich teoretycznie zgodnych strumieni przecięcia pozostaje formalnie niescharakteryzowany):

-\frac{1}{T} \log \xi(y_{1:T}) \to H(\nu) \quad \text{gdy } T \to \infty

gdzie H(\nu) jest tempem entropii modelu \nu. Analogicznie, -\frac{1}{T} \log \nu(y_{1:T}) \to H(\nu). Asymptotycznie składniki log-wiarygodności log-loss na bit zbiegają się i zrównują, co oznacza, że pozostała przewaga całkowitej długości kodu sprowadza się wyłącznie do długości opisu modelu:

\left[L_T(\text{OPT}) - L_T(\nu)\right] \to K_0 - K(\nu) < 0 \qquad \text{[ponieważ } K_0 \approx 36 \text{ wobec } K(\nu) \sim 1750 \text{]}

Uwaga: chociaż całkowita długość kodu zachowuje tę trwałą przewagę o ustalonej liczbie bitów, przewaga na bit (\frac{K_0 - K(\nu)}{T}) aktywnie maleje do zera. Nie oznacza to asymptotycznie stale narastającej przewagi poprzez akumulację danych, lecz raczej trwałe, sztywne przesunięcie strukturalne. \blacksquare

Oszacowanie numeryczne dla \mathcal{M}_1: K(\mathcal{M}_1) - K_0 \approx 1714 bitów. Gdy log-wiarygodności log-loss zbiegną się w dostatecznie szerokich oknach obserwacyjnych typowych względem \nu, OPT utrzymuje trwałą matematyczną przewagę całkowitego kodowania rzędu około 1714 bitów.

§7. Skończono-T przewaga warunkowa — Twierdzenie T-4e

Dla strumieni o skończonej długości porównanie MDL wymaga, aby przewaga kompresji IC z T-4c przekraczała narzut K_0.

Twierdzenie T-4e (Skończono-T warunkowa przewaga MDL). OPT osiąga ścisłą skończono-T przewagę MDL nad \mathcal{M}_1 — to znaczy, L_T(\text{OPT}) < L_T(\mathcal{M}_1) — wtedy i tylko wtedy, gdy spełniony jest następujący warunek:

\boxed{K(\text{IC} \mid \text{SP laws}) > K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y_{1:T}) - \left(-\log P_{\text{SP}}(y_{1:T})\right)\right]}

Nawias po prawej stronie jest deficytem log-wiarygodności OPT względem SP na konkretnym strumieniu y_{1:T}. Warunek ten jest spełniony zawsze wtedy, gdy koszt opisu IC przekracza łączny narzut meta-reguły oraz deficyt predykcyjny OPT na tym strumieniu.

Dowód. Bezpośrednie przekształcenie długości kodu dwuczęściowego:

L_T(\text{OPT}) < L_T(\text{SP}) \iff \quad K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) - \log \xi^{\text{Filter}}(y) < K_{\text{laws}} + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) \iff \quad K(\text{IC} \mid \text{laws}) - K_0 > \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] + \left[K_{\text{laws}} - K_{\text{laws}}\right]

Po przekształceniu (ponieważ K_{\text{laws}} redukuje się po obu stronach) otrzymujemy bezpośrednio podany warunek. \blacksquare

7.1 Ocena warunku dla standardowej kosmologii

W ramach kodowania inflacyjnego (najbardziej sprzyjającego przypadku dla SP):

K(\text{IC} \mid \text{SP laws}) \approx 300 bitów (parametry inflacyjne + liczba e-foldów + reheating)
K_0 \approx 36 bitów (T-4a)
Deficyt log-wiarygodności: Funkcjonalnie stawiamy hipotezę, że OPT, wyposażona w ograniczenia kodeka R_{T,h}(D) odwzorowane w T-1, osiąga co najmniej równie solidną punktową log-wiarygodność jak fizyka standardowa na strumieniu zgodnym z obserwatorem. Należy zauważyć, że ograniczenia Solomonoffa ściśle dają dominację nad sumami oczekiwanymi, a nie definitywne punktowe ograniczenia dla konkretnych pojedynczych strumieni; zatem \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] \leq 0 stanowi empiryczne oczekiwanie strukturalne, a nie gwarancję algorytmiczną.

Zatem warunek redukuje się do K(\text{IC} \mid \text{SP laws}) > K_0, tj. 300 > 36. Jest on spełniony z istotnym marginesem strukturalnym. Warunek zawodzi jedynie wtedy, gdy koszt IC wynosi mniej niż \sim 36 bitów — tzn. jeśli specyficzne IC naszego wszechświata da się strukturalnie wyprowadzić wyłącznie z praw SP, pozostawiając mniej niż 36 bitów resztowych. Żaden obecny model kosmologiczny tego nie osiąga.

§8. Porównawcza tabela MDL

Model	K(\mathcal{M}) (bity)	K(\text{IC}\mid\mathcal{M}) (bity)	-\log P(y\mid\mathcal{M})	Łączne L_T	Ranga MDL
\mathcal{M}_1 — SM + GR	\sim 1750	\sim 300 (inflacyjny)	\sim 0 (deterministyczny)	\sim 2050	2. (inflacyjny)
\mathcal{M}_3 — Boltzmann	\sim 1750	\sim 10	\gg 0 (rzadki strumień)	\gg 1760	Ostatni (katastrofalna wiarygodność)
\mathcal{M}_{\text{OPT}} — OPT	\sim 36	\sim 0 (warunkowe poprzez silnie ograniczony Filtr)	*\sim 0^ (deterministyczne przybliżenie kodeka)**	\sim 36 (warunkowe)	1. (warunkowe)

^* Przy explicite przyjętej identyfikacji kodeka z §9.2 składnik danych aktywnych OPT redukuje się do -\log P_{K_\theta}(y) = -\log P_\text{SP}(y) = 0, gdy K_\theta zostaje utożsamiony z kodekiem SP.

§9. Ograniczenia porównania

9.1 K(y \mid \text{Filter}) nie jest obliczalne

Długość kodu OPT K_0 + K(y \mid \text{Filter}) = K_0 - \log \xi^{\text{Filter}}(y) zawiera składnik, który nie jest obliczalny w sensie Turinga (problem stopu uniemożliwia dokładne obliczenie \xi). W praktyce predykcje OPT muszą być aproksymowane przez skończony kodek K_\theta — co jest standardem w fizyce. Oznacza to, że dla celów predykcyjnych OPT redukuje się do najlepszego dostępnego obliczalnego kodeka. Przewaga MDL OPT nad SP ma zatem charakter strukturalny (w opisie reguły selekcji), a nie operacyjny w generowaniu nowych predykcji.

Nie jest to wada — stanowi to właściwą formalną treść tezy preprintu: „OPT przenosi część ciężaru wyjaśniającego z wyliczania praw na selekcję praw”. To przesunięcie jest rzeczywiste i formalnie skwantyfikowane (\approx 1700 bitów dla reguły selekcji wobec \mathcal{M}_1), ale nie generuje nowej treści predykcyjnej ponad to, co już dostarcza kodek.

9.2 Problem identyfikacji kodeka

Kodek OPT K_\theta jest specyficzną obliczalną miarą z \mathcal{M}, którą wybiera Filtr stabilności. T-4 nie rozstrzyga, która to miara — jej identyfikacja wymaga T-5 (odzyskiwania stałych) oraz pełnego programu unifikacji fizycznej. Dopóki K_\theta nie zostanie jawnie zidentyfikowany ze SM + GR, porównanie MDL pozostaje warunkowe względem tej identyfikacji. Formalne ograniczenie L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 gwarantuje, że OPT nie może wypaść gorzej niż SP, ale nie gwarantuje, że w skończonym czasie wypadnie lepiej, chyba że spełniony jest warunek IC z T-4e — co ma miejsce przy standardowych założeniach kosmologicznych.

Ograniczenie z P-2. Aneks P-2 (Osadzenie przestrzeni Hilberta poprzez kwantową korekcję błędów) wykazuje, że przy lokalnym szumie kodek musi spełniać strukturę QECC — jego reprezentacja wewnętrzna musi stanowić kwantowy kod korekcji błędów o określonych parametrach (n, k, d). To zawęża problem identyfikacji kodeka: K_\theta nie jest już dowolną obliczalną miarą, lecz taką, której stany predykcyjne niosą geometrię korekcji błędów właściwą przestrzeni Hilberta. Ograniczenie to poprzedza program odzyskiwania stałych z T-5 i może dostarczyć dodatkowych kryteriów selekcji przy identyfikacji K_\theta ze Modelem Standardowym.

§10. Podsumowanie domknięcia

Rezultaty T-4 — potwierdzone jako domknięte (z warunkami normalizacji i typowości)

Ustalono konwencje kodowania (§1). Dwuczęściowe MDL, prefiksowa złożoność Kołmogorowa względem inkluzywnej ustalonej UTM, z funkcjonalnym odwzorowaniem dziedziny danych na strumień świadomości y_{1:T} = z_{0:T}.
Ustalono klasy benchmarkowe (§2). Ocenia \mathcal{M}_1 (SM+GR) względem trywialnych granic, takich jak \mathcal{M}_2 (eksplodujący wybór parametru zakresu generatywnego) i \mathcal{M}_3 (załamanie wiarygodności Boltzmanna).
T-4a (Złożoność metareguły). K(\xi, \text{Filter}) = K_0 \approx 36 bitów, z uwzględnieniem przesunięć względem UTM.
T-4b (Ograniczenie Solomonoffa). L_T(\text{OPT}) \leq L_T(\nu) + K_0 + \log(1/\xi(\mathcal{O})). Jawnie definiuje parametr kary normalizacji algorytmicznej.
Hipoteza T-4c (Heurystyczne ograniczenie kompresji IC). Strukturalna redundancja warunków początkowych jest przypuszczalnym mechanizmem kompresji: \Delta_{\text{IC}} = K(\text{IC}\mid\text{SP}) - K(\text{IC}\mid\text{OPT}) \geq 0, choć jednoznaczność odwzorowania jest warunkowa. Służy to jako ograniczenie heurystyczne, a nie formalnie dowiedzione twierdzenie.
T-4d (Przewaga modelu o stałobitowej złożoności). Warunkowo ogranicza zachowanie graniczne: dla obliczalnych benchmarków, których klasa \nu-typowa nakłada się nietrywialnie z \mathcal{O}, OPT uzyskuje trwałą liczbową przewagę złożoności (\sim -1714 bitów), choć jego nieskończona gęstość per-bit skaluje się do zera.
T-4e (Przewaga dla skończonego T — warunkowa). OPT przewyższa numerycznie \mathcal{M}_1 dla skończonego T dokładnie wtedy, gdy empiryczne straty punktowe nie odwracają podstawowej granicy strukturalnej K(\text{IC}\mid\text{SP}) > K_0 (300 > 36). Koncentruje to podatność bezpośrednio na założenia o algorytmicznej dominacji punktowej.

Warunki falsyfikacji dla tezy MDL

Wyprowadzenie kosmologicznych warunków początkowych wyłącznie z praw SP przy użyciu mniej niż \sim 36 bitów — wykazujące, że K(\text{IC} \mid \text{SP laws}) < K_0.
Wykazanie, że ograniczenie Filtru stabilności do strumieni zgodnych z obserwatorem nie kompresuje IC — tj. K(\text{IC} \mid \xi, \text{Filter}) = K(\text{IC} \mid \text{laws}), co daje \Delta_{\text{IC}} = 0.
Jawny obliczalny kodek K_\theta dla OPT, który jest wykazalnie mniej trafny niż SM+GR na strumieniach obserwatora, tak że deficyt log-wiarygodności przekracza zysk z kompresji IC.

Zależności dalszego rzędu

T-5 (Odtworzenie stałych) jest zasadniczym kolejnym krokiem: gdy kodek K_\theta zostanie utożsamiony z prawami SM+GR poprzez T-1/T-2/T-3, porównanie MDL stanie się w pełni jawne, a warunek w T-4e przyjmie postać konkretnej nierówności między znanymi wielkościami.
Aktualizacja preprintu §5.2: frazę “Whether this meta-rule yields an actual MDL advantage… is an open comparative question” można teraz zaktualizować do: “Theorem T-4d establishes a conditional asymptotic advantage (for observer streams that are also \nu-typical under the benchmark physics, a set currently uncharacterised); Theorem T-4e establishes a conditional finite-T advantage; see Appendix T-4.”

Ten aneks jest utrzymywany jako część repozytorium projektu OPT obok theoretical_roadmap.pdf. Odniesienia: Rissanen (1978) [12], Li & Vitányi (2008) [27], Solomonoff (1964) [11], Penrose (2004).