Theorie der geordneten Patches (OPT)

Anhang T-4: MDL / Sparsamkeitsvergleich

Anders Jarevåg

v2.0.0 — 2. April 2026 | DOI: 10.5281/zenodo.19300777

Ursprüngliche Aufgabe T-4: MDL- / Sparsamkeitsvergleich Problem: Das laufende Preprint beansprucht gegenüber der Standardphysik größere Sparsamkeit, indem es physikalische Gesetze als makroskopische Kompressionsalgorithmen behandelt, liefert jedoch keinen formalen MDL-Vergleich. Ergebnis: Vergleichende MDL-Analyse der Theorie der geordneten Patches (OPT) gegenüber Benchmark-Klassen physikalischer Modelle unter expliziten Kodierungskonventionen.

Abschlussstatus: ABGESCHLOSSEN (bedingt durch Typicality und IC-Normalisierung). Dieser Anhang liefert die von T-4 geforderte formale MDL-Auswertung. Drei Benchmark-Klassen von Modellen werden mit expliziten Kodierungskonventionen festgelegt. Vier Theoreme und eine Vermutung werden aufgestellt: (T-4a) Die Selektorregel von OPT hat eine Beschreibungslänge von \mathcal{O}(1); (T-4b) Solomonoff-Dominanz beschränkt den Log-Loss von OPT nach oben; (Vermutung T-4c) die vermutete Quelle des strukturellen Vorteils von OPT ist die Kompression der Anfangsbedingungen; (T-4d) OPT erreicht gegenüber jedem berechenbaren Benchmark einen permanenten Vorteil konstanter Bit-Komplexität auf Modellebene; (T-4e) der Vorteil für endliches T wird bedingt quantifiziert. Der Abschluss beruht auf drei tragenden Bedingungen: der Typicality des Beobachterstroms, der Absorption der Solomonoff-Normalisierungsstrafe \log(1/\xi(\mathcal{O})) und dem Zustand K(\text{IC} \mid \text{SP}) > K_0.

§1. Festlegung der MDL-Kodierungskonventionen

MDL-Vergleiche sind ohne explizite, festgelegte Kodierungskonventionen bedeutungslos. §5.1 des Preprints weist auf diese Anforderung hin, stellt ihre Ausarbeitung jedoch zurück. Wir legen die Konventionen hier fest, in Anlehnung an Rissanen (1978) [12] und den zweiteiligen MDL-Rahmen von Li & Vitányi (2008) [27].

1.1 Die zweiteilige Codelänge

Für eine Hypothesenklasse \mathcal{M} und eine Beobachtungssequenz y_{1:T} \in \{0,1\}^* ist die zweiteilige MDL-Codelänge:

L_T(\mathcal{M}) = K(\mathcal{M}) + L(y_{1:T} \mid \mathcal{M}) \tag{preprint §5.1, Eq. 13}

wobei K(\mathcal{M}) die Präfix-Kolmogorov-Komplexität der Hypothese ist — die Länge des kürzesten selbstabgrenzenden Programms auf einer festen universellen Turing-Maschine (UTM), das eine vollständige Beschreibung von \mathcal{M} ausgibt — und L(y_{1:T} \mid \mathcal{M}) die negative Log-Likelihood der Daten unter dem besten prädiktiven Modell von \mathcal{M} ist:

L(y_{1:T} \mid \mathcal{M}) = -\log_2 P_\mathcal{M}(y_{1:T})

Für deterministische Theorien (Gesetze + IC bestimmen die Beobachtungen eindeutig) gilt L(y_{1:T} \mid \mathcal{M}) = 0, wenn y mit der Theorie konsistent ist, und andernfalls L = \infty. Alle Logarithmen haben die Basis 2; alle Codelängen sind in Bit.

1.2 Die universelle Maschine

Wir fixieren durchgehend eine einzelne optimale UTM \mathcal{U}. Alle Kolmogorow-Komplexitäten sind relativ zu \mathcal{U}; die Resultate ändern sich bei einer anderen Wahl der UTM um höchstens \mathcal{O}(1) Bit. Das Solomonoffsche Universelle Semimaß \xi ist relativ zu \mathcal{U} definiert (Preprint Gl. 1). Damit ist die Konvention für alle nachfolgenden Vergleiche festgelegt.

1.3 Umfang von y_{1:T}

Wir vergleichen Modelle auf dem Bereich, den jedes von ihnen vorhersagen soll: dem bewussten Strom des Beobachters y_{1:T} = z_{0:T} (der Folge komprimierter latenter Zustände, C_{\max} Bit pro Sekunde über T Sekunden). Die Standardphysik wird auf demselben Bereich bewertet, indem ihre Vorhersagen mittels Grobkörnigkeit auf den beobachterkompatiblen Strom reduziert werden. Beide Theorien sollen exakt dieselben Beobachtungen erklären.

§2. Benchmark-Modellklassen

Drei Benchmark-Klassen sind festgelegt. Jeder wird unter unserer UTM-Konvention eine explizite Schätzung von K(\mathcal{M}) zugewiesen. Präzise numerische Werte sind Größenordnungsschätzungen; die strukturellen Ergebnisse in §§3–7 hängen nur von der Ordnung ab, nicht von den exakten Werten.

2.1 \mathcal{M}_1 — Standardmodell + Allgemeine Relativitätstheorie

Die derzeit prädiktiv genaueste verfügbare physikalische Theorie. Ihre Beschreibung erfordert drei Komponenten:

Mathematische Struktur K_{\text{struct}}: die Eichgruppe \text{SU}(3) \times \text{SU}(2) \times \text{U}(1), Lorentz-Invarianz, Renormierbarkeit und die Diffeomorphismus-Symmetrie der ART. Kolmogorov-Komplexität: K_{\text{struct}} \approx 10^3 Bit.
Parameterwerte K_{\text{param}}: 19 freie SM-Parameter + 3 Mischungswinkel + 1 CP-Phase + \Lambda + G + c \approx 25 Konstanten, kodiert auf experimentelle Präzision (\sim 30 Bit jeweils): K_{\text{param}} \approx 750 Bit.
Anfangsbedingungen K_{\text{IC}}: unter dem inflationären Paradigma gilt K_{\text{IC}}^{\text{inf}} \approx 200–400 Bit. Hinweis: Penroses thermodynamische Entropieschranke von 10^{123} bewerten wir hier nicht, weil sie makroskopisches Phasenraumvolumen (S) misst, nicht spezifische algorithmische Kolmogorov-Komplexität (K). Der spezifische Mikrozustand kann stark komprimierbar sein. Wir stützen uns ausschließlich auf die belastbaren inflationären Schranken.

K(\mathcal{M}_1) = K_{\text{struct}} + K_{\text{param}} \approx 1750 \text{ Bit}

K(\text{IC} \mid \mathcal{M}_1) \approx 300 \text{ Bit (inflationär)}

2.2 \mathcal{M}_2 — Generische renormierbare QFT

Die Klasse aller renormierbaren Quantenfeldtheorien in \leq 4 Raumzeitdimensionen. Diese Klasse enthält \mathcal{M}_1 als ein Element. Da auch Eichgruppe und Teilcheninhalt spezifiziert werden müssen:

K(\mathcal{M}_2) \gg K(\mathcal{M}_1) \gg 1750 \text{ bits}

\mathcal{M}_2 ist als Kontrastfolie für den Anspruch der Theorie der geordneten Patches (OPT) aufgenommen, dass Gesetze ausgewählt und nicht aufgezählt werden. Während der MDL-Vergleich mit \mathcal{M}_2 von jeder endlichen Unterklasse (einschließlich \mathcal{M}_1) trivial gewonnen wird, weil K(\mathcal{M}_2) unbeschränkt ist, dient seine Einbeziehung formal dazu, das unendliche Ausmaß des Problems der Parameterauswahl zu demonstrieren, das der Stabilitätsfilter von Haus aus kollabiert.

2.3 \mathcal{M}_3 — Boltzmann-Gehirn / Thermische Fluktuation

Standardphysik mit maximal einfachen Anfangsbedingungen: ein thermischer Zustand (Zustand maximaler Entropie) auf der Planck-Skala. Die Gesetze sind identisch mit \mathcal{M}_1; die Anfangsbedingungen sind trivial einfach:

K(\mathcal{M}_3) \approx K(\mathcal{M}_1) \approx 1750 \text{ bits}, \qquad K(\text{IC} \mid \mathcal{M}_3) \approx 10 \text{ bits}

Die Log-Likelihood, unter \mathcal{M}_3 einen geordneten bewussten Strom y_{1:T} zu beobachten, ist jedoch astronomisch klein: L(y_{1:T} \mid \mathcal{M}_3) \approx K(y_{1:T}) \gg T \cdot C_{\max}. \mathcal{M}_3 hat somit vernachlässigbare IC-Kosten, aber katastrophale Likelihood-Kosten, und wird hier aufgenommen, um zu zeigen, dass der MDL-Vorteil der OPT nicht durch denselben Trick erreicht wird.

§3. Codelänge der Theorie der geordneten Patches (OPT) — Theorem T-4a

Die MDL-Codelänge für OPT zerfällt in:

L_T(\text{OPT}) = K(\xi, \text{Filter}) + L(y_{1:T} \mid \xi, \text{Filter}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

wobei \xi^{\text{Filter}} das Solomonoffsche Universelle Semimaß \xi ist, konditioniert auf die beobachterkompatible Klasse \mathcal{O} (Ströme, die R_{\text{req}} \leq B_{\max} erfüllen), und K_0 = K(\xi, \text{Filter}) die Beschreibungslänge der Selektorregel ist.

Theorem T-4a (Komplexitätsschranke der Meta-Regel). K(\xi, \text{Filter}) = K_0 = \mathcal{O}(1) Bit. Genauer:

K_0 \leq K(\mathcal{U}) + K(C_{\max}) + K(\Delta t) + c

wobei K(\mathcal{U}) die Komplexität der UTM ist, K(C_{\max}) = \mathcal{O}(\log C_{\max}) Bit die Bandbreitenschwelle bis auf experimentelle Präzision kodiert, K(\Delta t) = \mathcal{O}(\log \Delta t) das Aktualisierungsfenster kodiert und c eine kleine universelle Konstante ist.

Beweis. Das Solomonoffsche Universelle Semimaß \xi ist durch die feste UTM \mathcal{U} eindeutig bestimmt, also gilt K(\xi \mid \mathcal{U}) = \mathcal{O}(1). Der Stabilitätsfilter erfordert zwei Parameter: C_{\max} und \Delta t, jeweils gemessen auf \sim 4 signifikante Stellen, sodass K(C_{\max}, \Delta t) \leq 2 \times (4 \times \log_2 10) \approx 26 Bit. Die Bedingung R_{\text{req}} \leq B_{\max} ist eine einzelne Ungleichung in fester Notation: \sim 10 Bit. Insgesamt: K_0 \leq K(\mathcal{U}) + 36 Bit.

Um K(\mathcal{U}) fair zu absorbieren, müssen wir eine „epistemisch neutrale“ UTM annehmen — also eine Referenzmaschine, deren eingebauter Instruktionssatz keine physikalische Theorie bevorzugt kodiert (d. h. eine grundlegende Kombinator- oder Brainfuck-äquivalente Geometrie, vollständig agnostisch gegenüber Physik). Unter einer solchen unverzerrten Maschine ist es zulässig, K(\xi, \text{Filter}) \approx 36 Bit beizubehalten, während K(\mathcal{M}_1) \approx 1750 Bit standardisiert wird. Wir erkennen ausdrücklich an, dass dies die absolute Bitzahl gegenüber einer Skalierung um eine \mathcal{O}(1)-Konstante verwundbar macht, falls die UTM geändert wird; das bedeutet, dass die Rechnung 36 vs. 1750 inhärent relativ ist. Die strukturell redliche mathematische Aussage ist hier die Rangordnung (K_0 \ll K(\mathcal{M}_1)), die einen robusten strukturellen Vorteil unabhängig von der genauen numerischen Konstante behauptet. \blacksquare

Vergleich: Unter Ausschluss des gemeinsamen UTM-Overheads gilt K_0 \approx 36 Bit gegenüber K(\mathcal{M}_1) \approx 1750 Bit. Die OPT-Selektorregel ist um K(\mathcal{M}_1) - K_0 \approx 1714 Bit kürzer als die Beschreibung des Standardmodells. Dies ist der in §5 des Preprints beanspruchte strukturelle Sparsamkeitsvorteil — nun mit expliziter Bitzahl.

§4. Die Solomonoff-Dominanzschranke — Theorem T-4b

Theorem T-4b (Solomonoff-Dominanzschranke). Für jedes berechenbare Physikmaß \nu (einschließlich \mathcal{M}_1, \mathcal{M}_2, \mathcal{M}_3) mit K(\nu) < \infty und für jeden Datenstrom y_{1:T} gilt:

L_T(\text{OPT}) \leq L_T(\nu) + K'_0

wobei K'_0 = K_0 + \log(1/\xi(\mathcal{O})). Dies repräsentiert die Komplexität der Basisregel zuzüglich der notwendigen algorithmischen Normalisierungsstrafe, die dadurch entsteht, dass das universelle Maß auf die Beobachterklasse \mathcal{O} konditioniert wird.

Beweis. Aus der Definition des Solomonoffschen Maßes (Preprint Gl. 1), mit w_\nu \asymp 2^{-K(\nu)}:

\xi(y_{1:T}) \geq w_\nu \cdot \nu(y_{1:T}) \geq 2^{-K(\nu)} \cdot \nu(y_{1:T})

Durch Anwenden negativer Logarithmen ergibt sich:

-\log \xi(y_{1:T}) \leq -\log \nu(y_{1:T}) + K(\nu)

Beim Übergang vom universellen Maß \xi zum eingeschränkten Filter \xi^{\text{Filter}} zahlen wir die Normalisierungskosten -\log \xi^{\text{Filter}}(y) = -\log \xi(y) + \log(1/\xi(\mathcal{O})). Durch Einsetzen in L_T(\text{OPT}):

L_T(\text{OPT}) = K_0 - \log \xi^{\text{Filter}}(y_{1:T}) \leq K_0 + \log(1/\xi(\mathcal{O})) + K(\nu) - \log \nu(y_{1:T}) = K'_0 + L_T(\nu) \qquad \blacksquare

Wichtiger Vorbehalt. Theorem T-4b zeigt nicht, dass OPT SP übertrifft. Es zeigt, dass OPT gegenüber keinem Benchmark um mehr als K'_0 Bits schlechter abschneiden kann. Wir absorbieren \log(1/\xi(\mathcal{O})) im Folgenden in K_0, indem wir annehmen, dass die Klasse der Beobachtersequenzen sich relativ zu strukturellen UTM-Konstanten sauber abschranken lässt; diese Normalisierungslücke ist jedoch als formale Verwundbarkeit zu vermerken.

§5. Die Kompression der Anfangsbedingungen — Theorem T-4c

Die strukturelle Quelle von OPTs MDL-Vorteil ist die Kompression der Anfangsbedingungen. In der Standardphysik sind die Gesetze und die Anfangsbedingungen getrennte Objekte, die beide beschrieben werden müssen. In OPT werden die Anfangsbedingungen in das Prior absorbiert: Das Solomonoff-Maß weist den einfachsten beobachterkompatiblen Strömen bereits das höchste Gewicht zu, wodurch eine separate IC-Spezifikation redundant wird.

5.1 Das IC-Redundanzargument

Unter der Standardphysik (\mathcal{M}_1) lautet der vollständige MDL-Code für eine deterministische Theorie:

L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) + 0 \qquad \text{[deterministisch: } -\log P = 0 \text{ falls konsistent]}

Der IC-Term K(\text{IC} \mid \text{laws}) ist die Beschreibungslänge der spezifischen Anfangsbedingungen gegeben die Gesetze — er ist nicht aus den Gesetzen selbst ableitbar. Hier liegt der Ort des Fine-Tunings.

Unter OPT lautet der zweiteilige Code:

L_T(\text{OPT}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

Der Term -\log \xi^{\text{Filter}}(y_{1:T}) kodiert den spezifischen Strom unter der Meta-Regel. Der Solomonoff-Prior enthält bereits ein universelles Modell der Physik: -\log \xi(y) \approx K(y). Die OPT-Kodierung muss niemals separat für die IC bezahlen.

Konjektur T-4c (Heuristische Schranke der IC-Kompression). Definieren wir den IC-Kompressionsvorteil:

\Delta_{\text{IC}} = K(\text{IC} \mid \text{SP laws}) - K(\text{IC} \mid \text{OPT})

Wir vertreten die folgende heuristische Schranke:

\boxed{L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1)}

wobei K(\text{IC} \mid \text{OPT}) := K(\text{IC} \mid \xi, \text{Filter}, \text{codec}) die residuale Beschreibungslänge der Anfangsbedingungen unter dem vollständigen Modell von OPT ist. \Delta_{\text{IC}} \geq 0, mit Gleichheit genau dann, wenn der Stabilitätsfilter keine zusätzliche Kompression der IC liefert, die über das hinausgeht, was die Gesetze bereits liefern.

Argument. Ausgehend vom vollständigen zweiteiligen Code für SP und unter Anwendung der Solomonoff-Dominanz (wobei die Normierungskonstanten in einen \mathcal{O}(1)-UTM-Schrankenterm absorbiert werden):

L_T(\text{OPT}) \leq K_0 + K(\text{laws}) + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) + \mathcal{O}(1)

Durch Umstellen und Einsetzen von L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) (deterministische Theorie):

L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 + \mathcal{O}(1)

Innerhalb von OPT muss -\log \xi^{\text{Filter}}(y_{1:T}) die IC nicht einzeln kodieren: Der Filter selektiert aus dem Solomonoff-Prior, der die IC aufgrund von Längengewichtungen inhärent komprimiert. Die Subadditivität der AIT garantiert K(\text{IC} \mid x, f(x)) \leq K(\text{IC} \mid x) + \mathcal{O}(1). Wenn wir postulieren, dass die OPT-Selektionsregel als engerer deskriptiver String beschränkt als die bloße Angabe der rohen Gesetze (was die Kernwette des Frameworks ist, nicht ein mathematischer Ableitungsbeweis), dann kann das residual kodierte K(\text{IC} \mid \text{OPT}) K(\text{IC} \mid \text{laws}) nicht wesentlich überschreiten. Daraus ergibt sich heuristisch \Delta_{\text{IC}} \geq 0.

Durch Einsetzen: L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1). \blacksquare

Bemerkung. Wir nehmen an, dass die anthropische Kompression K(\text{IC} \mid \text{OPT}) \approx 0 im Grenzfall wirkt, in dem der Stabilitätsfilter stark einschränkend ist und mathematisch auf eindeutig beobachterkompatible Zustände abbildet. Dies ist eine motivierte physikalische Proposition und keine algorithmisch bewiesene Eindeutigkeitsschranke.

§6. Konstanter-Bit-Vorteil der Modellkomplexität — Theorem T-4d

Theorem T-4d (Permanenter konstanter MDL-Bit-Vorteil — unter der Bedingung von Typikalität). Für jedes feste, nicht-triviale berechenbare Physikmodell \nu mit K_0 < K(\nu) < \infty erreicht die OPT-Formulierung einen festen, permanenten Vorteil in der Modellkomplexität, und zwar speziell für jedes y_{1:T} \in \mathcal{O}, das zugleich \nu-typisch ist. Wenn die Sequenzlänge T \to \infty geht, ist die Differenz der gesamten Codelänge strukturell gebunden:

L_T(\text{OPT}) - L_T(\nu) \to K_0 - K(\nu)

Beweis. Aus T-4b folgt L_T(\text{OPT}) \leq K'_0 - \log \xi^{\text{Filter}}(y_{1:T}). Für jedes berechenbare \nu garantiert Solomonoffs Theorem, dass \xi genau auf \nu-typischen Sequenzen gegen \nu konvergiert, gemessen als \nu-fast-alle y_{1:\infty}. Beachte hier die tiefgreifende formale Spannung: Der Stabilitätsfilter isoliert Ströme, die strikt als entropiearm und strukturiert bewertet werden, und ordnet sie damit strukturell als atypisch im Vergleich zu Standardströmen des unbeschränkten Maximum-Entropie-\nu-Maßes ein. Sofern nicht gezeigt werden kann, dass die gefilterte Beobachterklasse \mathcal{O} und die Klasse der \nu-typischen Sequenzen eine nachweisbare nicht-triviale mathematische Überlappung besitzen, kann der Solomonoff-Konvergenzgrenzwert nicht ohne Weiteres genutzt werden. Folglich gilt dieses Theorem nur unter der Bedingung, dass der spezifische gefilterte Beobachterstrom unter den spezifischen Vergleichsgesetzen \nu-typisch bleibt (wobei die Menge solcher theoretisch kompatiblen Schnittströme formal uncharakterisiert bleibt):

-\frac{1}{T} \log \xi(y_{1:T}) \to H(\nu) \quad \text{as } T \to \infty

wobei H(\nu) die Entropierate von \nu ist. Entsprechend gilt auch -\frac{1}{T} \log \nu(y_{1:T}) \to H(\nu). Asymptotisch konvergieren die Log-Loss-Log-Likelihood-Terme pro Bit und werden gleich, was bedeutet, dass sich der verbleibende Vorteil in der gesamten Codelänge rein auf die Länge der Modellbeschreibung reduziert:

\left[L_T(\text{OPT}) - L_T(\nu)\right] \to K_0 - K(\nu) < 0 \qquad \text{[da } K_0 \approx 36 \text{ gegenüber } K(\nu) \sim 1750 \text{]}

Anmerkung: Während die gesamte Codelänge diesen permanenten festen Bit-Vorteil beibehält, schrumpft der Vorteil pro Bit (\frac{K_0 - K(\nu)}{T}) aktiv gegen null. Dies stellt keinen asymptotisch fortlaufend wachsenden Vorteil durch Datenakkumulation dar, sondern vielmehr einen permanenten starren strukturellen Offset. \blacksquare

Numerische Schätzung für \mathcal{M}_1: K(\mathcal{M}_1) - K_0 \approx 1714 Bit. Sobald die Log-Loss-Likelihoods über hinreichende \nu-typische Beobachtungsfenster konvergieren, behält OPT eine permanente mathematische Überlegenheit in der Gesamtcodierung von ungefähr 1714 Bit bei.

§7. Der endliche-T-bedingte Vorteil — Theorem T-4e

Für Ströme endlicher Länge erfordert der MDL-Vergleich, dass der IC-Kompressionsvorteil aus T-4c den Overhead K_0 übersteigt.

Theorem T-4e (Endlicher-T-bedingter MDL-Vorteil). OPT erzielt einen strikten endlichen-T-MDL-Vorteil gegenüber \mathcal{M}_1 — das heißt, L_T(\text{OPT}) < L_T(\mathcal{M}_1) — genau dann, wenn die folgende Bedingung gilt:

\boxed{K(\text{IC} \mid \text{SP laws}) > K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y_{1:T}) - \left(-\log P_{\text{SP}}(y_{1:T})\right)\right]}

Die Klammer auf der rechten Seite ist das Log-Likelihood-Defizit von OPT relativ zu SP auf dem spezifischen Strom y_{1:T}. Die Bedingung ist erfüllt, wann immer die Beschreibungskosten von IC den kombinierten Overhead der Meta-Regel und das Vorhersagedefizit von OPT auf diesem Strom übersteigen.

Beweis. Direkte Umformung der zweiteiligen Codelängen:

L_T(\text{OPT}) < L_T(\text{SP}) \iff \quad K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) - \log \xi^{\text{Filter}}(y) < K_{\text{laws}} + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) \iff \quad K(\text{IC} \mid \text{laws}) - K_0 > \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] + \left[K_{\text{laws}} - K_{\text{laws}}\right]

Durch Umstellen (K_{\text{laws}} hebt sich auf beiden Seiten weg) ergibt sich die angegebene Bedingung unmittelbar. \blacksquare

7.1 Bewertung der Bedingung für die Standardkosmologie

Unter der inflationären Kodierung (dem günstigsten Fall für SP):

K(\text{IC} \mid \text{SP laws}) \approx 300 Bits (inflationäre Parameter + Anzahl der e-Faltungen + Reheating)
K_0 \approx 36 Bits (T-4a)
Das Log-Likelihood-Defizit: Wir nehmen funktional an, dass OPT, ausgestattet mit den in T-1 abgebildeten Codec-Grenzen R_{T,h}(D), auf einem beobachterkompatiblen Strom mindestens eine ebenso robuste punktweise Log-Likelihood erreicht wie die Standardphysik. Beachten Sie, dass Solomonoff-Schranken streng genommen nur Dominanz über Erwartungssummen liefern, nicht aber definitive punktweise Schranken für spezifische singuläre Ströme; daher stellt \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] \leq 0 eher eine empirische strukturelle Erwartung als eine algorithmische Garantie dar.

Daher reduziert sich die Bedingung auf K(\text{IC} \mid \text{SP laws}) > K_0, d. h. 300 > 36. Dies gilt mit einem erheblichen strukturellen Abstand. Die Bedingung scheitert nur dann, wenn IC weniger als \sim 36 Bits kostet — d. h., wenn die spezifischen IC unseres Universums strukturell allein aus den SP-Gesetzen ableitbar wären und dabei weniger als 36 Residualbits erzeugten. Kein gegenwärtiges kosmologisches Modell erreicht dies.

§8. Die vergleichende MDL-Tabelle

Modell	K(\mathcal{M}) (Bits)	K(\text{IC}\mid\mathcal{M}) (Bits)	-\log P(y\mid\mathcal{M})	L_T gesamt	MDL-Rang
\mathcal{M}_1 — SM + GR	\sim 1750	\sim 300 (inflationär)	\sim 0 (deterministisch)	\sim 2050	2. (inflationär)
\mathcal{M}_3 — Boltzmann	\sim 1750	\sim 10	\gg 0 (seltener Strom)	\gg 1760	Letzter (katastrophale Likelihood)
\mathcal{M}_{\text{OPT}} — OPT	\sim 36	\sim 0 (bedingt über hochgradig eingeschränkten Filter)	*\sim 0^ (deterministische Codec-Approximation)**	\sim 36 (bedingt)	1. (bedingt)

^* Unter der expliziten Codec-Identifikation aus §9.2 reduziert sich der aktive Datenterm von OPT auf -\log P_{K_\theta}(y) = -\log P_\text{SP}(y) = 0, sobald K_\theta mit dem SP-Codec identifiziert wird.

§9. Grenzen des Vergleichs

9.1 K(y \mid \text{Filter}) ist nicht berechenbar

Die OPT-Codelänge K_0 + K(y \mid \text{Filter}) = K_0 - \log \xi^{\text{Filter}}(y) enthält einen Term, der im Turing-Sinn nicht berechenbar ist (das Halteproblem verhindert, \xi exakt zu berechnen). In der Praxis müssen die Vorhersagen der OPT durch einen endlichen Codec K_\theta approximiert werden — was der Standardphysik entspricht. Das bedeutet, dass sich OPT für prädiktive Zwecke auf den besten verfügbaren berechenbaren Codec reduziert. Der MDL-Vorteil der OPT gegenüber SP ist daher ein struktureller Vorteil (in der Beschreibung der Selektorregel) und kein operationaler Vorteil bei der Erzeugung neuartiger Vorhersagen.

Dies ist kein Mangel — es ist der korrekte formale Gehalt der Behauptung des Preprints: „OPT verlagert einen Teil der Erklärungslast von der Aufzählung von Gesetzen auf die Auswahl von Gesetzen.“ Diese Verschiebung ist real und formal quantifiziert (\approx 1700 Bit für die Selektorregel gegenüber \mathcal{M}_1), erzeugt jedoch keinen neuen prädiktiven Gehalt über das hinaus, was der Codec bereits liefert.

9.2 Das Codec-Identifikationsproblem

Der OPT-Codec K_\theta ist das spezifische berechenbare Maß aus \mathcal{M}, das der Stabilitätsfilter auswählt. T-4 bestimmt nicht, welches Maß dies ist — diese Identifikation erfordert T-5 (Konstantenrekonstruktion) und das vollständige physikalische Vereinheitlichungsprogramm. Solange K_\theta nicht explizit mit SM + GR identifiziert ist, ist der MDL-Vergleich von dieser Identifikation abhängig. Die formale Schranke L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 garantiert, dass OPT nicht schlechter abschneiden kann als SP, garantiert aber nicht, dass es in endlicher Zeit besser abschneidet, sofern nicht die IC-Bedingung aus T-4e erfüllt ist — was unter Standardannahmen der Kosmologie der Fall ist.

Einschränkung aus P-2. Anhang P-2 (Hilbertraum-Einbettung mittels Quantenfehlerkorrektur) zeigt, dass der Codec unter lokalem Rauschen eine QECC-Struktur erfüllen muss — seine interne Repräsentation muss einen Quantenfehlerkorrekturcode mit spezifischen Parametern (n, k, d) bilden. Dies verengt das Codec-Identifikationsproblem: K_\theta ist nicht länger ein beliebiges berechenbares Maß, sondern eines, dessen prädiktive Zustände die fehlerkorrigierende Geometrie eines Hilbertraums tragen. Diese Einschränkung liegt dem Konstantenrekonstruktionsprogramm von T-5 vorgelagert und könnte zusätzliche Auswahlkriterien dafür liefern, K_\theta mit dem Standardmodell zu identifizieren.

§10. Abschließende Zusammenfassung

T-4-Ergebnisse — als abgeschlossen bestätigt (mit Normalisierungs- und Typicality-Bedingungen)

Kodierungskonventionen festgelegt (§1). Zweiteilige MDL, Präfix-Kolmogorov-Komplexität relativ zu einer inklusiven festen UTM, wobei der Datenbereich funktional auf den bewussten Strom y_{1:T} = z_{0:T} abgebildet wird.
Benchmark-Klassen festgelegt (§2). Bewertet \mathcal{M}_1 (SM+GR) gegenüber trivialen Grenzen wie \mathcal{M}_2 (explodierende Auswahl generativer Geltungsbereichsparameter) und \mathcal{M}_3 (Boltzmann-Kollaps der Likelihood).
T-4a (Meta-Regel-Komplexität). K(\xi, \text{Filter}) = K_0 \approx 36 Bit einschließlich relativer UTM-Offsets.
T-4b (Solomonoff-beschränkt). L_T(\text{OPT}) \leq L_T(\nu) + K_0 + \log(1/\xi(\mathcal{O})). Definiert den algorithmischen Normalisierungs-Strafparameter explizit.
Vermutung T-4c (heuristische Schranke der IC-Kompression). Strukturelle Redundanz der Anfangsbedingungen ist der vermutete Motor der Kompression: \Delta_{\text{IC}} = K(\text{IC}\mid\text{SP}) - K(\text{IC}\mid\text{OPT}) \geq 0, wenngleich die Eindeutigkeit der Abbildung nur bedingt gilt. Dies dient als heuristische Schranke, nicht als formal bewiesener Satz.
T-4d (Modellvorteil mit konstanter Bitzahl). Begrenzt bedingt das Grenzverhalten: Für berechenbare Benchmarks, deren \nu-typische Klasse sich nichttrivial mit \mathcal{O} überschneidet, sichert OPT einen permanenten numerischen Komplexitätsvorteil (\sim -1714 Bit), obwohl seine unendliche Pro-Bit-Dichte gegen null skaliert.
T-4e (Vorteil bei endlichem T — bedingt). OPT schlägt \mathcal{M}_1 numerisch bei endlichem T genau dann, wenn empirische punktweise Verluste die strukturelle Kernschranke K(\text{IC}\mid\text{SP}) > K_0 (300 > 36) nicht aufheben. Dies konzentriert die Verwundbarkeit unmittelbar auf Annahmen algorithmischer punktweiser Dominanz.

Falsifikationsbedingungen für den MDL-Anspruch

Eine Herleitung der kosmologischen Anfangsbedingungen allein aus den SP-Gesetzen in weniger als \sim 36 Bit — was zeigt, dass K(\text{IC} \mid \text{SP laws}) < K_0.
Ein Nachweis, dass die Beschränkung des Stabilitätsfilters auf beobachterkompatible Ströme IC nicht komprimiert — d. h. K(\text{IC} \mid \xi, \text{Filter}) = K(\text{IC} \mid \text{laws}), sodass \Delta_{\text{IC}} = 0.
Ein expliziter berechenbarer Codec K_\theta für OPT, der auf Beobachterströmen nachweislich ungenauer ist als SM+GR, sodass das Log-Likelihood-Defizit den Gewinn aus der IC-Kompression übersteigt.

Nachgelagerte Abhängigkeiten

T-5 (Konstantenrekonstruktion) ist der wesentliche nächste Schritt: Sobald der Codec K_\theta über T-1/T-2/T-3 mit den SM+GR-Gesetzen identifiziert ist, wird der MDL-Vergleich vollständig explizit, und die Bedingung in T-4e wird zu einer konkreten Ungleichung zwischen bekannten Größen.
Preprint-Update §5.2: die Formulierung „Whether this meta-rule yields an actual MDL advantage… is an open comparative question“ kann nun aktualisiert werden zu: „Theorem T-4d establishes a conditional asymptotic advantage (for observer streams that are also \nu-typical under the benchmark physics, a set currently uncharacterised); Theorem T-4e establishes a conditional finite-T advantage; see Appendix T-4.“

Dieser Anhang wird als Teil des OPT-Projektrepositoriums neben theoretical_roadmap.pdf gepflegt. Referenzen: Rissanen (1978) [12], Li & Vitányi (2008) [27], Solomonoff (1964) [11], Penrose (2004).