Θεωρία του Διατεταγμένου Patch

Παράρτημα T-4: Σύγκριση MDL / Απλότητας

Anders Jarevåg

v2.0.0 — April 2, 2026 | DOI: 10.5281/zenodo.19300777

Αρχικό Καθήκον T-4: Σύγκριση MDL / Φειδωλότητας Πρόβλημα: Το ενεργό preprint ισχυρίζεται ότι υπερέχει σε φειδωλότητα έναντι της τυπικής φυσικής, αντιμετωπίζοντας τους φυσικούς νόμους ως μακροσκοπικούς αλγορίθμους συμπίεσης, αλλά δεν παρέχει μια τυπική σύγκριση MDL. Παραδοτέο: Συγκριτική ανάλυση MDL της OPT έναντι κλάσεων προτύπων αναφοράς της φυσικής, υπό ρητές συμβάσεις κωδικοποίησης.

Κατάσταση περάτωσης: ΚΛΕΙΣΤΟ (υπό όρους ως προς την τυπικότητα και την κανονικοποίηση IC). Το παρόν παράρτημα παρέχει την τυπική αξιολόγηση MDL που απαιτείται από το T-4. Καθορίζονται τρεις κλάσεις προτύπων αναφοράς με ρητές συμβάσεις κωδικοποίησης. Θεμελιώνονται τέσσερα θεωρήματα και μία εικασία: (T-4a) ο κανόνας επιλογής της OPT έχει μήκος περιγραφής \mathcal{O}(1)· (T-4b) το όριο κυριαρχίας του Σολομόνοφ φράσσει άνωθεν τη λογαριθμική απώλεια της OPT· (Εικασία T-4c) η εικαζόμενη πηγή του δομικού πλεονεκτήματος της OPT είναι η συμπίεση των αρχικών συνθηκών· (T-4d) η OPT επιτυγχάνει μόνιμο πλεονέκτημα πολυπλοκότητας μοντέλου σταθερού αριθμού bit έναντι κάθε υπολογίσιμου προτύπου αναφοράς· (T-4e) το πλεονέκτημα για πεπερασμένο T ποσοτικοποιείται υπό όρους. Η περάτωση στηρίζεται σε τρεις κρίσιμες προϋποθέσεις: την τυπικότητα της ροής του παρατηρητή, την απορρόφηση της ποινής κανονικοποίησης του Σολομόνοφ \log(1/\xi(\mathcal{O})), και την ισχύ της συνθήκης K(\text{IC} \mid \text{SP}) > K_0.

§1. Καθορισμός των Συμβάσεων Κωδικοποίησης MDL

Οι συγκρίσεις MDL είναι άνευ νοήματος χωρίς ρητές, σταθερές συμβάσεις κωδικοποίησης. Η §5.1 του preprint σημειώνει αυτή την απαίτηση αλλά την αναβάλλει. Εδώ καθορίζουμε τις συμβάσεις ακολουθώντας τον Rissanen (1978) [12] και το διμερές πλαίσιο MDL των Li & Vitányi (2008) [27].

1.1 Το Μήκος Κώδικα Δύο Μερών

Για μια κλάση υποθέσεων \mathcal{M} και μια ακολουθία παρατηρήσεων y_{1:T} \in \{0,1\}^*, το μήκος κώδικα MDL δύο μερών είναι:

L_T(\mathcal{M}) = K(\mathcal{M}) + L(y_{1:T} \mid \mathcal{M}) \tag{preprint §5.1, Eq. 13}

όπου το K(\mathcal{M}) είναι η προθεματική πολυπλοκότητα Kolmogorov της υπόθεσης — το μήκος του συντομότερου αυτοοριοθετούμενου προγράμματος σε μια σταθερή καθολική μηχανή Turing (UTM) που παράγει μια πλήρη περιγραφή της \mathcal{M} — και το L(y_{1:T} \mid \mathcal{M}) είναι ο αρνητικός λογάριθμος πιθανοφάνειας των δεδομένων υπό το βέλτιστο προγνωστικό μοντέλο της \mathcal{M}:

L(y_{1:T} \mid \mathcal{M}) = -\log_2 P_\mathcal{M}(y_{1:T})

Για ντετερμινιστικές θεωρίες (οι νόμοι + οι IC καθορίζουν μονοσήμαντα τις παρατηρήσεις), L(y_{1:T} \mid \mathcal{M}) = 0 όταν το y είναι συνεπές με τη θεωρία και L = \infty διαφορετικά. Όλοι οι λογάριθμοι είναι βάσης 2· όλα τα μήκη κώδικα εκφράζονται σε bits.

1.2 Η Καθολική Μηχανή

Καθηλώνουμε μία και μόνη βέλτιστη UTM \mathcal{U} σε όλο το κείμενο. Όλες οι πολυπλοκότητες Kolmogorov είναι σχετικές προς τη \mathcal{U}· τα αποτελέσματα μεταβάλλονται κατά το πολύ κατά \mathcal{O}(1) bits υπό διαφορετική επιλογή UTM. Το μέτρο του Σολομόνοφ \xi ορίζεται σε σχέση με τη \mathcal{U} (προδημοσίευμα, Εξ. 1). Αυτό καθορίζει τη σύμβαση για όλες τις επόμενες συγκρίσεις.

1.3 Πεδίο του y_{1:T}

Συγκρίνουμε μοντέλα στο πεδίο για το οποίο το καθένα σχεδιάστηκε να προβλέπει: τη συνειδητή ροή του παρατηρητή y_{1:T} = z_{0:T} (την ακολουθία συμπιεσμένων λανθανουσών καταστάσεων, C_{\max} bits ανά δευτερόλεπτο για T δευτερόλεπτα). Η τυπική φυσική αξιολογείται στο ίδιο πεδίο, μειώνοντας τις προβλέψεις της στη ροή συμβατή με τον παρατηρητή μέσω coarse-graining. Και από τις δύο θεωρίες ζητείται να εξηγήσουν ακριβώς τις ίδιες παρατηρήσεις.


§2. Κλάσεις Μοντέλων Αναφοράς

Καθορίζονται τρεις κλάσεις αναφοράς. Σε καθεμία αποδίδεται μια ρητή εκτίμηση K(\mathcal{M}) υπό τη σύμβαση UTM που χρησιμοποιούμε. Οι ακριβείς αριθμητικές τιμές είναι εκτιμήσεις τάξης μεγέθους· τα δομικά αποτελέσματα στις §§3–7 εξαρτώνται μόνο από τη διάταξη, όχι από τις ακριβείς τιμές.

2.1 \mathcal{M}_1 — Καθιερωμένο Πρότυπο + Γενική Σχετικότητα

Η φυσική θεωρία με τη μεγαλύτερη προγνωστική ακρίβεια που είναι σήμερα διαθέσιμη. Η περιγραφή της απαιτεί τρία συστατικά:

K(\mathcal{M}_1) = K_{\text{struct}} + K_{\text{param}} \approx 1750 \text{ bits}

K(\text{IC} \mid \mathcal{M}_1) \approx 300 \text{ bits (πληθωριστικό)}

2.2 \mathcal{M}_2 — Γενική Ανακανονικοποιήσιμη QFT

Η κλάση όλων των ανακανονικοποιήσιμων κβαντικών θεωριών πεδίου σε \leq 4 διαστάσεις χωροχρόνου. Αυτή η κλάση περιέχει τη \mathcal{M}_1 ως ένα μέλος. Επειδή πρέπει επίσης να προσδιοριστούν η ομάδα βαθμίδας και το περιεχόμενο σωματιδίων:

K(\mathcal{M}_2) \gg K(\mathcal{M}_1) \gg 1750 \text{ bits}

Η \mathcal{M}_2 περιλαμβάνεται ως αντιπαραθετικό παράδειγμα για τον ισχυρισμό της OPT ότι οι νόμοι επιλέγονται, δεν απαριθμούνται. Ενώ η σύγκριση MDL με τη \mathcal{M}_2 κερδίζεται τετριμμένα από οποιαδήποτε πεπερασμένη υποκλάση (συμπεριλαμβανομένης της \mathcal{M}_1), επειδή το K(\mathcal{M}_2) είναι απεριόριστο, η συμπερίληψή της χρησιμεύει τυπικά για να καταδείξει την άπειρη κλίμακα του προβλήματος επιλογής παραμέτρων, το οποίο το Φίλτρο Σταθερότητας καταρρέει εγγενώς.

2.3 \mathcal{M}_3 — Εγκέφαλος Μπόλτσμαν / Θερμική Διακύμανση

Τυπική φυσική με μεγιστικά απλές αρχικές συνθήκες: μια θερμική κατάσταση (μέγιστης εντροπίας) στην κλίμακα του Πλανκ. Οι νόμοι είναι ταυτόσημοι με εκείνους του \mathcal{M}_1· οι αρχικές συνθήκες είναι τετριμμένα απλές:

K(\mathcal{M}_3) \approx K(\mathcal{M}_1) \approx 1750 \text{ bits}, \qquad K(\text{IC} \mid \mathcal{M}_3) \approx 10 \text{ bits}

Ωστόσο, η λογαριθμική πιθανοφάνεια της παρατήρησης μιας διατεταγμένης συνειδητής ροής y_{1:T} υπό το \mathcal{M}_3 είναι αστρονομικά μικρή: L(y_{1:T} \mid \mathcal{M}_3) \approx K(y_{1:T}) \gg T \cdot C_{\max}. Το \mathcal{M}_3 έχει, συνεπώς, αμελητέο κόστος IC αλλά καταστροφικό κόστος πιθανοφάνειας, και περιλαμβάνεται για να δείξει ότι το πλεονέκτημα MDL της OPT δεν επιτυγχάνεται με το ίδιο τέχνασμα.


§3. Μήκος Κώδικα της OPT — Θεώρημα T-4a

Το μήκος κώδικα MDL για την OPT αποσυντίθεται ως εξής:

L_T(\text{OPT}) = K(\xi, \text{Filter}) + L(y_{1:T} \mid \xi, \text{Filter}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

όπου η \xi^{\text{Filter}} είναι το μέτρο του Σολομόνοφ \xi υπό τη συνθήκη της κλάσης συμβατής με τον παρατηρητή \mathcal{O} (ροές που ικανοποιούν R_{\text{req}} \leq B_{\max}), και K_0 = K(\xi, \text{Filter}) είναι το μήκος περιγραφής του κανόνα επιλογής.

Θεώρημα T-4a (Άνω Φράγμα Πολυπλοκότητας του Μετα-Κανόνα). K(\xi, \text{Filter}) = K_0 = \mathcal{O}(1) bits. Συγκεκριμένα:

K_0 \leq K(\mathcal{U}) + K(C_{\max}) + K(\Delta t) + c

όπου το K(\mathcal{U}) είναι η πολυπλοκότητα της UTM, το K(C_{\max}) = \mathcal{O}(\log C_{\max}) bits κωδικοποιεί το κατώφλι εύρους ζώνης με πειραματική ακρίβεια, το K(\Delta t) = \mathcal{O}(\log \Delta t) κωδικοποιεί το παράθυρο ενημέρωσης, και το c είναι μια μικρή καθολική σταθερά.

Απόδειξη. Το μέτρο του Σολομόνοφ \xi προσδιορίζεται μοναδικά από τη σταθερή UTM \mathcal{U}, άρα K(\xi \mid \mathcal{U}) = \mathcal{O}(1). Το Φίλτρο Σταθερότητας απαιτεί δύο παραμέτρους: C_{\max} και \Delta t, καθεμία μετρημένη με \sim 4 σημαντικά ψηφία, οπότε K(C_{\max}, \Delta t) \leq 2 \times (4 \times \log_2 10) \approx 26 bits. Η συνθήκη R_{\text{req}} \leq B_{\max} είναι μία και μόνη ανισότητα σε σταθερή σημειογραφία: \sim 10 bits. Σύνολο: K_0 \leq K(\mathcal{U}) + 36 bits.

Για να απορροφήσουμε το K(\mathcal{U}) με δίκαιο τρόπο, πρέπει να υποθέσουμε μια «επιστημικά ουδέτερη» UTM — δηλαδή μια μηχανή αναφοράς της οποίας το ενσωματωμένο σύνολο εντολών δεν κωδικοποιεί κατά προτίμηση καμία φυσική θεωρία (δηλ. μια βασική γεωμετρία συνδυαστών ή ισοδύναμη του Brainfuck, πλήρως αγνωστική ως προς τη φυσική). Υπό μια τέτοια αμερόληπτη μηχανή, είναι έγκυρο να διατηρούμε K(\xi, \text{Filter}) \approx 36 bits ενώ τυποποιούμε το K(\mathcal{M}_1) \approx 1750 bits. Αναγνωρίζουμε ρητά ότι αυτό αφήνει το απόλυτο πλήθος bits ευάλωτο σε μια κλιμάκωση σταθεράς \mathcal{O}(1) αν αλλάξει η UTM, πράγμα που σημαίνει ότι ο υπολογισμός 36 έναντι 1750 είναι εγγενώς σχετικός. Η μαθηματική διατύπωση που είναι δομικά έντιμη εδώ είναι η κατάταξη μεγέθους (K_0 \ll K(\mathcal{M}_1)), η οποία διατυπώνει ένα εύρωστο δομικό πλεονέκτημα ανεξάρτητο από την ακριβή αριθμητική σταθερά. \blacksquare

Σύγκριση: Εξαιρώντας το κοινό γενικό κόστος της UTM, K_0 \approx 36 bits έναντι K(\mathcal{M}_1) \approx 1750 bits. Ο κανόνας επιλογής της OPT είναι συντομότερος από την περιγραφή του Καθιερωμένου Προτύπου κατά K(\mathcal{M}_1) - K_0 \approx 1714 bits. Αυτό είναι το δομικό πλεονέκτημα φειδωλότητας που διατυπώνεται στην §5 του preprint — πλέον με ρητό πλήθος bits.


§4. Το Φράγμα Κυριαρχίας του Σολομόνοφ — Θεώρημα T-4b

Θεώρημα T-4b (Φράγμα Κυριαρχίας του Σολομόνοφ). Για κάθε υπολογίσιμο μέτρο φυσικής \nu (συμπεριλαμβανομένων των \mathcal{M}_1, \mathcal{M}_2, \mathcal{M}_3) με K(\nu) < \infty, και για κάθε ροή δεδομένων y_{1:T}:

L_T(\text{OPT}) \leq L_T(\nu) + K'_0

όπου K'_0 = K_0 + \log(1/\xi(\mathcal{O})). Αυτό εκφράζει τη βασική πολυπλοκότητα του κανόνα συν την αναγκαία αλγοριθμική ποινή κανονικοποίησης που προκύπτει από τη συνθήκευση του καθολικού μέτρου ως προς την κλάση παρατηρητών \mathcal{O}.

Απόδειξη. Από τον ορισμό του μέτρου του Σολομόνοφ (προδημοσίευση, Εξ. 1), με w_\nu \asymp 2^{-K(\nu)}:

\xi(y_{1:T}) \geq w_\nu \cdot \nu(y_{1:T}) \geq 2^{-K(\nu)} \cdot \nu(y_{1:T})

Λαμβάνοντας αρνητικούς λογαρίθμους:

-\log \xi(y_{1:T}) \leq -\log \nu(y_{1:T}) + K(\nu)

Κατά τη μετάβαση από το καθολικό μέτρο \xi στο περιορισμένο φίλτρο \xi^{\text{Filter}}, καταβάλλουμε το κόστος κανονικοποίησης -\log \xi^{\text{Filter}}(y) = -\log \xi(y) + \log(1/\xi(\mathcal{O})). Αντικαθιστώντας στο L_T(\text{OPT}):

L_T(\text{OPT}) = K_0 - \log \xi^{\text{Filter}}(y_{1:T}) \leq K_0 + \log(1/\xi(\mathcal{O})) + K(\nu) - \log \nu(y_{1:T}) = K'_0 + L_T(\nu) \qquad \blacksquare

Σημαντική επιφύλαξη. Το Θεώρημα T-4b δεν δείχνει ότι η OPT υπερέχει της SP. Δείχνει ότι η OPT δεν μπορεί να αποδώσει χειρότερα από οποιοδήποτε σημείο αναφοράς κατά περισσότερο από K'_0 bits. Εφεξής απορροφούμε το \log(1/\xi(\mathcal{O})) στο K_0, υποθέτοντας ότι η κλάση των ακολουθιών παρατηρητών φράσσεται καθαρά σε σχέση με τις δομικές σταθερές της UTM, αλλά σημειώνουμε αυτό το χάσμα κανονικοποίησης ως τυπική ευαλωτότητα.


§5. Η Συμπίεση των Αρχικών Συνθηκών — Θεώρημα T-4c

Η δομική πηγή του πλεονεκτήματος MDL του OPT είναι η συμπίεση των αρχικών συνθηκών. Στη συνήθη φυσική, οι νόμοι και οι αρχικές συνθήκες είναι χωριστά αντικείμενα που πρέπει και τα δύο να περιγραφούν. Στο OPT, οι αρχικές συνθήκες απορροφώνται στο πρότερο: το μέτρο του Σολομόνοφ αποδίδει ήδη το μεγαλύτερο βάρος στα απλούστερα ρεύματα συμβατά με παρατηρητή, καθιστώντας πλεονάζουσα μια χωριστή προδιαγραφή IC.

5.1 Το Επιχείρημα Πλεονασμού των IC

Υπό την τυπική φυσική (\mathcal{M}_1), ο πλήρης κώδικας MDL για μια ντετερμινιστική θεωρία είναι:

L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) + 0 \qquad \text{[ντετερμινιστική: } -\log P = 0 \text{ αν είναι συνεπής]}

Ο όρος IC K(\text{IC} \mid \text{laws}) είναι το μήκος περιγραφής των συγκεκριμένων αρχικών συνθηκών δεδομένων των νόμων — δεν παράγεται από τους ίδιους τους νόμους. Εδώ εντοπίζεται η λεπτή ρύθμιση.

Υπό την OPT, ο διμερής κώδικας είναι:

L_T(\text{OPT}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

Ο όρος -\log \xi^{\text{Filter}}(y_{1:T}) κωδικοποιεί τη συγκεκριμένη ροή δεδομένου του μετα-κανόνα. Η προτεραιότητα του Σολομόνοφ ενσωματώνει ήδη ένα καθολικό μοντέλο φυσικής: -\log \xi(y) \approx K(y). Η κωδικοποίηση της OPT δεν χρειάζεται ποτέ να «πληρώσει» χωριστά για τα IC.

Εικασία T-4c (Ευρετικό Άνω Φράγμα Συμπίεσης των IC). Ορίζουμε το πλεονέκτημα συμπίεσης των IC:

\Delta_{\text{IC}} = K(\text{IC} \mid \text{SP laws}) - K(\text{IC} \mid \text{OPT})

Υποστηρίζουμε το ακόλουθο ευρετικό άνω φράγμα:

\boxed{L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1)}

όπου K(\text{IC} \mid \text{OPT}) := K(\text{IC} \mid \xi, \text{Filter}, \text{codec}) είναι το υπολειμματικό μήκος περιγραφής των αρχικών συνθηκών δεδομένου του πλήρους μοντέλου της OPT. Ισχύει \Delta_{\text{IC}} \geq 0, με ισότητα αν και μόνο αν το Φίλτρο Σταθερότητας δεν παρέχει καμία πρόσθετη συμπίεση των IC πέρα από εκείνη που ήδη παρέχουν οι νόμοι.

Επιχείρημα. Ξεκινώντας από τον πλήρη διμερή κώδικα για την SP και εφαρμόζοντας την κυριαρχία Solomonoff (απορροφώντας τις σταθερές κανονικοποίησης σε έναν όρο φραγής UTM της τάξης \mathcal{O}(1)):

L_T(\text{OPT}) \leq K_0 + K(\text{laws}) + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) + \mathcal{O}(1)

Αναδιατάσσοντας και αντικαθιστώντας το L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) (ντετερμινιστική θεωρία):

L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 + \mathcal{O}(1)

Εντός της OPT, το -\log \xi^{\text{Filter}}(y_{1:T}) δεν χρειάζεται να κωδικοποιεί ατομικά τα IC: το Φίλτρο επιλέγει από την προτεραιότητα του Σολομόνοφ, η οποία συμπιέζει τα IC εγγενώς μέσω σταθμίσεων μήκους. Η υποπροσθετικότητα της AIT εγγυάται ότι K(\text{IC} \mid x, f(x)) \leq K(\text{IC} \mid x) + \mathcal{O}(1). Αν υποθέσουμε ότι ο κανόνας επιλογής της OPT φράσσεται ως αυστηρότερη περιγραφική συμβολοσειρά από το να δηλώνονται απλώς οι ακατέργαστοι νόμοι (που είναι το κεντρικό στοίχημα του πλαισίου, όχι μαθηματική αποδεικτική παράγωγος), τότε το υπολειμματικά κωδικοποιημένο K(\text{IC} \mid \text{OPT}) δεν μπορεί να υπερβαίνει σημαντικά το K(\text{IC} \mid \text{laws}). Αυτό αποδίδει ευρετικά \Delta_{\text{IC}} \geq 0.

Με αντικατάσταση: L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1). \blacksquare

Παρατήρηση. Υποθέτουμε ότι η ανθρωπική συμπίεση K(\text{IC} \mid \text{OPT}) \approx 0 λειτουργεί στο όριο όπου το Φίλτρο Σταθερότητας είναι ισχυρά περιοριστικό, αντιστοιχίζοντας μαθηματικά σε μοναδικές καταστάσεις συμβατές με παρατηρητή. Πρόκειται για μια αιτιολογημένη φυσική πρόταση και όχι για ένα αλγοριθμικά αποδεδειγμένο φράγμα μοναδικότητας.


§6. Πλεονέκτημα Πολυπλοκότητας Μοντέλου Σταθερού Αριθμού Bit — Θεώρημα T-4d

Θεώρημα T-4d (Μόνιμο πλεονέκτημα MDL σταθερού αριθμού bit — υπό την προϋπόθεση τυπικότητας). Για κάθε σταθερό, μη τετριμμένο υπολογίσιμο μοντέλο φυσικής \nu με K_0 < K(\nu) < \infty, η διατύπωση της Θεωρίας του Διατεταγμένου Patch (OPT) επιτυγχάνει ένα σταθερό, μόνιμο πλεονέκτημα πολυπλοκότητας μοντέλου ειδικά για κάθε y_{1:T} \in \mathcal{O} που είναι επίσης \nu-τυπικό. Καθώς το μήκος της ακολουθίας T \to \infty, η διαφορά στο συνολικό μήκος κώδικα φράσσεται δομικά:

L_T(\text{OPT}) - L_T(\nu) \to K_0 - K(\nu)

Απόδειξη. Από το T-4b, L_T(\text{OPT}) \leq K'_0 - \log \xi^{\text{Filter}}(y_{1:T}). Για κάθε υπολογίσιμο \nu, το θεώρημα του Σολομόνοφ εγγυάται ότι το \xi συγκλίνει προς το \nu ακριβώς πάνω σε \nu-τυπικές ακολουθίες: μετρώντας ως \nu-σχεδόν-όλα τα y_{1:\infty}. Σημειώστε εδώ τη βαθιά τυπική ένταση: το Φίλτρο Σταθερότητας απομονώνει ροές που αξιολογούνται αυστηρά ως χαμηλής εντροπίας και δομημένες, χαρτογραφώντας τες εγγενώς ως δομικά άτυπες σε σύγκριση με τις τυπικές ροές της μέτρησης \nu μέγιστης εντροπίας χωρίς περιορισμούς. Εκτός εάν η φιλτραρισμένη κλάση παρατηρητών \mathcal{O} και η \nu-τυπική κλάση διαθέτουν αποδείξιμη μη τετριμμένη μαθηματική επικάλυψη, το όριο σύγκλισης του Σολομόνοφ δεν μπορεί να αξιοποιηθεί εγγενώς. Κατά συνέπεια, το παρόν θεώρημα εφαρμόζεται υπό συνθήκη αν και μόνον αν η συγκεκριμένη φιλτραρισμένη ροή παρατηρητή παραμένει \nu-τυπική υπό τους συγκεκριμένους νόμους αναφοράς (αφήνοντας το σύνολο τέτοιων θεωρητικά συμβατών τεμνόμενων ροών τυπικά αχαρακτήριστο):

-\frac{1}{T} \log \xi(y_{1:T}) \to H(\nu) \quad \text{as } T \to \infty

όπου H(\nu) είναι ο ρυθμός εντροπίας του \nu. Ομοίως, -\frac{1}{T} \log \nu(y_{1:T}) \to H(\nu). Ασυμπτωτικά, οι όροι λογαριθμικής απώλειας ανά bit και λογαριθμικής πιθανοφάνειας συγκλίνουν και εξισώνονται, πράγμα που σημαίνει ότι το εναπομένον πλεονέκτημα στο συνολικό μήκος κώδικα απομονώνεται καθαρά στο μήκος περιγραφής του μοντέλου:

\left[L_T(\text{OPT}) - L_T(\nu)\right] \to K_0 - K(\nu) < 0 \qquad \text{[since } K_0 \approx 36 \text{ vs } K(\nu) \sim 1750 \text{]}

Σημείωση: Ενώ το συνολικό μήκος κώδικα διατηρεί αυτό το μόνιμο πλεονέκτημα σταθερού αριθμού bit, το πλεονέκτημα ανά bit (\frac{K_0 - K(\nu)}{T}) συρρικνώνεται ενεργά προς το μηδέν. Αυτό δεν αντιπροσωπεύει ένα ασυμπτωτικά διαρκώς αυξανόμενο πλεονέκτημα μέσω συσσώρευσης δεδομένων, αλλά μάλλον μια μόνιμη άκαμπτη δομική μετατόπιση. \blacksquare

Αριθμητική εκτίμηση για το \mathcal{M}_1: K(\mathcal{M}_1) - K_0 \approx 1714 bit. Μόλις οι πιθανοφάνειες λογαριθμικής απώλειας συγκλίνουν σε επαρκή \nu-τυπικά παράθυρα παρατήρησης, η OPT διατηρεί μια μόνιμη μαθηματική υπεροχή συνολικής κωδικοποίησης περίπου 1714 bit.


§7. Το Υπό Συνθήκη Πλεονέκτημα για Πεπερασμένο-T — Θεώρημα T-4e

Για ροές πεπερασμένου μήκους, η σύγκριση MDL απαιτεί το πλεονέκτημα συμπίεσης του IC από το T-4c να υπερβαίνει το γενικό κόστος K_0.

Θεώρημα T-4e (Υπό Συνθήκη Πλεονέκτημα MDL για Πεπερασμένο-T). Η OPT επιτυγχάνει ένα αυστηρό πλεονέκτημα MDL για πεπερασμένο-T έναντι του \mathcal{M}_1 — δηλαδή, L_T(\text{OPT}) < L_T(\mathcal{M}_1) — αν και μόνο αν ισχύει η ακόλουθη συνθήκη:

\boxed{K(\text{IC} \mid \text{SP laws}) > K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y_{1:T}) - \left(-\log P_{\text{SP}}(y_{1:T})\right)\right]}

Η αγκύλη στο RHS είναι το έλλειμμα λογαριθμικής πιθανοφάνειας της OPT σε σχέση με το SP στη συγκεκριμένη ροή y_{1:T}. Η συνθήκη ικανοποιείται όποτε το κόστος περιγραφής του IC υπερβαίνει το συνδυασμένο γενικό κόστος του μετα-κανόνα και το έλλειμμα πρόβλεψης της OPT σε αυτή τη ροή.

Απόδειξη. Άμεσος μετασχηματισμός των μηκών του διμερούς κώδικα:

L_T(\text{OPT}) < L_T(\text{SP}) \iff \quad K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) - \log \xi^{\text{Filter}}(y) < K_{\text{laws}} + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) \iff \quad K(\text{IC} \mid \text{laws}) - K_0 > \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] + \left[K_{\text{laws}} - K_{\text{laws}}\right]

Αναδιατάσσοντας (το K_{\text{laws}} απαλείφεται και από τις δύο πλευρές) προκύπτει άμεσα η διατυπωμένη συνθήκη. \blacksquare

7.1 Αξιολόγηση της Συνθήκης για την Καθιερωμένη Κοσμολογία

Υπό την πληθωριστική κωδικοποίηση (η ευνοϊκότερη περίπτωση για το SP):

Επομένως, η συνθήκη ανάγεται σε K(\text{IC} \mid \text{SP laws}) > K_0, δηλαδή 300 > 36. Αυτό ισχύει με σημαντικό δομικό περιθώριο. Η συνθήκη αποτυγχάνει μόνο αν το κόστος των IC είναι μικρότερο από \sim 36 bits — δηλαδή, αν τα συγκεκριμένα IC του σύμπαντός μας είναι δομικά παραγωγίσιμα από τους νόμους του SP και μόνο, αφήνοντας λιγότερα από 36 υπολειμματικά bits. Κανένα τρέχον κοσμολογικό μοντέλο δεν το επιτυγχάνει.


§8. Ο Συγκριτικός Πίνακας MDL

Μοντέλο K(\mathcal{M}) (bits) K(\text{IC}\mid\mathcal{M}) (bits) -\log P(y\mid\mathcal{M}) L_T σύνολο Κατάταξη MDL
\mathcal{M}_1 — SM + GR \sim 1750 \sim 300 (πληθωριστικό) \sim 0 (ντετερμινιστικό) \sim 2050 2η (πληθωριστικό)
\mathcal{M}_3 — Boltzmann \sim 1750 \sim 10 \gg 0 (σπάνια ροή) \gg 1760 Τελευταίο (καταστροφική πιθανοφάνεια)
\mathcal{M}_{\text{OPT}} — OPT \sim 36 \sim 0 (υπό συνθήκη μέσω του αυστηρά περιορισμένου Φίλτρου) \sim 0^* (ντετερμινιστική προσέγγιση κωδικοποιητή) \sim 36 (υπό συνθήκη) 1ο (υπό συνθήκη)

^* Υπό τη ρητή ταύτιση του κωδικοποιητή στην §9.2, ο ενεργός όρος δεδομένων της OPT ανάγεται σε -\log P_{K_\theta}(y) = -\log P_\text{SP}(y) = 0 μόλις το K_\theta ταυτιστεί με τον κωδικοποιητή SP.

§9. Όρια της Σύγκρισης

9.1 Το K(y \mid \text{Filter}) δεν είναι υπολογίσιμο

Το μήκος κώδικα της OPT K_0 + K(y \mid \text{Filter}) = K_0 - \log \xi^{\text{Filter}}(y) περιέχει έναν όρο που δεν είναι υπολογίσιμος με την έννοια του Turing (το πρόβλημα τερματισμού εμποδίζει τον ακριβή υπολογισμό του \xi). Στην πράξη, οι προβλέψεις της OPT πρέπει να προσεγγίζονται από έναν πεπερασμένο κωδικοποιητή K_\theta — κάτι που είναι σύμφωνο με τη συνήθη φυσική. Αυτό σημαίνει ότι, για προγνωστικούς σκοπούς, η OPT ανάγεται στον καλύτερο διαθέσιμο υπολογίσιμο κωδικοποιητή. Το πλεονέκτημα MDL της OPT έναντι της SP είναι επομένως ένα δομικό πλεονέκτημα (στην περιγραφή του κανόνα επιλογής) και όχι ένα λειτουργικό πλεονέκτημα ως προς την παραγωγή νέων προβλέψεων.

Αυτό δεν αποτελεί ελάττωμα — είναι το ορθό τυπικό περιεχόμενο του ισχυρισμού του preprint: «Η OPT μετατοπίζει μέρος του ερμηνευτικού βάρους από την απαρίθμηση νόμων στην επιλογή νόμων». Η μετατόπιση είναι πραγματική και τυπικά ποσοτικοποιημένη (\approx 1700 bits για τον κανόνα επιλογής έναντι του \mathcal{M}_1), αλλά δεν παράγει νέο προγνωστικό περιεχόμενο πέρα από εκείνο που ήδη παρέχει ο κωδικοποιητής.

9.2 Το Πρόβλημα Ταυτοποίησης του Κωδικοποιητή

Ο κωδικοποιητής OPT K_\theta είναι το συγκεκριμένο υπολογίσιμο μέτρο από το \mathcal{M} που επιλέγει το Φίλτρο Σταθερότητας. Το T-4 δεν καθορίζει ποιο είναι αυτό το μέτρο — αυτή η ταυτοποίηση απαιτεί το T-5 (ανάκτηση σταθερών) και το πλήρες πρόγραμμα φυσικής ενοποίησης. Μέχρι να ταυτοποιηθεί ρητά το K_\theta με το SM + GR, η σύγκριση MDL είναι εξαρτημένη από αυτή την ταυτοποίηση. Το τυπικό φράγμα L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 εγγυάται ότι η OPT δεν μπορεί να αποδώσει χειρότερα από τη SP, αλλά δεν εγγυάται ότι αποδίδει καλύτερα σε πεπερασμένο χρόνο, εκτός αν ικανοποιείται η συνθήκη IC του T-4e — κάτι που πράγματι ισχύει υπό τις συνήθεις κοσμολογικές παραδοχές.

Περιορισμός από το P-2. Το Παράρτημα P-2 (Ενσωμάτωση Χώρου Hilbert μέσω Κβαντικής Διόρθωσης Σφαλμάτων) θεμελιώνει ότι, υπό τοπικό θόρυβο, ο κωδικοποιητής πρέπει να ικανοποιεί δομή QECC — η εσωτερική του αναπαράσταση πρέπει να συνιστά έναν κβαντικό κώδικα διόρθωσης σφαλμάτων με συγκεκριμένες παραμέτρους (n, k, d). Αυτό περιορίζει περαιτέρω το πρόβλημα ταυτοποίησης του κωδικοποιητή: το K_\theta δεν είναι πλέον ένα αυθαίρετο υπολογίσιμο μέτρο, αλλά ένα μέτρο του οποίου οι προγνωστικές καταστάσεις φέρουν τη γεωμετρία διόρθωσης σφαλμάτων ενός χώρου Hilbert. Αυτός ο περιορισμός προηγείται του προγράμματος ανάκτησης σταθερών του T-5 και ενδέχεται να παρέχει πρόσθετα κριτήρια επιλογής για την ταυτοποίηση του K_\theta με το Καθιερωμένο Πρότυπο.


§10. Συνοπτικό Κλείσιμο

Παραδοτέα T-4 — Επιβεβαιωμένα Κλειστά (με Συνθήκες Κανονικοποίησης & Τυπικότητας)

  1. Οι συμβάσεις κωδικοποίησης οριστικοποιήθηκαν (§1). Διμερές MDL, πολυπλοκότητα Kolmogorov προθέματος ως προς μια συμπεριληπτική σταθερή UTM, με λειτουργική απεικόνιση του πεδίου δεδομένων πάνω στη συνειδητή ροή y_{1:T} = z_{0:T}.

  2. Οι κλάσεις αναφοράς οριστικοποιήθηκαν (§2). Αξιολογεί το \mathcal{M}_1 (SM+GR) έναντι τετριμμένων ορίων όπως το \mathcal{M}_2 (εκρηκτική επιλογή παραμέτρου γενετικού πεδίου) και το \mathcal{M}_3 (κατάρρευση πιθανοφάνειας Boltzmann).

  3. T-4a (Πολυπλοκότητα μετα-κανόνα). K(\xi, \text{Filter}) = K_0 \approx 36 bits, συμπεριλαμβανομένων των σχετικών μετατοπίσεων UTM.

  4. T-4b (Φραγμένο κατά Solomonoff). L_T(\text{OPT}) \leq L_T(\nu) + K_0 + \log(1/\xi(\mathcal{O})). Ορίζει ρητά την αλγοριθμική παράμετρο ποινής κανονικοποίησης.

  5. Εικασία T-4c (Ευρετικό άνω φράγμα συμπίεσης IC). Ο δομικός πλεονασμός των αρχικών συνθηκών είναι ο εικαζόμενος μηχανισμός της συμπίεσης: \Delta_{\text{IC}} = K(\text{IC}\mid\text{SP}) - K(\text{IC}\mid\text{OPT}) \geq 0, αν και η μοναδικότητα της απεικόνισης ισχύει μόνο υπό προϋποθέσεις. Αυτό λειτουργεί ως ευρετικό άνω φράγμα, όχι ως τυπικά αποδεδειγμένο θεώρημα.

  6. T-4d (Πλεονέκτημα μοντέλου σταθερών-bit). Υπό προϋποθέσεις φράσσει τη συμπεριφορά στο όριο: για υπολογίσιμα benchmarks των οποίων η \nu-τυπική κλάση επικαλύπτεται μη τετριμμένα με το \mathcal{O}, η OPT εξασφαλίζει ένα μόνιμο αριθμητικό πλεονέκτημα πολυπλοκότητας (\sim -1714 bits), αν και η άπειρη πυκνότητά της ανά bit κλιμακώνεται στο μηδέν.

  7. T-4e (Πεπερασμένο-T πλεονέκτημα — υπό προϋποθέσεις). Η OPT υπερέχει αριθμητικά του \mathcal{M}_1 για πεπερασμένο T ακριβώς όταν οι εμπειρικές σημειακές απώλειες δεν ανατρέπουν το βασικό δομικό όριο K(\text{IC}\mid\text{SP}) > K_0 (300 > 36). Εστιάζει την τρωτότητα ευθέως στις αλγοριθμικές υποθέσεις σημειακής κυριαρχίας.

Συνθήκες διάψευσης για τον ισχυρισμό MDL

Κατάντη εξαρτήσεις


Το παρόν παράρτημα συντηρείται ως μέρος του αποθετηρίου του έργου OPT παράλληλα με το theoretical_roadmap.pdf. Αναφορές: Rissanen (1978) [12], Li & Vitányi (2008) [27], Solomonoff (1964) [11], Penrose (2004).