Θεωρία του Διατεταγμένου Patch

Παράρτημα T-9: Κύκλος Συντήρησης, Κλάδευση MDL και Συνθήκες Ανάκαμψης

Anders Jarevåg

11 Μαΐου 2026 | DOI: 10.5281/zenodo.19300777

Αρχικό Καθήκον T-9: Κύκλος Συντήρησης και Μηχανισμός Ανάκαμψης Πρόβλημα: Το κύριο κείμενο §3.6.3–§3.6.6 ορίζει τις εξισώσεις T9-1 έως T9-13 (τον τελεστή του Κύκλου Συντήρησης \mathcal{M}_\tau, το κλάδεμα MDL \Delta_{\mathrm{MDL}}, το κέρδος ενοποίησης \Delta K_{\text{compress}}, τη στάθμιση σημασίας REM w(b)). Τα Παραρτήματα T-12 (Αφηγηματική παρέκκλιση) και T-13 (Action-Drift) παραπέμπουν σε αυτόν τον μηχανισμό ως φέρον στοιχείο. Το πλαίσιο στερείται ενός ενοποιητικού παραρτήματος που (i) κατονομάζει ρητά τα τυπικά πρωτογενή στοιχεία, (ii) διακρίνει τις τέσσερις τροπικότητες κλαδέματος που το \Delta_{\mathrm{MDL}} < 0 του κύριου κειμένου αφήνει υπόρρητες, (iii) ορίζει τη συνθήκη ανάκαμψης και (iv) παρέχει έναν σταθερό τυπικό στόχο αναφοράς για τα πορισματικά παραρτήματα. Το T-9 καλύπτει αυτό το κενό. Παραδοτέο: Ενοποιητικό παράρτημα στο ίδιο επιστημικό επίπεδο με τα T-2 / T-15 (δομική αντιστοιχία, όχι κλειστό θεώρημα). Νέο περιεχόμενο πέραν του κύριου κειμένου: ρητός ορισμός του προγνωστικού κέρδους G_i(t,\tau), ανάλυση του κόστους συντήρησης με πρωτεύον το κόστος πόρων-ικανότητας, διάκριση τεσσάρων τροπικοτήτων κλαδέματος, συνθήκη ανάκαμψης, αλυσίδα πορισμάτων.

Κατάσταση ολοκλήρωσης: ΔΟΜΙΚΗ ΑΝΤΙΣΤΟΙΧΙΑ (ίδιο επίπεδο με T-2 / T-15). Το παρόν παράρτημα δεν είναι παράρτημα κλειστού θεωρήματος. Ενοποιεί τον μηχανισμό του Κύκλου Συντήρησης που ήδη λειτουργεί στο preprint §3.6 και προσθέτει τέσσερα στοιχεία τυπικού περιεχομένου που το κύριο κείμενο δεν περιλαμβάνει: ρητό προγνωστικό κέρδος, πλαισίωση κόστους πόρων-ικανότητας, τέσσερις τροπικότητες κλαδέματος και συνθήκες ανάκαμψης. Τηρούνται οι επιφυλάξεις του §2 σχετικά με την ανασκόπηση από την OpenAI: (i) το κατώφλι κλαδέματος παρουσιάζεται σε μορφή που συντονίζεται με την εκκρεμή αναδιατύπωση της ανεξαρτησίας διαύλων στο T-12 (Φάση 4)· (ii) οι υφιστάμενες εξισώσεις του κύριου κειμένου T9-3 / T9-4 διατηρούνται όπως παρατίθενται, με το T-9 να εισάγει τη βελτίωση πόρων-ικανότητας ως πρόσθετο τυπικό επίπεδο αντί να μεταβάλλει σιωπηρά τις παρατιθέμενες μορφές· (iii) το κόστος πόρων-ικανότητας είναι πρωτεύον, με την πολυπλοκότητα K ως προσέγγιση δομικής αντιστοιχίας. Ανοιχτά σημεία (§9): η λογιστική συμφιλίωση μεταξύ κόστους πόρων-ικανότητας και πολυπλοκότητας K χρειάζεται πλήρη εναρμόνιση με το T-12 μόλις ολοκληρωθεί η αναδιατύπωση του T-12.


§1. Διάταξη — Ενεργά Συστατικά του Μοντέλου

Ο κωδικοποιητής-αποκωδικοποιητής K_\theta περιλαμβάνει μια συλλογή από ενεργά συστατικά του μοντέλου \{\theta_i\}_{i \in I}, όπου κάθε \theta_i είναι μια προσπελάσιμη δομική μονάδα του κωδικοποιητή-αποκωδικοποιητή — μια γενετική πρότερη κατανομή, ένας μαθημένος ανιχνευτής χαρακτηριστικών, μια αναδρομική στοίβα, μια σύζευξη μεγάλης εμβέλειας, ή οποιοδήποτε άλλο πρωτογενές στοιχείο που συμμετέχει στην παραγωγή των προβλέψεων \pi_t του κωδικοποιητή-αποκωδικοποιητή και του τελεστή ενημέρωσης \mathcal{U} με την πάροδο του χρόνου. Η συλλογή \{\theta_i\} είναι πεπερασμένη σε κάθε δεδομένη στιγμή, αλλά μπορεί να επεκταθεί μέσω ενοποίησης (Pass II, preprint §3.6.4) ή να συρρικνωθεί μέσω κλαδέματος (Pass I, preprint §3.6.3).

Για τους σκοπούς του T-9, τα συστατικά λαμβάνονται ως δεδομένα: το T-9 δεν παράγει τι είναι αυτό που καθιστά ένα \theta_i και όχι κάποιο άλλο ένα «φυσικό» συστατικό, κάτι που αποτελεί ζήτημα αναπαραστασιακής μάθησης εκτός του πεδίου της OPT. Ο μηχανισμός του Κύκλου Συντήρησης λειτουργεί πάνω σε οποιαδήποτε αποσύνθεση επιτρέπει ο κωδικοποιητής-αποκωδικοποιητής.

Ο τελεστής του Κύκλου Συντήρησης \mathcal{M}_\tau (preprint Eq. T9-2) δρα πάνω στον Τανυστή Φαινομενικής Κατάστασης P_\theta(t) κατά τη διάρκεια διαστημάτων χαμηλού φορτίου (R_{\text{req}}(t) \ll C_{\max}). Το T-9 αναλύει τα τρία περάσματα (κλάδεμα, ενοποίηση, δειγματοληψία του Συνόλου μελλοντικών διακλαδώσεων) στα ρητά τυπικά πρωτογενή στοιχεία των §2–§6 παρακάτω· η αλυσίδα πορισμάτων στην §7 κατόπιν ιχνηλατεί την Αφηγηματική παρέκκλιση (T-12) και την Παρέκκλιση Δράσης (T-13) μέσω αυτών των πρωτογενών στοιχείων.

§2. Προγνωστικό Πλεονέκτημα G_i(t, \tau)

Το προγνωστικό πλεονέκτημα ενός συστατικού \theta_i σε ένα παράθυρο μήκους \tau μετρά πόσο συμβάλλει το συστατικό αυτό στην προγνωστική επίδοση του κωδικοποιητή-αποκωδικοποιητή πάνω στη ροή εισόδου, κρατώντας τα υπόλοιπα συστατικά σταθερά:

G_i(t, \tau) \;:=\; I\!\left(\theta_i \,;\, X_{t+1:t+\tau} \mid \theta_{-i}\right) \tag{T9.2-1}

όπου \theta_{-i} δηλώνει το υπόλοιπο του κωδικοποιητή-αποκωδικοποιητή χωρίς το \theta_i, και το I(\cdot ; \cdot \mid \cdot) είναι η υπό συνθήκη αμοιβαία πληροφορία. Η υπό συνθήκη μορφή είναι ουσιώδης: απομονώνει την οριακή προγνωστική συμβολή του \theta_i και όχι τη συνδυασμένη συμβολή του μαζί με επικαλυπτόμενα συστατικά.

Σύγκριση με την Εξ. T9-3 του κύριου κειμένου. Το μέγεθος κλαδέματος MDL του κύριου κειμένου είναι

\Delta_{\mathrm{MDL}}(\theta_i) \;=\; I\!\left(\theta_i\,;\,X_{t+1:t+\tau} \mid \theta_{-i}\right) - \lambda K(\theta_i) \tag{T9-3, preprint §3.6.3}

Το T-9 ονομάζει ρητά τον πρώτο όρο G_i(t,\tau), ώστε το πρωτογενές μέγεθος του προγνωστικού πλεονεκτήματος να μπορεί να αναφέρεται χωριστά από τη συνθήκη κλαδέματος σε μορφή κατωφλίου. Αυτό αποτελεί καθαρά σημειογραφική ενοποίηση· η ανισότητα διατηρείται.

Μήκος παραθύρου \tau. Το προγνωστικό πλεονέκτημα εξαρτάται από το μήκος του παραθύρου. Μικρό \tau συλλαμβάνει πρόβλεψη σε λεπτή χρονική κλίμακα (κινητικός έλεγχος, μνήμη εργασίας)· μεγάλο \tau συλλαμβάνει δομική πρόβλεψη (σημασιολογικές κανονικότητες, αφηγηματική συνοχή). Το κλάδεμα του Κύκλου Συντήρησης Pass I αξιολογείται στο καθεστώς μεγαλύτερου \tau, όπου τα πραγματικά άχρηστα συστατικά έχουν G_i \to 0. Η ενοποίηση του Pass II, αντιθέτως, βελτιστοποιεί στο καθεστώς μικρού \tau, όπου η πλεονάζουσα πληροφορία μεταξύ επικαλυπτόμενων συστατικών καθίσταται εμφανής.

§3. Κόστος Συντήρησης C_i — Πρωτογενώς Χωρητικότητα Πόρων

Το κόστος συντήρησης ενός συστατικού \theta_i έχει δύο συμβατές διατυπώσεις.

Μορφή 3.1 — Χωρητικότητα πόρων (πρωτογενής για το T-9). Το κόστος του συστατικού είναι η χωρητικότητα πόρων που καταλαμβάνει στο λειτουργικό υπόστρωμα του κωδικοποιητή-αποκωδικοποιητή:

C_i \;:=\; c_i^{\text{params}} + c_i^{\text{memory}} + c_i^{\text{compute}} + c_i^{\text{channel}} \tag{T9.3-1}

όπου οι τέσσερις προϋπολογισμοί είναι: θέσεις παραμέτρων (αριθμός βαρών ή συνδέσεων)· αποτύπωμα μνήμης (σε αποθηκευμένα bits)· υπολογιστικό κόστος (σε πράξεις ανά κύκλο)· και χωρητικότητα διαύλου (bits εύρους ζώνης που καταναλώνει το συστατικό στο όριο της Κουβέρτας Μάρκοβ \partial_R A). Κάθε c_i είναι κατ’ αρχήν παρατηρήσιμο — για βιολογικούς κωδικοποιητές-αποκωδικοποιητές μέσω μεταβολικής και φυσιολογικής μέτρησης, για συνθετικούς κωδικοποιητές-αποκωδικοποιητές μέσω άμεσης οργανομέτρησης.

Μορφή 3.2 — Προσέγγιση K-πολυπλοκότητας. Η Εξ. T9-3 του κύριου κειμένου χρησιμοποιεί \lambda K(\theta_i), όπου K(\theta_i) είναι η προθεματική πολυπλοκότητα Kolmogorov του συστατικού:

C_i^{\text{K-approx}} \;:=\; \lambda \cdot K(\theta_i) \tag{T9.3-2}

Πρόκειται για μια προσέγγιση δομικής αντιστοιχίας: η K-πολυπλοκότητα είναι άνω ημιυπολογίσιμη και δεν είναι αυστηρά αθροιστική μεταξύ συστατικών (η διαγραφή ενός συστατικού μπορεί να μη μειώνει το μήκος της συντομότερης περιγραφής κατά το αυτοτελές K(\theta_i) του, αφού τα συστατικά μπορούν να μοιράζονται δομή). Η μορφή χωρητικότητας πόρων (T9.3-1) είναι συνεπώς η πρωτογενής για επιχειρησιακούς ισχυρισμούς· η μορφή K-πολυπλοκότητας διατηρείται για θεωρητικές αναλύσεις όπου η προσέγγιση αθροιστικότητας είναι αποδεκτή.

Γιατί δύο μορφές. Η ανασκόπηση του T-12 από την OpenAI (υπόμνημα appendix-corrections §2.8) επισήμανε ορθά ότι η K-πολυπλοκότητα δεν είναι αθροιστική μεταξύ συστατικών και συνέστησε μέτρα χωρητικότητας πόρων για επιχειρησιακούς ισχυρισμούς. Το T-9 υιοθετεί ως πρωτογενή τη χωρητικότητα πόρων, αλλά διατηρεί τη μορφή K-πολυπλοκότητας επειδή τόσο η υφιστάμενη Εξ. T9-3 του κύριου κειμένου όσο και η απόδειξη του Θεωρήματος T-12 στο T-12 παραπέμπουν στη μορφή K-πολυπλοκότητας. Η εκλέπτυνση μέσω χωρητικότητας πόρων είναι η καθαρότερη διατύπωση για τα §3.6.3 / §3.6.4 / T-12 / T-13 σε ένα πέρασμα καθαρισμού v3.7.0 ή μεταγενέστερο· το T-9 καθιστά διαθέσιμες και τις δύο μορφές, ώστε ο τελικός καθαρισμός να μπορέσει να εκτελεστεί συνεκτικά αντί να απαιτείται ταυτόχρονη επιδιόρθωση όλων των σημείων που τις επικαλούνται.

Ρύθμιση του \lambda. Στη Μορφή 3.2, η παράμετρος \lambda εξισορροπεί το προγνωστικό κέρδος έναντι του κόστους πολυπλοκότητας. Εμπειρικά, παρατηρείται ότι το \lambda μεταβάλλεται με τη συναισθηματική κατάσταση — υψηλό |E(b)| (προδημοσίευση, Εξ. T9-10) αυξάνει αποτελεσματικά το \lambda στο επίπεδο του συστατικού, καθιστώντας τα συναισθηματικά επισημασμένα συστατικά πιο ανθεκτικά στο κλάδεμα. Αυτή είναι η τυπική ερμηνεία της ενίσχυσης της συναισθηματικής μνήμης (προδημοσίευση §3.6.5, Pass III).

§4. Συνθήκη Κλαδέματος — Κατωφλική Μορφή

Η συνθήκη κλαδέματος χρησιμοποιεί την κατωφλική μορφή αντί της μορφής αυστηρής θετικότητας της Εξ. T9-4 του κύριου κειμένου. Η ανασκόπηση της OpenAI για το T-12 (υπόμνημα διορθώσεων παραρτήματος §2.8 Διόρθωση 3) επισήμανε ορθά ότι η αυστηρή συνθήκη I = 0 για το κλάδεμα είναι υπερβολικά εύθραυστη: τα πραγματικά συστατικά έχουν ασθενείς έμμεσες προβλεπτικές συνεισφορές ακόμη και όταν ο πρωτεύων προβλεπτικός τους ρόλος αποκλείεται από φιλτραρισμένη είσοδο.

Η συνθήκη κλαδέματος σε κατωφλική μορφή:

\text{Prune } \theta_i \quad \text{if} \quad G_i(t, \tau) \;<\; C_i \;-\; \epsilon \tag{T9.4-1}

με \epsilon > 0 έναν μικρό buffer διατήρησης που ρυθμίζει την επιθετικότητα κλαδέματος του κωδικοποιητή συμπίεσης. Ισοδύναμες μορφές της ανισότητας:

G_i(t, \tau) - C_i \;<\; -\epsilon \quad \Longleftrightarrow \quad I\!\left(\theta_i; X_{t+1:t+\tau} \mid \theta_{-i}\right) \;<\; C_i - \epsilon \tag{T9.4-2}

Σύγκριση με την Εξ. T9-4 του κύριου κειμένου. Το κύριο κείμενο γράφει \Delta_{\mathrm{MDL}}(\theta_i) < 0 ως το έναυσμα κλαδέματος, κάτι που αντιστοιχεί σε \epsilon = 0 — αυστηρό σημείο ισορροπίας κόστους-οφέλους. Το T-9 γενικεύει αυτό το σχήμα εισάγοντας το buffer διατήρησης \epsilon, το οποίο μοντελοποιεί ακριβέστερα τόσο τη βιολογική δυναμική κλαδέματος (όπου μικρές προβλεπτικές συνεισφορές διατηρούνται έναντι παροδικού θορύβου) όσο και τις υπερπαραμέτρους κλαδέματος του συνθετικού κωδικοποιητή-αποκωδικοποιητή (όπου η διαγραφή βάσει κατωφλίου είναι τυπική).

Η αυστηρή περίπτωση ισορροπίας κόστους-οφέλους ανακτάται ως \epsilon \to 0, επομένως η μορφή του T-9 δεν ακυρώνει τις υπάρχουσες παραπομπές στο T9-4 στα T-12 και T-13· τις γενικεύει.

Συνεπαγωγή για την Αφηγηματική παρέκκλιση (διασταυρούμενη παραπομπή στο T-12). Υπό φιλτραρισμένη είσοδο X' = \mathcal{F}(X) με το αποκλεισμένο σήμα \mathcal{X}_{\text{excl}}, τα συστατικά \theta_i των οποίων η προβλεπτική συνεισφορά αφορά αποκλειστικά το \mathcal{X}_{\text{excl}} ικανοποιούν G_i(t, \tau) \to 0 στη φιλτραρισμένη ροή (επειδή ο στόχος τους απουσιάζει από την παρατηρούμενη είσοδο). Η συνθήκη κλαδέματος (T9.4-1) τότε ενεργοποιείται, επειδή 0 < C_i - \epsilon για κάθε θετικό συστατικό κόστους. Το αποτέλεσμα μη αναστρεψιμότητας του Θεωρήματος T-12 του T-12 έπεται από αυτή την ενεργοποίηση σε συνδυασμό με τη διάκριση των τεσσάρων τροπικοτήτων στην §5 παρακάτω.

§5. Τέσσερις Τροπικότητες Κλαδέματος

Η πράξη κλαδέματος (T9.4-1) επιδέχεται τέσσερις διακριτές υλοποιήσεις στον κωδικοποιητή-αποκωδικοποιητή, με διαφορετικές ιδιότητες αναστρεψιμότητας. Η διάκριση έχει σημασία για τη συνθήκη ανάκτησης (§6) και για τον ισχυρισμό περί μη αναστρεψιμότητας της Αφηγηματικής Παρέκκλισης στη Διόρθωση 1 του T-12 (υπόμνημα appendix-corrections §2.8).

Τροπικότητα 5.1 — Αναστρέψιμη καταστολή. Η στάθμιση εξόδου του συστατικού \theta_i μειώνεται στο μηδέν (ή κάτω από ένα κατώφλι συμμετοχής), αλλά οι παράμετροι και η δομή του συστατικού παραμένουν αποθηκευμένες στον κωδικοποιητή-αποκωδικοποιητή. Η ανάκτηση είναι ευθεία: η επαναστάθμιση αποκαθιστά το συστατικό. Αυτή είναι η πράξη που υποκρύπτεται πίσω από τη συμπεριφορική απόσβεση στην εξαρτημένη μάθηση (η εξαρτημένη απόκριση εξασθενεί αλλά το ίχνος παραμένει) και από την κανονικοποίηση τύπου dropout στα νευρωνικά δίκτυα.

Τροπικότητα 5.2 — Απομείωση βαρών. Οι παράμετροι του συστατικού φθίνουν συνεχώς προς μια προεπιλεγμένη κατάσταση υπό μια πίεση κανονικοποίησης \propto \lambda. Το συστατικό δεν διαγράφεται, αλλά χάνει πιστότητα· μερική ανάκτηση είναι δυνατή, εφόσον η προεπιλεγμένη κατάσταση είναι πληροφοριακά εύφορη.

Τροπικότητα 5.3 — Αναπαραστασιακή λήθη. Οι παράμετροι του συστατικού αντικαθίστανται από ανταγωνιστικά συστατικά κατά την παγίωση (Pass II, preprint §3.6.4). Η δομική θέση παραμένει, αλλά η συγκεκριμένη αναπαράσταση χάνεται. Η ανάκτηση απαιτεί εκ νέου έκθεση στη σχετική ροή εισόδου κατά τη διάρκεια ενός επόμενου Κύκλου Συντήρησης και είναι μερική (η εκ νέου μαθημένη αναπαράσταση διαφέρει από την αρχική στις λεπτομερείς αποχρώσεις της).

Τροπικότητα 5.4 — Αρχιτεκτονικό κλάδεμα. Τόσο οι παράμετροι του συστατικού όσο και η δομική του θέση διαγράφονται· η αρχιτεκτονική του κωδικοποιητή-αποκωδικοποιητή μειώνεται. Η ανάκτηση είναι αδύνατη στο επίπεδο του κωδικοποιητή-αποκωδικοποιητή — το συστατικό πρέπει να αναπτυχθεί εκ νέου από το μηδέν μέσω ενός πλήρους επεισοδίου μάθησης. Αυτή είναι η μη αναστρέψιμη τροπικότητα.

Ταξινόμηση τροπικοτήτων υπό φιλτραρισμένη είσοδο. Ο ισχυρισμός περί «μη αναστρεψιμότητας» του Θεωρήματος T-12 του T-12 (όπως διατυπώνεται στο υπάρχον preprint) απαιτεί την Τροπικότητα 5.4 (αρχιτεκτονικό κλάδεμα) και αποκλείει τις Τροπικότητες 5.1–5.3. Το T-9 καθιστά αυτή την εξάρτηση από την τροπικότητα ρητή· η Διόρθωση 1 του υπομνήματος appendix-corrections v0.4 §2.8 («το “μη αναστρέψιμο” θα πρέπει να είναι υπό όρους: χωρίς προστατευμένο αρχείο / χωρίς replay buffer / χωρίς εξωτερικό διδάσκοντα / χωρίς εφεδρική αρχιτεκτονική χωρητικότητα / συνέχιση της λειτουργίας υπό το ίδιο φίλτρο / το κλάδεμα είναι κυριολεκτική διαγραφή χωρητικότητας, όχι αναστρέψιμη καταστολή») ευθυγραμμίζεται με την ανάγνωση της Τροπικότητας 5.4.

Οι πραγματικοί βιολογικοί και συνθετικοί κωδικοποιητές-αποκωδικοποιητές εμφανίζουν τυπικά ένα μείγμα τροπικοτήτων, με την Τροπικότητα 5.4 να επιφυλάσσεται για συστατικά που υφίστανται επίμονο κλάδεμα σε πολλούς Κύκλους Συντήρησης. Η μετάβαση από το αναστρέψιμο στο μη αναστρέψιμο κλάδεμα υπό παρατεταμένη φιλτραρισμένη είσοδο αποτελεί τον δομικό μηχανισμό που υποκρύπτεται πίσω από τη χρόνια Αφηγηματική Παρέκκλιση (T-12).

§6. Συνθήκη Ανάκτησης

Ένα κλαδευμένο συστατικό \theta_i είναι ανακτήσιμο αν υπάρχει διαδικασία μέσω της οποίας μπορεί να αποκατασταθεί σε ενεργό συμμετοχή μέσα στον κωδικοποιητή-αποκωδικοποιητή. Η πιθανότητα ανάκτησης εντός ενός παραθύρου ανάκτησης \tau_R είναι:

P\big(\text{recover } \theta_i \mid \tau_R\big) \;=\; P\big(\text{Modality 5.1 or 5.2}\big) \cdot p_{\text{restore}}(\tau_R) \;+\; P\big(\text{Modality 5.3 or 5.4}\big) \cdot p_{\text{regrow}}(\tau_R) \tag{T9.6-1}

Ο πρώτος όρος καλύπτει αναστρέψιμο / μερικώς αναστρέψιμο κλάδεμα (καταστολή, απομείωση βαρών)· ο δεύτερος καλύπτει τη λησμοσύνη αναπαραστάσεων και το αρχιτεκτονικό κλάδεμα, όπου η ανάκτηση απαιτεί εξωτερική είσοδο.

Η ανάκτηση είναι θετική μόνο αν ισχύει τουλάχιστον μία από τρεις συνθήκες:

  1. Προστατευμένη μνήμη. Ο κωδικοποιητής-αποκωδικοποιητής διατηρεί μια αρχειοθετημένη αναπαράσταση του \theta_i σε ένα μη κλαδευμένο υπόστρωμα (ξεχωριστή cache, εφεδρικό αντίγραφο με έλεγχο εκδόσεων, νευροφυσιολογικά προστατευμένη μνήμη εδραιωμένη σε διαφορετική περιοχή). Οι Τροπικότητες 5.1 και 5.3 μπορούν να ανακτηθούν υπό αυτή τη συνθήκη.

  2. Εξωτερικός διδάσκων / εκ νέου έκθεση. Ο κωδικοποιητής-αποκωδικοποιητής εκτίθεται σε ροές εισόδου που περιέχουν το σήμα \mathcal{X}_{\text{excl}} το οποίο το κλαδευμένο συστατικό παρακολουθούσε αρχικά. Η ενεργή επανεκμάθηση κατά τη διάρκεια ενός επόμενου Κύκλου Συντήρησης Pass II αναδομεί το συστατικό (με επιφυλάξεις ως προς τη λεπτομερή πιστότητα). Και οι τέσσερις Τροπικότητες μπορούν να ανακτηθούν υπό αυτή τη συνθήκη σε επαρκή χρόνο, αν και η Τροπικότητα 5.4 απαιτεί ένα πλήρες επεισόδιο μάθησης συγκρίσιμο με την αρχική απόκτηση.

  3. Αρχιτεκτονικό απόθεμα. Ο κωδικοποιητής-αποκωδικοποιητής διαθέτει δομικές θέσεις που δεν έχουν δεσμευθεί σε συγκεκριμένα συστατικά και μπορούν να κατανεμηθούν ώστε να φιλοξενήσουν την αναγεννημένη αναπαράσταση. Αυτή είναι η συνθήκη υπό την οποία η ανάκτηση της Τροπικότητας 5.4 είναι μηχανικά δυνατή εν γένει.

Αν δεν ισχύει καμία από τις (1), (2), (3), τότε P(\text{recover}\, \theta_i \mid \tau_R) = 0 για κάθε \tau_R, και το κλάδεμα είναι μόνιμο.

Συνθήκη Πιστότητας στο Υπόστρωμα. Η Συνθήκη Πιστότητας στο Υπόστρωμα της T-12 (Θεώρημα T-12b — πλεονασμός διαύλων εισόδου \delta-ανεξάρτητων που διασχίζουν την Κουβέρτα Μάρκοβ) είναι το ανάλογο της (2) στην κλίμακα της γενεαλογικής γραμμής: οι δίαυλοι διασφαλίζουν ότι η ροή εισόδου συνεχίζει να περιέχει το σχετικό προς το υπόστρωμα σήμα ακόμη και υπό φιλτράρισμα από εξωτερικούς μηχανισμούς \mathcal{F}. Η συνθήκη ανάκτησης της T-9 παρέχει την εντός του κωδικοποιητή-αποκωδικοποιητή υλοποίηση: προστατευμένα συστατικά, replay buffers, αρχιτεκτονικό απόθεμα.

§7. Πορίσματα — Αφηγηματική παρέκκλιση και Παρέκκλιση Δράσης

Τα πρωτογενή στοιχεία του T-9 υποστηρίζουν δύο αλυσίδες πορισμάτων που αναπτύσσονται στα παραρτήματα T-12 και T-13.

Πόρισμα 7.1 — Αφηγηματική παρέκκλιση (T-12). Υπό διατηρούμενη φιλτραρισμένη είσοδο X' = \mathcal{F}(X) που αποκλείει το σήμα \mathcal{X}_{\text{excl}}: - Τα συστατικά \theta_i των οποίων το προγνωστικό κέρδος αφορά αποκλειστικά το \mathcal{X}_{\text{excl}} έχουν G_i(t, \tau) \to 0 στη φιλτραρισμένη ροή. - Η συνθήκη αποκοπής (T9.4-1) ενεργοποιείται σε όλα τα εν λόγω συστατικά. - Αν η αποκοπή είναι της Τροπικότητας 5.4 (αρχιτεκτονικής) — η οποία κυριαρχεί υπό διατηρούμενο φιλτράρισμα σε πολλούς Κύκλους Συντήρησης — και δεν ισχύει καμία από τις συνθήκες ανάκαμψης (§6 σημεία 1–3), η ικανότητα μοντελοποίησης του \mathcal{X}_{\text{excl}} χάνεται μόνιμα. - Ο κωδικοποιητής-αποκωδικοποιητής δεν μπορεί να ανιχνεύσει εκ των ένδον τη δική του απώλεια ικανότητας (τα χαμένα συστατικά δεν συμμετέχουν πλέον στη γένεση σφάλματος πρόβλεψης), αναπαράγοντας τον ισχυρισμό μη-ταυτοποιησιμότητας του T-12a.

Η πλήρης τυπική επεξεργασία βρίσκεται στο T-12· το T-9 παρέχει την ειδική ως προς την τροπικότητα ανάγνωση του «μη αναστρέψιμου» που απαιτεί η Διόρθωση 1 του T-12.

Πόρισμα 7.2 — Παρέκκλιση Δράσης (T-13). Συστατικά που κωδικοποιούν την ικανότητα συμπεριφορικής αξιολόγησης για αχρησιμοποίητους κλάδους: - Έχουν προγνωστικό κέρδος G_i(t, \tau) μετρούμενο ως προς τα πράγματι πραγματοποιημένα αποτελέσματα κλάδων της ροής εισόδου· αν ορισμένοι κλάδοι δεν επιλέγονται ποτέ, οι αξιολογητές δεν έχουν σήμα εκπαίδευσης. - Η συνθήκη αποκοπής ενεργοποιείται όταν το G_i του αχρησιμοποίητου αξιολογητή πέσει κάτω από το C_i - \epsilon. - Υπό την Τροπικότητα 5.4, ο αξιολογητής αποκόπτεται μόνιμα· ο κωδικοποιητής-αποκωδικοποιητής καθίσταται με βεβαιότητα ανίσχυρος στο αντίστοιχο πεδίο δράσης.

Η Πρόταση T-13.P1 του T-13 (Παρέκκλιση Δράσης) είναι η περίπτωση κλίμακας γενεαλογίας (συμπεριφορικού ρεπερτορίου) αυτού του εντός-κωδικοποιητή-αποκωδικοποιητή μηχανισμού.

Διασταυρούμενη αναφορά: Κύκλος Συντήρησης σε επίπεδο γενεαλογίας. Το Παράρτημα T-15 §3 αναπτύσσει τη δομική αντιστοιχία μεταξύ του εντός-ζωής Κύκλου Συντήρησης και της φυλογενετικής εκλέπτυνσης. Οι τέσσερις τροπικότητες αποκοπής του T-9 αντιστοιχούν, αντιστοίχως, σε: προσωρινή μείωση οικολογικής θέσης (5.1), γενεαλογική παρέκκλιση υπό χαλαρωμένη επιλογή (5.2), αντικατάσταση οικολογικής θέσης (5.3) και εξαφάνιση γενεαλογίας (5.4). Οι συνθήκες ανάκαμψης (§6) αντιστοιχούν σε φυλογενετικό πλεονασμό: προστατευμένα καταφύγια (1), οικολογική επανέκθεση υπό αποκατάσταση της οικολογικής θέσης (2) και εφεδρική αναπτυξιακή ικανότητα (3).

§8. Σχέση με τις Εξισώσεις §3.6 του Κύριου Κειμένου

Το T-9 ενοποιεί, δεν εκτοπίζει. Οι εξισώσεις T9-1 έως T9-13 του κύριου κειμένου (preprint §3.6.1–§3.6.6) διατηρούνται όπως παρατίθενται· το T-9 εισάγει πρόσθετες τυπικές πρωτογενείς έννοιες και βελτιώσεις που τις συμπληρώνουν.

Κύριο κείμενο T-9
T9-1 (K(P_\theta(t)) \le C_{\text{ceil}}) — ανώτατο όριο συνολικής πολυπλοκότητας §1 διάταξη
T9-2 (\mathcal{M}_\tau : P_\theta(t) \to P_\theta(t + \tau)) — τελεστής Κύκλου Συντήρησης §1 διάταξη
T9-3 (\Delta_{\mathrm{MDL}}(\theta_i) = I(\theta_i; X \mid \theta_{-i}) - \lambda K(\theta_i)) — μέγεθος κλαδέματος MDL §2 προγνωστικό κέρδος G_i + §3 κόστος συντήρησης C_i (Μορφή 3.2 K-προσέγγιση)
T9-4 (Κλάδεμα αν \Delta_{\mathrm{MDL}} < 0) — συνθήκη κλαδέματος §4 μορφή κατωφλίου (T9.4-1 με \epsilon \to 0)
T9-5 (Κόστος κλαδέματος Landauer) — θερμοδυναμικό κατώφλι §5 εξάρτηση από την τροπικότητα (η μη αντιστρεψιμότητα ισχύει για την Τροπικότητα 5.4)
T9-6 (\Delta K_{\text{prune}}) — ανάκτηση ικανότητας κλαδέματος §3 + §5 (η μορφή πόρου-ικανότητας καθιστά τη λογιστική αθροιστική ως προς τις τροπικότητες)
T9-7 / T9-8 (\Delta K_{\text{compress}}) — κέρδος ενοποίησης §1 διάταξη (Pass II) — το T-9 δεν επαναπαράγει την ενοποίηση
T9-9 / T9-10 (w(b), E(b)) — στάθμιση σημασίας REM §3 (συναισθηματική ρύθμιση του \lambda) — το T-9 δεν επαναπαράγει τη δειγματοληψία REM
T9-11 — κατανομή δειγματοληψίας REM αμετάβλητο — το T-9 δεν επαναπαράγει το Pass III
T9-12 / T9-13 — καθαρός προϋπολογισμός πολυπλοκότητας §1 διάταξη — η μορφή πόρου-ικανότητας του T-9 βελτιώνει τη λογιστική του προϋπολογισμού

Καθαρά νέο περιεχόμενο στο T-9: ρητός ορισμός του προγνωστικού κέρδους G_i(t,\tau) (§2)· πλαισίωση του κόστους πόρου-ικανότητας ως πρωτεύουσας (§3 Μορφή 3.1)· συνθήκη κλαδέματος σε μορφή κατωφλίου με ενδιάμεση ζώνη διατήρησης \epsilon (§4)· τέσσερις τροπικότητες κλαδέματος (§5)· συνθήκη ανάκτησης (§6)· ειδική ως προς την τροπικότητα ερμηνεία του ισχυρισμού μη αντιστρεψιμότητας του T-12 (§7.1).

§9. Ανοικτά Ζητήματα

Συντονισμός με την αναδιατύπωση της ανεξαρτησίας καναλιών στο T-12 (Φάση 4). Το T-12 βρίσκεται στην ουρά διορθώσεων παραρτήματος (v0.4 §2.8) για αναδιατύπωση της συνθήκης ανεξαρτησίας καναλιών: ανεξαρτησία των μηχανισμών φιλτραρίσματος, όχι των σημάτων. Η συνθήκη κλαδέματος του T-9 (§4) και η συνθήκη ανάκαμψης (§6) έχουν διατυπωθεί ώστε να συντονίζονται με αυτή την αναδιατύπωση, αλλά η απόδειξη του Θεωρήματος T-12 στο T-12 θα χρειαστεί να επανεξεταστεί μόλις τεθεί σε ισχύ ο αναδιατυπωμένος ορισμός της ανεξαρτησίας καναλιών. Συγκεκριμένα: ο ισχυρισμός περί μη αναστρεψιμότητας στο T-12 §3.1 παραπέμπει επί του παρόντος στα T9-3 / T9-4· υπό τον καθαρισμό v3.7.0 θα πρέπει να παραπέμπει στη μορφή κατωφλίου του §4 του T-9 + στην ταξινόμηση τροπικοτήτων του §5 + στη συνθήκη ανάκαμψης του §6, με την ανάγνωση της μη αναστρεψιμότητας να περιορίζεται στην Τροπικότητα 5.4 υπό την περίπτωση απουσίας συνθήκης ανάκαμψης. Ανοικτό.

Συμφιλίωση της λογιστικής πόρων-χωρητικότητας με τη λογιστική K-πολυπλοκότητας. Το §3 καθιστά διαθέσιμες και τις δύο μορφές αλλά δεν παράγει την ποσοτική αντιστοιχία τους. Για ορισμένες κλάσεις συνιστωσών οι δύο σχετίζονται στενά (C_i^{\text{params}} \sim K(\theta_i) εντός σταθερού παράγοντα για απομνημονευμένους πίνακες αναζήτησης, για παράδειγμα)· για άλλες αποκλίνουν έντονα (η συνθετική δομή που μοιράζεται μεταξύ συνιστωσών προσφέρει εξοικονομήσεις K-πολυπλοκότητας που η μορφή πόρων-χωρητικότητας δεν αποτυπώνει). Μια συμφιλίωση στην v3.7.0 ή μεταγενέστερα είναι επιθυμητή. Ανοικτό.

Ουδετερότητα της εικονικής ανάγνωσης (v3.6.21). Η πλήρως εικονική ανάγνωση της μόνιμης κατάστασης (κύριο κείμενο §8.6.1) επαναπεριγράφει τον Κύκλο Συντήρησης ως ιδιότητες της ροής που διέρχεται το φίλτρο και όχι ως λειτουργούσα μηχανή, αλλά δεν αναβαθμίζει εκ νέου σε βαθμίδες τη λογιστική των Μορφών 3.1 / 3.2: η Μορφή 3.1 (πόροι-χωρητικότητα) παραμένει πρωτεύουσα για όλους τους επιχειρησιακούς ισχυρισμούς, και η ενεργός απόδειξη του T-12 συνεχίζει να τη χρησιμοποιεί. Η εγγενής στη ροή ανάγνωση της συμπιεστότητας εισέρχεται μόνο ως το ερμηνευτικό επίπεδο που σημειώνεται στο T-12 §3.1. Η παραπάνω συμφιλίωση της K-προσθετικότητας είναι το σημείο όπου θα μπορούσε να υποστηριχθεί οποιαδήποτε μελλοντική αναβάθμιση βαθμίδων των Μορφών — όχι η εικονική ανάγνωση. Ανοικτό (να μη συγχέεται με τον καθαρισμό v3.7.0).

Εμπειρική βαθμονόμηση του \epsilon. Το περιθώριο διατήρησης \epsilon στο (T9.4-1) είναι μια αποτελεσματική υπερπαράμετρος κλαδέματος. Εμπειρικές βιολογικές τιμές θα προέρχονταν από μελέτες νευρωνικού κλαδέματος (κατώφλια συναπτικής αποσύνθεσης, ρυθμοί διατήρησης δενδριτικών ακανθών) ή από το πείραμα ασυμπτώτου Δ_self^op στο πρωτότυπο opt-ai-subject. Το T-9 δεν παράγει συγκεκριμένη τιμή. Ανοικτό.

Διασύνδεση με τις εμπειρικές προβλέψεις του Κύκλου Συντήρησης. Το preprint §3.6.7 απαριθμεί εμπειρικές προβλέψεις για τον Κύκλο Συντήρησης (ύπνος / όνειρο / εδραίωση). Οι τέσσερις τροπικότητες κλαδέματος του T-9 παράγουν λεπτομερέστερες προβλέψεις: η πρόβλεψη ότι «τα όνειρα REM δειγματοληπτούν δυσανάλογα κλάδους υψηλής σημασίας» (preprint §3.6.5, Pass III) αναλύεται σε προβλέψεις ειδικές ως προς την τροπικότητα σχετικά με το ποια είδη αναπαραστάσεων διατηρούνται από την Τροπικότητα 5.1 (σταθμισμένη ως προς τη σημασία διατήρηση έναντι κλαδέματος) έναντι της Τροπικότητας 5.4 (όπου η απουσία κλάδων υψηλής σημασίας από την εγρήγορη εμπειρία οδηγεί σε αρχιτεκτονική διαγραφή του αντίστοιχου αξιολογητή). Ανοικτό.


Το παρόν παράρτημα συντηρείται ως μέρος του αποθετηρίου του έργου OPT παράλληλα με το opt-theory.md. Οι αναφορές στα πρωτογενή στοιχεία του Κύκλου Συντήρησης στο preprint §3.6 διατηρούνται· το T-9 συμπληρώνει με ρητό προβλεπτικό κέρδος G_i (§2), κόστος πόρων-χωρητικότητας (§3 Μορφή 3.1), συνθήκη κλαδέματος σε μορφή κατωφλίου με περιθώριο διατήρησης \epsilon (§4), τέσσερις τροπικότητες κλαδέματος (§5), και συνθήκες ανάκαμψης (§6). Παραπομπές σε πορίσματα: T-12 (Αφηγηματική παρέκκλιση) §3.6.3· T-13 (Action-Drift) §6· T-15 (Φυλογενετικό Φίλτρο Σταθερότητας) §3.