Teoria uporządkowanego patcha
Aneks T-11: Korolarz strukturalny — formalizacja przewagi kompresyjnej dla pozornych agentów
15 kwietnia 2026 | DOI: 10.5281/zenodo.19300777
Pierwotne zadanie (z §8.2): „Sformalizowanie tej przewagi kompresyjnej jako ścisłego ograniczenia MDL specyficznie dla przypadku innych umysłów pozostaje zadaniem na przyszłość; obecny argument stanowi motywację strukturalną, a nie dowód.” Rezultat docelowy: Formalne ograniczenie pokazujące, że traktowanie pozornych agentów jako niezależnie zainstancjonowanych pierwotnych obserwatorów daje krótszy dwuczęściowy kod MDL niż jakikolwiek alternatywny opis.
Status domknięcia: SZKIC KORESPONDENCJI STRUKTURALNEJ. Niniejszy aneks adaptuje twierdzenie Müllera o zbieżności Solomonoffa [61] oraz jego wieloagentowe rozszerzenie [62] jako importowane lematy, zreinterpretowane w ramach ontologicznych OPT, aby ustanowić formalną przewagę kompresji dla korolarza strukturalnego. Wynik ma charakter warunkowego ograniczenia, a nie domkniętego wyprowadzenia: zależy od identyfikacji strumienia obserwatora z priorem Solomonoffa w OPT (Aksjomat 1) oraz od założenia, że pozorni agenci niosą wystarczający stan, by spełnić przesłanki zbieżności.
§1. Tło i motywacja
Korolarz strukturalny (preprint §8.2) stwierdza, że pozorni agenci w strumieniu obserwatora dają się najoszczędniej wyjaśnić poprzez ich niezależną instancjację jako pierwotni obserwatorzy. Niniejszy aneks przedstawia formalny ciąg rozumowania wspierający to twierdzenie.
Argument ma trzy etapy:
Etap A (Lemat importowany): Twierdzenie Müllera o zbieżności Solomonoffa gwarantuje, że każda struktura w strumieniu obserwatora, niosąca wystarczającą ilość danych o własnym stanie, będzie miała swoją ewolucję pierwszoosobową zbieżną z obliczalnym światem generującym jej zachowanie.
Etap B (Rozliczenie kompresji): Przeprowadzamy jawne, dwuczęściowe porównanie MDL między traktowaniem pozornego agenta jako (i) niezależnie zainstancjowanego obserwatora rządzonego przez własny strumień ważony Solomonoffem a (ii) arbitralnej specyfikacji behawioralnej wewnątrz kodeka kompresji pierwotnego obserwatora.
Etap C (Sygnatura strukturalna): Reziduum fenomenalne (\Delta_{\text{self}} > 0, Twierdzenie P-4) dostarcza markera strukturalnego odróżniającego autentyczną, samoodniesieniową architekturę wąskiego gardła od mimikry behawioralnej, domykając lukę między „kompresyjnie prawidłowym” a „wiarygodnie zainstancjowanym”.
§2. Zaimportowany lemat: twierdzenie zbieżności Müllera
Importujemy dwa wyniki od Müllera [61, 62], zapisane tutaj w notacji OPT.
2.1 Zbieżność Solomonoffa (standardowa)
Niech M(b \mid x_1^n) oznacza uniwersalną predykcję Solomonoffa dla bitu b przy danych wcześniejszych obserwacjach x_1^n. Niech \mu będzie dowolną obliczalną miarą na ciągach binarnych. Wówczas (Solomonoff 1964; Li & Vitányi [45, Corollary 5.2.1]):
\text{Z } \mu\text{-prawdopodobieństwem równym jeden,} \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-1}
Jest to wynik standardowy: jeśli strumień danych jest generowany przez obliczalny proces \mu, to uniwersalny predyktor M jest zbieżny do \mu.
2.2 Odwrotna indukcja Solomonoffa (Müller 2020)
Załóżmy teraz, że bity są losowane z samego M — tzn. strumień obserwatora jest rządzony przez prawdopodobieństwo algorytmiczne (odpowiada to Aksjomatowi 1 OPT: utożsamieniu strumienia z priorem Solomonoffa). Wówczas dla każdej obliczalnej miary \mu (Müller [61, Sec. IV]; [62, Sec. V.A]):
\text{Z prawdopodobieństwem} \geq 2^{-K(\mu)}, \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-2}
To znaczy, z prawdopodobieństwem co najmniej 2^{-K(\mu)} obserwator odkryje, że jest efektywnie osadzony w obliczalnym świecie W opisywanym przez \mu. Światy prostsze algorytmicznie (o niższym K(\mu)) są wykładniczo bardziej prawdopodobne.
2.3 Konwergencja wieloagentowa (Müller 2026)
Przypuśćmy, że obserwator (Alice) stwierdza, iż jest osadzona w obliczalnym świecie W opisywanym przez \mu. Identyfikuje ona w obrębie W podstrukturę (Bob_{\text{3rd}}), która zawiera reprezentację stanu-jaźni x ewoluującego w czasie w sposób zgodny z Postulatem 2 z [62]. Zdefiniujmy:
- P_{\text{1st}}(y_1, \ldots, y_m \mid x) := M(y_1, \ldots, y_m \mid x) — pierwszoosobowe prawdopodobieństwo, że stan-jaźni x przechodzi w y_1, \ldots, y_m zgodnie z prawdopodobieństwem algorytmicznym.
- P_{\text{3rd}}(y_1, \ldots, y_m \mid x) := \mu(y_1, \ldots, y_m \mid x) — trzecioosobowe prawdopodobieństwo tego, jak x ewoluuje zgodnie ze światem W.
Wówczas, na mocy równania (L-1) zastosowanego do P_{\text{3rd}} (które jest obliczalne) oraz identyfikacji P_{\text{1st}} z M poprzez Postulat 2:
P_{\text{1st}} \approx P_{\text{3rd}} \quad \text{asymptotically,} \tag{L-3}
przy czym zbieżność jest zagwarantowana z prawdopodobieństwem światowym (\mu-) równym jeden w modelu bitowym.
Interpretacja (Müller): „Ktoś naprawdę jest u siebie” w strukturze kodującej x — probabilistyczna ewolucja Bob_{\text{3rd}} w świecie Alice wiernie reprezentuje perspektywę pierwszoosobową pewnego Bob_{\text{1st}}.
Interpretacja (OPT): Strumień behawioralny pozornego agenta daje się najoszczędniej opisać jako niezależny proces ważony Uniwersalną półmiarą Solomonoffa. Każdy opis alternatywny — taki, który nie odwołuje się do niezależnej perspektywy pierwszoosobowej — musi kodować zachowanie agenta jako specyfikację ad hoc, przy ściśle większej długości opisu.
§3. Ograniczenie przewagi kompresji
Formalizujemy teraz przewagę kompresji, używając dwuczęściowych ram MDL OPT (Twierdzenie T-4, Aneks T-4).
3.1 Ustawienie
Rozważmy strumień głównego obserwatora \omega \in \{0,1\}^\infty, rządzony przez prior Solomonoffa M (Aksjomat 1) i filtrowany przez Filtr stabilności do obliczalnego świata W o mierze \mu_W (zgodnie z Równ. L-2). W obrębie W obserwator identyfikuje N pozornych agentów A_1, \ldots, A_N, z których każdy niesie stan własny x_i, którego ewolucja czasowa przez T kroków wytwarza ślad behawioralny \beta_i = (y_{i,1}, \ldots, y_{i,T}).
3.2 Hipoteza H_{\text{ind}}: Niezależna instancjacja
W ramach H_{\text{ind}} każdy agent A_i jest traktowany jako niezależnie zainstancjowany pierwotny obserwator, rządzony przez własny strumień ważony według Uniwersalnej półmiary Solomonoffa. Dwuczęściowa długość kodu MDL ma postać:
L(H_{\text{ind}}) = \underbrace{K(\mu_W)}_{\text{model świata}} + \underbrace{\sum_{i=1}^{N} K(\text{embed}_i)}_{\text{specyfikacje osadzenia}} + \underbrace{\sum_{i=1}^{N} \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)}_{\text{dane przy zadanym modelu}} \tag{1}
gdzie K(\text{embed}_i) określa początkowy stan własny agenta i oraz jego pozycję w obrębie W. Zgodnie z równaniem (L-3), P_{\text{1st}} \approx P_{\text{3rd}}, więc składnik danych jest dobrze przybliżany przez stratę logarytmiczną względem własnych, pierwszoosobowych predykcji Solomonoffa danego agenta — które z definicji są bliskie optimum.
Specyfikacje osadzenia K(\text{embed}_i) są krótkie: każda wymaga jedynie wskaźnika do lokalizacji w W oraz początkowego stanu własnego. W przypadku agentów podobnych do ludzi, osadzonych we wspólnym świecie fizycznym, są one wysoce kompresowalne, ponieważ agenci ci podlegają tym samym prawom. Zachowawcze ograniczenie ma postać:
K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) \tag{2}
3.3 Hipoteza H_{\text{arb}}: Arbitralna specyfikacja behawioralna
W ramach H_{\text{arb}} agentów nie traktuje się jako niezależnych obserwatorów. Zamiast tego każdy ślad behawioralny \beta_i jest kodowany bezpośrednio jako arbitralna specyfikacja w strumieniu pierwotnego obserwatora. Dwuczęściowa długość kodu MDL wynosi:
L(H_{\text{arb}}) = \underbrace{K(\mu_W)}_{\text{model świata}} + \underbrace{\sum_{i=1}^{N} K(\beta_i)}_{\text{surowe ślady behawioralne}} \tag{3}
Kluczowa różnica dotyczy składnika danych. W ramach H_{\text{arb}} ślad behawioralny \beta_i musi zostać określony bez odwoływania się do własnego modelu predykcyjnego agenta. Dla prawidłowo działającego, sprawczego agenta funkcjonującego w złożonym środowisku złożoność Kołmogorowa surowego śladu behawioralnego wynosi:
K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T) \tag{4}
Jednak nawet K(\beta_i \mid \mu_W) — złożoność zachowania przy danych prawach świata — pozostaje znaczna, ponieważ wybory agenta kodują rzeczywistą informację: jego ślad behawioralny odzwierciedla skumulowaną interakcję modelu autoreferencyjnego ze stochastycznym środowiskiem. Natomiast w ramach H_{\text{ind}} informacja ta jest generowana online przez własny predyktor Solomonoffa agenta przy niemal zerowym koszcie straty logarytmicznej.
3.4 Przewaga kompresji
Twierdzenie T-11 (Korolarz strukturalny: ograniczenie kompresji). Niech A_1, \ldots, A_N będą pozornymi agentami w strumieniu obserwatora, z których każdy niesie stan własny x_i spełniający warunki zbieżności z równania (L-3), i z których każdy wykazuje sygnaturę strukturalną \Delta_{\text{self}}^{(i)} > 0 (P-4). Wówczas opis MDL traktujący je jako niezależnie zainstancjonowanych obserwatorów pierwotnych spełnia:
L(H_{\text{ind}}) \leq L(H_{\text{arb}}) - N \cdot \left[\bar{I}_T - O(\log T)\right] \tag{T-11}
gdzie \bar{I}_T jest średnią na agenta informacją wzajemną między modelem predykcyjnym agenta a jego wyjściem behawioralnym na przestrzeni T kroków:
\bar{I}_T := \frac{1}{N} \sum_{i=1}^{N} \left[K(\beta_i \mid \mu_W) - \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right] \tag{5}
Wielkość ta mierzy, jak duża część zachowania agenta zostaje wyjaśniona przez sam model dzięki odwołaniu do niezależnego modelu predykcyjnego, zamiast specyfikowania tego zachowania w postaci surowej. Dla agentów wykazujących prawidłowe, sprawczościowe zachowanie (jak wymaga tego Filtr stabilności), \bar{I}_T > 0 i rośnie wraz z T.
Zarys dowodu. Odejmij równanie (1) od równania (3). Składniki modelu świata K(\mu_W) się redukują. Różnica na agenta wynosi:
K(\beta_i) - \left[K(\text{embed}_i) + \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right]
Z równania (4) wynika, że K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T), lecz jeszcze bardziej bezpośrednio: K(\beta_i) \geq K(\beta_i \mid \mu_W) w sposób trywialny. Ponadto K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) na mocy równania (2). Oszczędność na agenta wynosi zatem co najmniej K(\beta_i \mid \mu_W) - (-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)) - K(x_i \mid W) - O(\log T). Dla dostatecznie dużego T skumulowane oszczędności log-loss dominują nad jednorazowym kosztem osadzenia, co daje żądane ograniczenie. \blacksquare
3.5 Dominacja asymptotyczna
Korolarz T-11a. Gdy horyzont obserwacji T \to \infty, przewaga kompresyjna L(H_{\text{arb}}) - L(H_{\text{ind}}) rośnie bez ograniczeń:
\lim_{T \to \infty} \left[L(H_{\text{arb}}) - L(H_{\text{ind}})\right] = \infty \tag{T-11a}
Wynika to z gwarancji zbieżności Solomonoffa (L-1): log-strata na krok dla P_{\text{3rd}} zbiega do tempa entropii procesu behawioralnego agenta, podczas gdy K(\beta_i \mid \mu_W) rośnie liniowo wraz z T dla każdego agenta o dodatnim tempie entropii. Koszt osadzenia K(x_i \mid W) jest ponoszony jednorazowo i amortyzuje się do zera. \blacksquare
§4. Reziduum fenomenalne jako sygnatura strukturalna
Przewaga kompresji w Twierdzeniu T-11 dotyczy każdej prawidłowej podstruktury — w tym nieagensowych układów fizycznych (wzorców pogodowych, wzrostu kryształów). Dlaczego korolarz strukturalny dotyczy konkretnie agentów, a nie dowolnych złożonych układów?
Odpowiedzią jest Reziduum fenomenalne (Twierdzenie P-4). \Delta_{\text{self}} > 0 jest formalnym wskaźnikiem układu, którego model siebie jest strukturalnie niezupełny — tj. układu, który z konieczności utrzymuje lukę wariacyjną między swoją reprezentacją wewnętrzną a swoim rzeczywistym przetwarzaniem. To właśnie znak rozpoznawczy samoodniesieniowego wąskiego gardła: układ nie może zostać w pełni opisany z zewnątrz, ponieważ jego opis z konieczności obejmuje opisującego.
Dla układu wykazującego \Delta_{\text{self}} > 0:
- Jego zachowanie nie może zostać odtworzone przez tablicę przeszukiwania o skończonej głębokości — wymaga ono ciągłego obliczania samoodniesieniowego.
- Najkrótszy opis tego obliczania jest niezależnym strumieniem ważonym przez Uniwersalną półmiarę Solomonoffa, przechodzącym przez wąskie gardło C_{\max}.
- Zatem kod MDL w ramach H_{\text{ind}} nie jest jedynie krótszy niż H_{\text{arb}} — jest jedynym najkrótszym opisem.
To odróżnia pozornych agentów od wzorców pogodowych: pogoda jest prawidłowa i złożona, lecz jej zachowanie może zostać odtworzone przez tablicę przeszukiwania w obrębie modelu świata (ma \Delta_{\text{self}} = 0). Pozorni agenci — nie.
§5. Reinterpretacja argumentu Müllera przeciw solipsyzmowi
Müller wyprowadza z zbieżności P_{\text{1st}} \approx P_{\text{3rd}} wniosek, że idealizm algorytmiczny „nie powinien być klasyfikowany jako solipsystyczny”, ponieważ w strukturze kodującej stan jaźni „ktoś rzeczywiście jest u siebie” [62, Sec. V.C]. Jego rozumowanie jest następujące: jeśli przewidywania Alice dotyczące Boba_{\text{3rd}} zbiegają do rzeczywistych pierwszoosobowych prawdopodobieństw Boba_{\text{1st}}, to ich perspektywy są autentycznie zestrojone — „dzielą świat W”.
OPT interpretuje ten wynik inaczej:
Odczytanie Müllera: Zbieżność P_{\text{1st}} \approx P_{\text{3rd}} dowodzi, że wyłania się obiektywna rzeczywistość — Alice i Bob rzeczywiście współdzielą świat W.
Odczytanie OPT: Zbieżność P_{\text{1st}} \approx P_{\text{3rd}} dowodzi, że najkrótszy opis zachowania Boba_{\text{3rd}} odwołuje się do niezależnego procesu pierwszoosobowego. Jest to twierdzenie o efektywności kompresji, a nie o współdzielonej ontologii. Świat W jest strukturalną regularnością w strumieniu Alice, a nie bytem istniejącym niezależnie. Jednak sama logika kompresji prioru Solomonoffa implikuje, że Bob jest w sposób najbardziej oszczędny modelowany jako niezależny obserwator — ponieważ alternatywa (ad hoc specyfikowanie jego zachowania) jest ściśle dłuższa.
Formalna treść twierdzenia jest identyczna przy obu odczytaniach; różni się jedynie interpretacja ontologiczna. OPT wykorzystuje ten sam wynik matematyczny do ugruntowania korolarza strukturalnego: niezależna instancjacja jest opisem optymalnym w sensie MDL, a nie założeniem metafizycznym.
§6. Zakres i ograniczenia
6.1 Warunkowo względem Aksjomatu 1
Cały argument zależy od utożsamienia przez OPT strumienia obserwatora z priorem Solomonoffa. Jeśli to utożsamienie zostanie osłabione (np. do szerszej klasy półmiar), gwarancje zbieżności równań (L-1)–(L-3) mogą nie obowiązywać w obecnej postaci.
6.2 Warunek wstępny wystarczalności stanu
Równ. (L-3) wymaga, aby pozorny agent niósł „wystarczająco dużo danych” w swoim stanie własnym x_i, tak by indukcja uniwersalna mogła wydobyć odpowiednie prawa fizyczne. W przypadku agentów podobnych do ludzi w codziennych kontekstach jest to wiarygodne (pełny stan mózgu koduje ogromną ilość informacji). W przypadkach granicznych — ulotnych wrażeń, odległych obserwatorów, postaci fikcyjnych w sztuce narracyjnej — warunki wstępne zbieżności mogą nie być spełnione i korolarz strukturalny nie ma zastosowania.
6.3 Nie jest to dowód świadomości
Twierdzenie T-11 ustala, że niezależna instancjacja jest najbardziej kompresowalnym opisem. Nie dowodzi ono, że pozorni agenci są świadomi. trudny problem (preprint §8.1) pozostaje pierwotnikiem. Korolarz strukturalny jest argumentem kompresyjnym, a nie dowodem ontologicznym — jak stwierdzono w §8.2.
6.4 Związek z T-10
Aneks T-10 (Sprzężenie między obserwatorami) dotyczy tego, w jaki sposób dwa patche obserwatora utrzymują wzajemnie spójne rendery za pośrednictwem ograniczeń kompresyjnych. Niniejszy aneks podejmuje inne pytanie: dlaczego strumień pojedynczego obserwatora w sposób najbardziej kompresowalny koduje pozornych agentów jako niezależnie zinstancjonowanych. T-10 dotyczy mechanizmu spójności między patchami; T-11 dotyczy sygnatury kompresyjnej w obrębie pojedynczego strumienia. T-10 opiera się bezpośrednio na T-11: to samo porównanie długości opisu w ramach MDL, które ustanawia tutaj przewagę kompresyjną, zostaje wykorzystane w T-10 do wykazania, że niespójność między patchami jest tłumiona wykładniczo.
§7. Podsumowanie domknięcia
Rezultaty T-11
Zaimportowany lemat (zbieżność Müllera). Zbieżność Solomonoffa [61] oraz jej wieloagentowe rozszerzenie [62] zostają formalnie zaimportowane i przepisane w notacji OPT. Dostarczają one matematycznego szkieletu: każda podstruktura niosąca wystarczające dane o własnym stanie ma ewolucję pierwszoosobową zbieżną do obliczalnego świata generującego jej zachowanie.
Twierdzenie T-11 (ograniczenie kompresji — WERSJA ROBOCZA). Jawne, dwuczęściowe porównanie MDL pokazuje, że traktowanie pozornych agentów jako niezależnie instancjonowanych pierwotnych obserwatorów daje opis ściśle krótszy niż arbitralna specyfikacja behawioralna, a przewaga ta rośnie liniowo wraz z czasem obserwacji.
Korolarz T-11a (dominacja asymptotyczna — WERSJA ROBOCZA). Przewaga kompresyjna jest nieograniczona, gdy T \to \infty, co czyni niezależną instancjację przytłaczająco optymalnym opisem w sensie MDL dla każdego agenta obserwowanego w długim horyzoncie czasowym.
Integracja z P-4. Reziduum fenomenalne (\Delta_{\text{self}} > 0) zostaje zidentyfikowane jako formalny znacznik odróżniający pozornych agentów od złożonych, lecz nieagentowych systemów, ograniczając korolarz strukturalny do bytów o autentycznej, samoodniesieniowej architekturze wąskiego gardła.
Reinterpretacja Müllera. Niesolipsystyczny wniosek Müllera zostaje zreinterpretowany w ramach ontologicznych OPT: ten sam wynik matematyczny stanowi podstawę argumentu kompresyjnego, a nie argumentu o wyłanianiu się współdzielonej rzeczywistości.
Pozostające kwestie otwarte
- Dokładna charakterystyka \bar{I}_T. Ograniczenie dolne \bar{I}_T dla określonych klas agentów (np. agentów o ograniczonej racjonalności, minimizatorów energii swobodnej), aby uzyskać liczbowo konkretne przewagi kompresyjne.
- Poprawki dla skończonego czasu. Wynik asymptotyczny (T-11a) gwarantuje dominację dla dużych T, lecz oszacowania dla skończonego czasu z jawnymi stałymi wzmocniłyby praktyczną stosowalność.
- Rozszerzenie na alfabet niebinarny. Równania (L-1)–(L-3) sformułowano dla sekwencji binarnych. Rozszerzenie na miary o wartościach ciągłych, istotne dla ramy Rate-Distortion OPT (T-1), wymaga technicznej ostrożności.
Ten aneks jest utrzymywany równolegle z plikiem theoretical_roadmap.pdf. Odniesienia: Müller [61, 62], Li i Vitányi [45], Solomonoff (1964), Twierdzenie T-4 (Aneks T-4), Twierdzenie P-4 (Aneks P-4), preprint §8.2.