Teoria uporządkowanego patcha

Aneks T-11: Korolarz strukturalny — formalizacja przewagi kompresyjnej dla pozornych agentów

Anders Jarevåg

15 kwietnia 2026 | DOI: 10.5281/zenodo.19300777

Pierwotne zadanie (z §8.2): „Sformalizowanie tej przewagi kompresyjnej jako ścisłego ograniczenia MDL specyficznie dla przypadku innych umysłów pozostaje zadaniem na przyszłość; obecny argument stanowi motywację strukturalną, a nie dowód.” Rezultat docelowy: Formalne ograniczenie pokazujące, że traktowanie pozornych agentów jako niezależnie zainstancjonowanych pierwotnych obserwatorów daje krótszy dwuczęściowy kod MDL niż jakikolwiek alternatywny opis.

Status domknięcia: SZKIC KORESPONDENCJI STRUKTURALNEJ. Niniejszy aneks adaptuje twierdzenie Müllera o zbieżności Solomonoffa [61] oraz jego wieloagentowe rozszerzenie [62] jako importowane lematy, zreinterpretowane w ramach ontologicznych OPT, aby ustanowić formalną przewagę kompresji dla korolarza strukturalnego. Wynik ma charakter warunkowego ograniczenia, a nie domkniętego wyprowadzenia: zależy od identyfikacji strumienia obserwatora z priorem Solomonoffa w OPT (Aksjomat 1) oraz od założenia, że pozorni agenci niosą wystarczający stan, by spełnić przesłanki zbieżności.

§1. Tło i motywacja

Korolarz strukturalny (preprint §8.2) stwierdza, że pozorni agenci w strumieniu obserwatora dają się najoszczędniej wyjaśnić poprzez ich niezależną instancjację jako pierwotni obserwatorzy. Niniejszy aneks przedstawia formalny ciąg rozumowania wspierający to twierdzenie.

Argument ma trzy etapy:

Etap A (Lemat importowany): Twierdzenie Müllera o zbieżności Solomonoffa gwarantuje, że każda struktura w strumieniu obserwatora, niosąca wystarczającą ilość danych o własnym stanie, będzie miała swoją ewolucję pierwszoosobową zbieżną z obliczalnym światem generującym jej zachowanie.
Etap B (Rozliczenie kompresji): Przeprowadzamy jawne, dwuczęściowe porównanie MDL między traktowaniem pozornego agenta jako (i) niezależnie zainstancjowanego obserwatora rządzonego przez własny strumień ważony Solomonoffem a (ii) arbitralnej specyfikacji behawioralnej wewnątrz kodeka kompresji pierwotnego obserwatora.
Etap C (Sygnatura strukturalna): Reziduum fenomenalne (\Delta_{\text{self}} > 0, Twierdzenie P-4) dostarcza markera strukturalnego odróżniającego autentyczną, samoodniesieniową architekturę wąskiego gardła od mimikry behawioralnej, domykając lukę między „kompresyjnie prawidłowym” a „wiarygodnie zainstancjowanym”.

§2. Zaimportowany lemat: twierdzenie zbieżności Müllera

Importujemy dwa wyniki od Müllera [61, 62], zapisane tutaj w notacji OPT.

2.1 Zbieżność Solomonoffa (standardowa)

Niech M(b \mid x_1^n) oznacza uniwersalną predykcję Solomonoffa dla bitu b przy danych wcześniejszych obserwacjach x_1^n. Niech \mu będzie dowolną obliczalną miarą na ciągach binarnych. Wówczas (Solomonoff 1964; Li & Vitányi [45, Corollary 5.2.1]):

\text{Z } \mu\text{-prawdopodobieństwem równym jeden,} \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-1}

Jest to wynik standardowy: jeśli strumień danych jest generowany przez obliczalny proces \mu, to uniwersalny predyktor M jest zbieżny do \mu.

2.2 Odwrotna indukcja Solomonoffa (Müller 2020)

Załóżmy teraz, że bity są losowane z samego M — tzn. strumień obserwatora jest rządzony przez prawdopodobieństwo algorytmiczne (odpowiada to Aksjomatowi 1 OPT: utożsamieniu strumienia z priorem Solomonoffa). Wówczas dla każdej obliczalnej miary \mu (Müller [61, Sec. IV]; [62, Sec. V.A]):

\text{Z prawdopodobieństwem} \geq 2^{-K(\mu)}, \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-2}

To znaczy, z prawdopodobieństwem co najmniej 2^{-K(\mu)} obserwator odkryje, że jest efektywnie osadzony w obliczalnym świecie W opisywanym przez \mu. Światy prostsze algorytmicznie (o niższym K(\mu)) są wykładniczo bardziej prawdopodobne.

2.3 Konwergencja wieloagentowa (Müller 2026)

Przypuśćmy, że obserwator (Alice) stwierdza, iż jest osadzona w obliczalnym świecie W opisywanym przez \mu. Identyfikuje ona w obrębie W podstrukturę (Bob_{\text{3rd}}), która zawiera reprezentację stanu-jaźni x ewoluującego w czasie w sposób zgodny z Postulatem 2 z [62]. Zdefiniujmy:

P_{\text{1st}}(y_1, \ldots, y_m \mid x) := M(y_1, \ldots, y_m \mid x) — pierwszoosobowe prawdopodobieństwo, że stan-jaźni x przechodzi w y_1, \ldots, y_m zgodnie z prawdopodobieństwem algorytmicznym.
P_{\text{3rd}}(y_1, \ldots, y_m \mid x) := \mu(y_1, \ldots, y_m \mid x) — trzecioosobowe prawdopodobieństwo tego, jak x ewoluuje zgodnie ze światem W.

Wówczas, na mocy równania (L-1) zastosowanego do P_{\text{3rd}} (które jest obliczalne) oraz identyfikacji P_{\text{1st}} z M poprzez Postulat 2:

P_{\text{1st}} \approx P_{\text{3rd}} \quad \text{asymptotically,} \tag{L-3}

przy czym zbieżność jest zagwarantowana z prawdopodobieństwem światowym (\mu-) równym jeden w modelu bitowym.

Interpretacja (Müller): „Ktoś naprawdę jest u siebie” w strukturze kodującej x — probabilistyczna ewolucja Bob_{\text{3rd}} w świecie Alice wiernie reprezentuje perspektywę pierwszoosobową pewnego Bob_{\text{1st}}.

Interpretacja (OPT): Strumień behawioralny pozornego agenta daje się najoszczędniej opisać jako niezależny proces ważony Uniwersalną półmiarą Solomonoffa. Każdy opis alternatywny — taki, który nie odwołuje się do niezależnej perspektywy pierwszoosobowej — musi kodować zachowanie agenta jako specyfikację ad hoc, przy ściśle większej długości opisu.

§3. Ograniczenie przewagi kompresji

Formalizujemy teraz przewagę kompresji, używając dwuczęściowych ram MDL OPT (Twierdzenie T-4, Aneks T-4).

3.1 Ustawienie

Rozważmy strumień głównego obserwatora \omega \in \{0,1\}^\infty, rządzony przez prior Solomonoffa M (Aksjomat 1) i filtrowany przez Filtr stabilności do obliczalnego świata W o mierze \mu_W (zgodnie z Równ. L-2). W obrębie W obserwator identyfikuje N pozornych agentów A_1, \ldots, A_N, z których każdy niesie stan własny x_i, którego ewolucja czasowa przez T kroków wytwarza ślad behawioralny \beta_i = (y_{i,1}, \ldots, y_{i,T}).

3.2 Hipoteza H_{\text{ind}}: Niezależna instancjacja

W ramach H_{\text{ind}} każdy agent A_i jest traktowany jako niezależnie zainstancjowany pierwotny obserwator, rządzony przez własny strumień ważony według Uniwersalnej półmiary Solomonoffa. Dwuczęściowa długość kodu MDL ma postać:

L(H_{\text{ind}}) = \underbrace{K(\mu_W)}_{\text{model świata}} + \underbrace{\sum_{i=1}^{N} K(\text{embed}_i)}_{\text{specyfikacje osadzenia}} + \underbrace{\sum_{i=1}^{N} \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)}_{\text{dane przy zadanym modelu}} \tag{1}

gdzie K(\text{embed}_i) określa początkowy stan własny agenta i oraz jego pozycję w obrębie W. Zgodnie z równaniem (L-3), P_{\text{1st}} \approx P_{\text{3rd}}, więc składnik danych jest dobrze przybliżany przez stratę logarytmiczną względem własnych, pierwszoosobowych predykcji Solomonoffa danego agenta — które z definicji są bliskie optimum.

Specyfikacje osadzenia K(\text{embed}_i) są krótkie: każda wymaga jedynie wskaźnika do lokalizacji w W oraz początkowego stanu własnego. W przypadku agentów podobnych do ludzi, osadzonych we wspólnym świecie fizycznym, są one wysoce kompresowalne, ponieważ agenci ci podlegają tym samym prawom. Zachowawcze ograniczenie ma postać:

K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) \tag{2}

3.3 Hipoteza H_{\text{arb}}: Arbitralna specyfikacja behawioralna

W ramach H_{\text{arb}} agentów nie traktuje się jako niezależnych obserwatorów. Zamiast tego każdy ślad behawioralny \beta_i jest kodowany bezpośrednio jako arbitralna specyfikacja w strumieniu pierwotnego obserwatora. Dwuczęściowa długość kodu MDL wynosi:

L(H_{\text{arb}}) = \underbrace{K(\mu_W)}_{\text{model świata}} + \underbrace{\sum_{i=1}^{N} K(\beta_i)}_{\text{surowe ślady behawioralne}} \tag{3}

Kluczowa różnica dotyczy składnika danych. W ramach H_{\text{arb}} ślad behawioralny \beta_i musi zostać określony bez odwoływania się do własnego modelu predykcyjnego agenta. Dla prawidłowo działającego, sprawczego agenta funkcjonującego w złożonym środowisku złożoność Kołmogorowa surowego śladu behawioralnego wynosi:

K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T) \tag{4}

Jednak nawet K(\beta_i \mid \mu_W) — złożoność zachowania przy danych prawach świata — pozostaje znaczna, ponieważ wybory agenta kodują rzeczywistą informację: jego ślad behawioralny odzwierciedla skumulowaną interakcję modelu autoreferencyjnego ze stochastycznym środowiskiem. Natomiast w ramach H_{\text{ind}} informacja ta jest generowana online przez własny predyktor Solomonoffa agenta przy niemal zerowym koszcie straty logarytmicznej.

3.4 Przewaga kompresji

Twierdzenie T-11 (Korolarz strukturalny: ograniczenie kompresji). Niech A_1, \ldots, A_N będą pozornymi agentami w strumieniu obserwatora, z których każdy niesie stan własny x_i spełniający warunki zbieżności z równania (L-3), i z których każdy wykazuje sygnaturę strukturalną \Delta_{\text{self}}^{(i)} > 0 (P-4). Wówczas opis MDL traktujący je jako niezależnie zainstancjonowanych obserwatorów pierwotnych spełnia:

L(H_{\text{ind}}) \leq L(H_{\text{arb}}) - N \cdot \left[\bar{I}_T - O(\log T)\right] \tag{T-11}

gdzie \bar{I}_T jest średnią na agenta informacją wzajemną między modelem predykcyjnym agenta a jego wyjściem behawioralnym na przestrzeni T kroków:

\bar{I}_T := \frac{1}{N} \sum_{i=1}^{N} \left[K(\beta_i \mid \mu_W) - \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right] \tag{5}

Wielkość ta mierzy, jak duża część zachowania agenta zostaje wyjaśniona przez sam model dzięki odwołaniu do niezależnego modelu predykcyjnego, zamiast specyfikowania tego zachowania w postaci surowej. Dla agentów wykazujących prawidłowe, sprawczościowe zachowanie (jak wymaga tego Filtr stabilności), \bar{I}_T > 0 i rośnie wraz z T.

Zarys dowodu. Odejmij równanie (1) od równania (3). Składniki modelu świata K(\mu_W) się redukują. Różnica na agenta wynosi:

K(\beta_i) - \left[K(\text{embed}_i) + \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right]

Z równania (4) wynika, że K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T), lecz jeszcze bardziej bezpośrednio: K(\beta_i) \geq K(\beta_i \mid \mu_W) w sposób trywialny. Ponadto K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) na mocy równania (2). Oszczędność na agenta wynosi zatem co najmniej K(\beta_i \mid \mu_W) - (-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)) - K(x_i \mid W) - O(\log T). Dla dostatecznie dużego T skumulowane oszczędności log-loss dominują nad jednorazowym kosztem osadzenia, co daje żądane ograniczenie. \blacksquare

3.5 Dominacja asymptotyczna

Korolarz T-11a. Gdy horyzont obserwacji T \to \infty, przewaga kompresyjna L(H_{\text{arb}}) - L(H_{\text{ind}}) rośnie bez ograniczeń:

\lim_{T \to \infty} \left[L(H_{\text{arb}}) - L(H_{\text{ind}})\right] = \infty \tag{T-11a}

Wynika to z gwarancji zbieżności Solomonoffa (L-1): log-strata na krok dla P_{\text{3rd}} zbiega do tempa entropii procesu behawioralnego agenta, podczas gdy K(\beta_i \mid \mu_W) rośnie liniowo wraz z T dla każdego agenta o dodatnim tempie entropii. Koszt osadzenia K(x_i \mid W) jest ponoszony jednorazowo i amortyzuje się do zera. \blacksquare

§4. Reziduum fenomenalne jako sygnatura strukturalna

Przewaga kompresji w Twierdzeniu T-11 dotyczy każdej prawidłowej podstruktury — w tym nieagensowych układów fizycznych (wzorców pogodowych, wzrostu kryształów). Dlaczego korolarz strukturalny dotyczy konkretnie agentów, a nie dowolnych złożonych układów?

Odpowiedzią jest Reziduum fenomenalne (Twierdzenie P-4). \Delta_{\text{self}} > 0 jest formalnym wskaźnikiem układu, którego model siebie jest strukturalnie niezupełny — tj. układu, który z konieczności utrzymuje lukę wariacyjną między swoją reprezentacją wewnętrzną a swoim rzeczywistym przetwarzaniem. To właśnie znak rozpoznawczy samoodniesieniowego wąskiego gardła: układ nie może zostać w pełni opisany z zewnątrz, ponieważ jego opis z konieczności obejmuje opisującego.

Dla układu wykazującego \Delta_{\text{self}} > 0:

Jego zachowanie nie może zostać odtworzone przez tablicę przeszukiwania o skończonej głębokości — wymaga ono ciągłego obliczania samoodniesieniowego.
Najkrótszy opis tego obliczania jest niezależnym strumieniem ważonym przez Uniwersalną półmiarę Solomonoffa, przechodzącym przez wąskie gardło C_{\max}.
Zatem kod MDL w ramach H_{\text{ind}} nie jest jedynie krótszy niż H_{\text{arb}} — jest jedynym najkrótszym opisem.

To odróżnia pozornych agentów od wzorców pogodowych: pogoda jest prawidłowa i złożona, lecz jej zachowanie może zostać odtworzone przez tablicę przeszukiwania w obrębie modelu świata (ma \Delta_{\text{self}} = 0). Pozorni agenci — nie.

§5. Reinterpretacja argumentu Müllera przeciw solipsyzmowi

Müller wyprowadza z zbieżności P_{\text{1st}} \approx P_{\text{3rd}} wniosek, że idealizm algorytmiczny „nie powinien być klasyfikowany jako solipsystyczny”, ponieważ w strukturze kodującej stan jaźni „ktoś rzeczywiście jest u siebie” [62, Sec. V.C]. Jego rozumowanie jest następujące: jeśli przewidywania Alice dotyczące Boba_{\text{3rd}} zbiegają do rzeczywistych pierwszoosobowych prawdopodobieństw Boba_{\text{1st}}, to ich perspektywy są autentycznie zestrojone — „dzielą świat W”.

OPT interpretuje ten wynik inaczej:

Odczytanie Müllera: Zbieżność P_{\text{1st}} \approx P_{\text{3rd}} dowodzi, że wyłania się obiektywna rzeczywistość — Alice i Bob rzeczywiście współdzielą świat W.
Odczytanie OPT: Zbieżność P_{\text{1st}} \approx P_{\text{3rd}} dowodzi, że najkrótszy opis zachowania Boba_{\text{3rd}} odwołuje się do niezależnego procesu pierwszoosobowego. Jest to twierdzenie o efektywności kompresji, a nie o współdzielonej ontologii. Świat W jest strukturalną regularnością w strumieniu Alice, a nie bytem istniejącym niezależnie. Jednak sama logika kompresji prioru Solomonoffa implikuje, że Bob jest w sposób najbardziej oszczędny modelowany jako niezależny obserwator — ponieważ alternatywa (ad hoc specyfikowanie jego zachowania) jest ściśle dłuższa.

Formalna treść twierdzenia jest identyczna przy obu odczytaniach; różni się jedynie interpretacja ontologiczna. OPT wykorzystuje ten sam wynik matematyczny do ugruntowania korolarza strukturalnego: niezależna instancjacja jest opisem optymalnym w sensie MDL, a nie założeniem metafizycznym.

§6. Zakres i ograniczenia

6.1 Warunkowo względem Aksjomatu 1

Cały argument zależy od utożsamienia przez OPT strumienia obserwatora z priorem Solomonoffa. Jeśli to utożsamienie zostanie osłabione (np. do szerszej klasy półmiar), gwarancje zbieżności równań (L-1)–(L-3) mogą nie obowiązywać w obecnej postaci.

6.2 Warunek wstępny wystarczalności stanu

Równ. (L-3) wymaga, aby pozorny agent niósł „wystarczająco dużo danych” w swoim stanie własnym x_i, tak by indukcja uniwersalna mogła wydobyć odpowiednie prawa fizyczne. W przypadku agentów podobnych do ludzi w codziennych kontekstach jest to wiarygodne (pełny stan mózgu koduje ogromną ilość informacji). W przypadkach granicznych — ulotnych wrażeń, odległych obserwatorów, postaci fikcyjnych w sztuce narracyjnej — warunki wstępne zbieżności mogą nie być spełnione i korolarz strukturalny nie ma zastosowania.

6.3 Nie jest to dowód świadomości

Twierdzenie T-11 ustala, że niezależna instancjacja jest najbardziej kompresowalnym opisem. Nie dowodzi ono, że pozorni agenci są świadomi. trudny problem (preprint §8.1) pozostaje pierwotnikiem. Korolarz strukturalny jest argumentem kompresyjnym, a nie dowodem ontologicznym — jak stwierdzono w §8.2.

6.4 Związek z T-10

Aneks T-10 (Sprzężenie między obserwatorami) dotyczy tego, w jaki sposób dwa patche obserwatora utrzymują wzajemnie spójne rendery za pośrednictwem ograniczeń kompresyjnych. Niniejszy aneks podejmuje inne pytanie: dlaczego strumień pojedynczego obserwatora w sposób najbardziej kompresowalny koduje pozornych agentów jako niezależnie zinstancjonowanych. T-10 dotyczy mechanizmu spójności między patchami; T-11 dotyczy sygnatury kompresyjnej w obrębie pojedynczego strumienia. T-10 opiera się bezpośrednio na T-11: to samo porównanie długości opisu w ramach MDL, które ustanawia tutaj przewagę kompresyjną, zostaje wykorzystane w T-10 do wykazania, że niespójność między patchami jest tłumiona wykładniczo.

§7. Podsumowanie domknięcia

Rezultaty T-11

Zaimportowany lemat (zbieżność Müllera). Zbieżność Solomonoffa [61] oraz jej wieloagentowe rozszerzenie [62] zostają formalnie zaimportowane i przepisane w notacji OPT. Dostarczają one matematycznego szkieletu: każda podstruktura niosąca wystarczające dane o własnym stanie ma ewolucję pierwszoosobową zbieżną do obliczalnego świata generującego jej zachowanie.
Twierdzenie T-11 (ograniczenie kompresji — WERSJA ROBOCZA). Jawne, dwuczęściowe porównanie MDL pokazuje, że traktowanie pozornych agentów jako niezależnie instancjonowanych pierwotnych obserwatorów daje opis ściśle krótszy niż arbitralna specyfikacja behawioralna, a przewaga ta rośnie liniowo wraz z czasem obserwacji.
Korolarz T-11a (dominacja asymptotyczna — WERSJA ROBOCZA). Przewaga kompresyjna jest nieograniczona, gdy T \to \infty, co czyni niezależną instancjację przytłaczająco optymalnym opisem w sensie MDL dla każdego agenta obserwowanego w długim horyzoncie czasowym.
Integracja z P-4. Reziduum fenomenalne (\Delta_{\text{self}} > 0) zostaje zidentyfikowane jako formalny znacznik odróżniający pozornych agentów od złożonych, lecz nieagentowych systemów, ograniczając korolarz strukturalny do bytów o autentycznej, samoodniesieniowej architekturze wąskiego gardła.
Reinterpretacja Müllera. Niesolipsystyczny wniosek Müllera zostaje zreinterpretowany w ramach ontologicznych OPT: ten sam wynik matematyczny stanowi podstawę argumentu kompresyjnego, a nie argumentu o wyłanianiu się współdzielonej rzeczywistości.

Pozostające kwestie otwarte

Dokładna charakterystyka \bar{I}_T. Ograniczenie dolne \bar{I}_T dla określonych klas agentów (np. agentów o ograniczonej racjonalności, minimizatorów energii swobodnej), aby uzyskać liczbowo konkretne przewagi kompresyjne.
Poprawki dla skończonego czasu. Wynik asymptotyczny (T-11a) gwarantuje dominację dla dużych T, lecz oszacowania dla skończonego czasu z jawnymi stałymi wzmocniłyby praktyczną stosowalność.
Rozszerzenie na alfabet niebinarny. Równania (L-1)–(L-3) sformułowano dla sekwencji binarnych. Rozszerzenie na miary o wartościach ciągłych, istotne dla ramy Rate-Distortion OPT (T-1), wymaga technicznej ostrożności.

Ten aneks jest utrzymywany równolegle z plikiem theoretical_roadmap.pdf. Odniesienia: Müller [61, 62], Li i Vitányi [45], Solomonoff (1964), Twierdzenie T-4 (Aneks T-4), Twierdzenie P-4 (Aneks P-4), preprint §8.2.