Teoria patch-ului ordonat (OPT)

Anexa T-11: Corolar Structural — Formalizarea avantajului de compresie pentru agenții aparenți

Anders Jarevåg

15 aprilie 2026 | DOI: 10.5281/zenodo.19300777

Sarcina originală (din §8.2): „Formalizarea acestui avantaj de compresie ca limită MDL riguroasă, specific pentru cazul celorlalte minți, rămâne o direcție de lucru viitoare; argumentul de față este o motivație structurală, nu o demonstrație.” Livrabil: O limită formală care arată că tratarea agenților aparenți ca observatori primari instanțiați independent produce un cod MDL în două părți mai scurt decât orice descriere alternativă.

Stadiul închiderii: CORESPONDENȚĂ STRUCTURALĂ — DRAFT. Această anexă adaptează teorema de convergență Solomonoff a lui Müller [61] și extensia sa multi-agent [62] ca leme importate, reinterpretate în cadrul ontologic al OPT, pentru a stabili un avantaj formal de compresie pentru corolarul structural. Rezultatul este o limită condițională, nu o derivare închisă: el depinde de identificarea, în OPT, a fluxului observatorului cu priorul Solomonoff (Axioma 1) și de presupunerea că agenții aparenți poartă o stare suficientă pentru a satisface condițiile prealabile ale convergenței.

§1. Context și motivație

Corolarul Structural (preprint §8.2) afirmă că agenții aparenți din cadrul fluxului observatorului sunt explicați, în modul cel mai parcimonios, prin instanțierea lor independentă ca observatori primari. Această anexă oferă lanțul formal care susține această afirmație.

Argumentul are trei etape:

Etapa A (Lemă importată): Teorema de convergență Solomonoff a lui Müller garantează că orice structură din fluxul observatorului care poartă suficiente date despre propria stare va avea o evoluție la persoana întâi care converge astfel încât să corespundă lumii computabile ce îi generează comportamentul.
Etapa B (Contabilitatea compresiei): Efectuăm o comparație MDL explicită, în două părți, între tratarea agentului aparent ca (i) observator instanțiat independent, guvernat de propriul său flux ponderat Solomonoff, versus (ii) o specificație comportamentală arbitrară în interiorul codec-ului observatorului primar.
Etapa C (Semnătură structurală): Reziduul fenomenal (\Delta_{\text{self}} > 0, Teorema P-4) furnizează markerul structural care distinge o arhitectură autentică de tip gât de sticlă auto-referențial de mimetismul comportamental, închizând astfel distanța dintre „legalitate compresibilă” și „instanțiere plauzibilă”.

§2. Lemă importată: Teorema de convergență a lui Müller

Importăm două rezultate din Müller [61, 62], formulate aici în notația OPT.

2.1 Convergența Solomonoff (Standard)

Fie M(b \mid x_1^n) predicția universală Solomonoff pentru bitul b, dată observațiile anterioare x_1^n. Fie \mu orice măsură calculabilă peste secvențe binare. Atunci (Solomonoff 1964; Li & Vitányi [45, Corolarul 5.2.1]):

\text{Cu } \mu\text{-probabilitate unu,} \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-1}

Acesta este rezultatul standard: dacă fluxul de date este generat de un proces calculabil \mu, predictorul universal M converge către \mu.

2.2 Inducție Solomonoff inversă (Müller 2020)

Să presupunem acum că biții sunt extrași chiar din M — adică fluxul observatorului este guvernat de probabilitatea algoritmică (aceasta corespunde Axiomei 1 din OPT: identificarea fluxului cu priorul Solomonoff). Atunci, pentru orice măsură calculabilă \mu (Müller [61, Sec. IV]; [62, Sec. V.A]):

\text{Cu probabilitate} \geq 2^{-K(\mu)}, \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-2}

Cu alte cuvinte, cu o probabilitate de cel puțin 2^{-K(\mu)}, observatorul se va regăsi efectiv încorporat într-o lume calculabilă W, descrisă de \mu. Lumile algoritmic mai simple (cu K(\mu) mai mic) sunt exponențial mai probabile.

2.3 Convergență multi-agent (Müller 2026)

Să presupunem că observatorul (Alice) se găsește încorporat într-o lume calculabilă W descrisă de \mu. Ea identifică o substructură (Bob_{\text{3rd}}) în interiorul lui W care poartă o reprezentare a unei stări de sine x ce evoluează în timp într-un mod compatibil cu Postulatul 2 din [62]. Definim:

P_{\text{1st}}(y_1, \ldots, y_m \mid x) := M(y_1, \ldots, y_m \mid x) — probabilitatea la persoana întâi ca starea de sine x să tranziteze către y_1, \ldots, y_m sub probabilitate algoritmică.
P_{\text{3rd}}(y_1, \ldots, y_m \mid x) := \mu(y_1, \ldots, y_m \mid x) — probabilitatea la persoana a treia a modului în care x evoluează conform lumii W.

Atunci, prin Ec. (L-1) aplicată lui P_{\text{3rd}} (care este calculabilă), și prin identificarea lui P_{\text{1st}} cu M prin Postulatul 2:

P_{\text{1st}} \approx P_{\text{3rd}} \quad \text{asimptotic,} \tag{L-3}

cu convergența garantată cu probabilitate lumească (\mu-) unu în modelul pe biți.

Interpretare (Müller): „Cineva este cu adevărat acasă” în structura care codifică x — evoluția probabilistică a lui Bob_{\text{3rd}} în lumea lui Alice reprezintă fidel perspectiva la persoana întâi a unui anumit Bob_{\text{1st}}.

Interpretare (OPT): Fluxul comportamental al agentului aparent este descris cel mai compresibil ca un proces independent ponderat Solomonoff. Orice descriere alternativă — una care nu invocă o perspectivă independentă la persoana întâi — trebuie să codifice comportamentul agentului ca pe o specificație ad hoc, la o lungime de descriere strict mai mare.

§3. Limita avantajului de compresie

Formalizăm acum avantajul de compresie folosind cadrul MDL în două părți al OPT (Teorema T-4, Anexa T-4).

3.1 Configurare

Considerăm fluxul observatorului primar \omega \in \{0,1\}^\infty, guvernat de priorul Solomonoff M (Axioma 1) și filtrat prin Filtru de Stabilitate către o lume computabilă W cu măsura \mu_W (prin Ec. L-2). În interiorul lui W, observatorul identifică N agenți aparenți A_1, \ldots, A_N, fiecare purtând o stare de sine x_i a cărei evoluție temporală pe parcursul a T pași produce o urmă comportamentală \beta_i = (y_{i,1}, \ldots, y_{i,T}).

3.2 Ipoteza H_{\text{ind}}: Instanțiere independentă

Sub H_{\text{ind}}, fiecare agent A_i este tratat ca un observator primar instanțiat independent, guvernat de propriul său flux ponderat Solomonoff. Lungimea codului MDL în două părți este:

L(H_{\text{ind}}) = \underbrace{K(\mu_W)}_{\text{modelul lumii}} + \underbrace{\sum_{i=1}^{N} K(\text{embed}_i)}_{\text{specificații de încorporare}} + \underbrace{\sum_{i=1}^{N} \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)}_{\text{date condiționate de model}} \tag{1}

unde K(\text{embed}_i) specifică starea inițială de sine a agentului i și poziția sa în interiorul lui W. Prin Ec. (L-3), P_{\text{1st}} \approx P_{\text{3rd}}, astfel încât termenul de date este bine aproximat de pierderea logaritmică sub predicțiile Solomonoff la persoana întâi ale agentului însuși — care, prin definiție, este aproape optimă.

Specificațiile de încorporare K(\text{embed}_i) sunt scurte: fiecare necesită doar un indicator către o locație în W plus starea inițială de sine. Pentru agenți de tip uman încorporați într-o lume fizică partajată, acestea sunt puternic compresibile deoarece agenții împărtășesc aceleași legi. O limită conservatoare:

K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) \tag{2}

3.3 Ipoteza H_{\text{arb}}: Specificație comportamentală arbitrară

Sub H_{\text{arb}}, agenții nu sunt tratați ca observatori independenți. În schimb, fiecare urmă comportamentală \beta_i este codificată direct ca o specificație arbitrară în cadrul fluxului observatorului primar. Lungimea codului MDL în două părți este:

L(H_{\text{arb}}) = \underbrace{K(\mu_W)}_{\text{modelul lumii}} + \underbrace{\sum_{i=1}^{N} K(\beta_i)}_{\text{urme comportamentale brute}} \tag{3}

Diferența critică apare în termenul de date. Sub H_{\text{arb}}, urma comportamentală \beta_i trebuie specificată fără a invoca propriul model predictiv al agentului. Pentru un agent guvernat de regularități și orientat de agențialitate, care operează într-un mediu complex, complexitatea Kolmogorov a urmei comportamentale brute este:

K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T) \tag{4}

Dar chiar și K(\beta_i \mid \mu_W) — complexitatea comportamentului dată fiind legea lumii — rămâne substanțială, deoarece alegerile agentului codifică informație autentică: urma sa comportamentală reflectă interacțiunea acumulată dintre un model autoreferențial și un mediu stochastic. În schimb, sub H_{\text{ind}}, această informație este generată online de propriul predictor Solomonoff al agentului, la un cost de log-loss aproape nul.

3.4 Avantajul Compresiei

Teorema T-11 (Limita Structurală de Compresie a Corolarului Structural). Fie A_1, \ldots, A_N agenți aparenți în cadrul fluxului observatorului, fiecare purtând o stare de sine x_i ce satisface condițiile prealabile de convergență din Ec. (L-3) și fiecare manifestând semnătura structurală \Delta_{\text{self}}^{(i)} > 0 (P-4). Atunci descrierea MDL care îi tratează ca observatori primari instanțiați independent satisface:

L(H_{\text{ind}}) \leq L(H_{\text{arb}}) - N \cdot \left[\bar{I}_T - O(\log T)\right] \tag{T-11}

unde \bar{I}_T este informația mutuală medie per agent dintre modelul predictiv al agentului și ieșirea sa comportamentală pe parcursul a T pași:

\bar{I}_T := \frac{1}{N} \sum_{i=1}^{N} \left[K(\beta_i \mid \mu_W) - \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right] \tag{5}

Această mărime măsoară cât de mult din comportamentul agentului este explicat implicit prin invocarea unui model predictiv independent, în loc să fie specificat în mod brut. Pentru agenții care manifestă un comportament regulat, guvernat de agențialitate (așa cum cere Filtru de Stabilitate), \bar{I}_T > 0 și crește odată cu T.

Schiță a demonstrației. Se scade Ec. (1) din Ec. (3). Termenii modelului lumii K(\mu_W) se anulează. Diferența per agent este:

K(\beta_i) - \left[K(\text{embed}_i) + \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right]

Prin Ec. (4), K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T), dar și mai direct: K(\beta_i) \geq K(\beta_i \mid \mu_W) în mod trivial. Iar K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) prin Ec. (2). Economia per agent este, așadar, de cel puțin K(\beta_i \mid \mu_W) - (-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)) - K(x_i \mid W) - O(\log T). Pentru T suficient de mare, economiile cumulative de log-loss domină costul unic de încorporare, ceea ce dă limita. \blacksquare

3.5 Dominanță asimptotică

Corolarul T-11a. Pe măsură ce orizontul observațional T \to \infty, avantajul de compresie L(H_{\text{arb}}) - L(H_{\text{ind}}) crește fără limită:

\lim_{T \to \infty} \left[L(H_{\text{arb}}) - L(H_{\text{ind}})\right] = \infty \tag{T-11a}

Aceasta rezultă din garanția de convergență Solomonoff (L-1): log-loss-ul per pas al lui P_{\text{3rd}} converge către rata de entropie a procesului comportamental al agentului, în timp ce K(\beta_i \mid \mu_W) crește liniar în T pentru orice agent cu rată de entropie pozitivă. Costul de încorporare K(x_i \mid W) este plătit o singură dată și amortizat până la zero. \blacksquare

§4. Reziduul fenomenal ca semnătură structurală

Avantajul de compresie din Teorema T-11 se aplică oricărei substructuri guvernate de legi — inclusiv sistemelor fizice non-agențiale (modele meteorologice, creșterea cristalelor). De ce privește corolarul structural în mod specific agenții, mai degrabă decât sistemele complexe arbitrare?

Răspunsul este Reziduul fenomenal (Teorema P-4). \Delta_{\text{self}} > 0 este markerul formal al unui sistem al cărui model de sine este structural incomplet — adică un sistem care menține în mod necesar un decalaj variațional între reprezentarea sa internă și procesarea sa efectivă. Acesta este semnul distinctiv al blocajului auto-referențial: sistemul nu poate fi descris pe deplin din exterior, deoarece descrierea sa îl include în mod necesar pe cel care descrie.

Pentru un sistem care manifestă \Delta_{\text{self}} > 0:

Comportamentul său nu poate fi reprodus printr-un tabel de căutare de profunzime finită — el necesită un calcul auto-referențial continuu.
Cea mai scurtă descriere a acestui calcul este un flux independent ponderat Solomonoff care traversează un blocaj C_{\max}.
Prin urmare, codul MDL sub H_{\text{ind}} nu este doar mai scurt decât H_{\text{arb}} — este descrierea unic cea mai scurtă.

Aceasta distinge agenții aparenți de modelele meteorologice: vremea este guvernată de legi și este complexă, dar comportamentul ei poate fi reprodus printr-un tabel de căutare în interiorul modelului lumii (are \Delta_{\text{self}} = 0). Agenții aparenți nu pot.

§5. Reinterpretarea argumentului non-solipsist al lui Müller

Müller conchide, pornind de la convergența P_{\text{1st}} \approx P_{\text{3rd}}, că idealismul algoritmic „nu ar trebui clasificat drept solipsist”, deoarece „cineva este cu adevărat acasă” în structura care codifică o stare a sinelui [62, Sec. V.C]. Raționamentul său este următorul: dacă predicțiile lui Alice despre Bob_{\text{3rd}} converg către probabilitățile efective de persoana întâi ale lui Bob_{\text{1st}}, atunci perspectivele lor sunt aliniate în mod autentic — ei „împărtășesc lumea W”.

OPT reinterpretează acest rezultat în mod diferit:

Lectura lui Müller: Convergența P_{\text{1st}} \approx P_{\text{3rd}} dovedește că realitatea obiectivă emerge — Alice și Bob împărtășesc în mod autentic lumea W.
Lectura OPT: Convergența P_{\text{1st}} \approx P_{\text{3rd}} dovedește că cea mai scurtă descriere a comportamentului lui Bob_{\text{3rd}} invocă un proces independent de persoana întâi. Aceasta este o afirmație despre eficiența compresiei, nu despre o ontologie partajată. Lumea W este o regularitate structurală în interiorul fluxului lui Alice, nu o entitate care există independent. Dar logica de compresie a priori-ului Solomonoff însăși implică faptul că Bob este modelat în modul cel mai parcimonios ca observator independent — deoarece alternativa (specificarea comportamentului său ad hoc) este strict mai lungă.

Conținutul formal al teoremei este identic în ambele lecturi; diferă doar interpretarea ontologică. OPT folosește același rezultat matematic pentru a fundamenta corolarul structural: instanțierea independentă este descrierea optimă în sensul MDL, nu o presupunere metafizică.

§6. Domeniu de aplicare și limitări

6.1 Condiționat de Axioma 1

Întregul argument depinde de identificarea de către OPT a fluxului observatorului cu priorul Solomonoff. Dacă această identificare este slăbită (de exemplu, către o clasă mai largă de semimăsuri), garanțiile de convergență ale Ecu. (L-1)–(L-3) s-ar putea să nu se mențină în forma lor actuală.

6.2 Condiția prealabilă a suficienței stării

Ec. (L-3) cere ca agentul aparent să poarte „suficiente date” în auto-starea sa x_i pentru ca inducția universală să poată extrage legile fizice relevante. Pentru agenți de tip uman în contexte cotidiene, acest lucru este plauzibil (o stare completă a creierului codifică o cantitate enormă de informație). Pentru cazurile-limită — impresii trecătoare, observatori îndepărtați, personaje fictive din arta narativă — condițiile prealabile ale convergenței pot să nu fie satisfăcute, iar Corolarul Structural nu se aplică.

6.3 Nu este o dovadă a conștiinței

Teorema T-11 stabilește că instanțierea independentă este descrierea cea mai compresibilă. Ea nu dovedește că agenții aparenți sunt conștienți. Problema dificilă (preprint §8.1) rămâne un primitiv. Corolarul Structural este un argument de compresie, nu o dovadă ontologică — așa cum se afirmă în §8.2.

6.4 Relația cu T-10

Anexa T-10 (Cuplaj inter-observatori) tratează modul în care două patch-uri de observator își mențin randările reciproc consistente prin constrângeri de compresie. Prezenta anexă abordează o întrebare diferită: de ce fluxul unui observator unic codifică, în modul cel mai compresibil, agenții aparenți ca fiind instanțiați independent. T-10 privește mecanismul de coerență inter-patch; T-11 privește semnătura de compresie din interiorul unui singur flux. T-10 se bazează direct pe T-11: aceeași comparație MDL a lungimii descrierii, care stabilește aici avantajul de compresie, este exploatată în T-10 pentru a demonstra că inconsistența între patch-uri este suprimată exponențial.

§7. Rezumat de închidere

Livrabilele T-11

Lemă importată (convergența lui Müller). Convergența Solomonoff [61] și extensia sa multi-agent [62] sunt importate formal și reformulate în notația OPT. Acestea furnizează coloana vertebrală matematică: orice substructură care poartă suficiente date despre propria stare are evoluția sa la persoana întâi convergentă către lumea computabilă care îi generează comportamentul.
Teorema T-11 (Limită de compresie — DRAFT). O comparație MDL explicită, în două părți, arată că tratarea agenților aparenți ca observatori primari instanțiați independent produce o descriere strict mai scurtă decât o specificare comportamentală arbitrară, iar avantajul crește liniar odată cu timpul de observație.
Corolarul T-11a (dominanță asimptotică — DRAFT). Avantajul de compresie este nemărginit pe măsură ce T \to \infty, ceea ce face din instanțierea independentă descrierea covârșitor MDL-optimală pentru orice agent observat pe un orizont temporal lung.
Integrarea P-4. Reziduul fenomenal (\Delta_{\text{self}} > 0) este identificat drept markerul formal care distinge agenții aparenți de sistemele complexe, dar non-agențiale, restrângând corolarul structural la entități cu o arhitectură autentică de tip bottleneck auto-referențial.
Reinterpretarea lui Müller. Concluzia anti-solipsistă a lui Müller este reinterpretată în cadrul ontologic al OPT: același rezultat matematic fundamentează un argument de compresie, nu un argument privind emergența unei realități partajate.

Aspecte încă deschise

Caracterizarea exactă a lui \bar{I}_T. Limitarea inferioară a lui \bar{I}_T pentru clase specifice de agenți (de ex., agenți raționali limitați, minimizatori ai energiei libere) pentru a oferi avantaje de compresie numeric concrete.
Corecții la timp finit. Rezultatul asimptotic (T-11a) garantează dominanța pentru valori mari ale lui T, dar limitele la timp finit, cu constante explicite, ar întări aplicabilitatea practică.
Extensia la alfabete non-binare. Ecuațiile (L-1)–(L-3) sunt formulate pentru secvențe binare. Extinderea la măsurile cu valori continue relevante pentru cadrul Rată-Distorsiune al OPT (T-1) necesită atenție tehnică.

Această anexă este întreținută în paralel cu theoretical_roadmap.pdf. Referințe: Müller [61, 62], Li & Vitányi [45], Solomonoff (1964), Teorema T-4 (Anexa T-4), Teorema P-4 (Anexa P-4), preprint §8.2.