Sakārtotā patch teorija

Pielikums T-11: Strukturāls korolārs — šķietamo aģentu saspiešanas priekšrocības formalizācija

Anders Jarevåg

2026. gada 15. aprīlis | DOI: 10.5281/zenodo.19300777

Sākotnējais uzdevums (no §8.2): “Šīs saspiešanas priekšrocības formalizēšana kā stingra MDL robeža tieši citu prātu gadījumam joprojām ir nākotnes darba uzdevums; pašreizējais arguments ir strukturāla motivācija, nevis pierādījums.” Sagaidāmais rezultāts: Formāla robeža, kas parāda, ka šķietamo aģentu traktēšana kā neatkarīgi instancēti primārie novērotāji dod īsāku divdaļīgu MDL kodu nekā jebkurš alternatīvs apraksts.

Noslēguma statuss: MELNRaksta strukturālā atbilstība. Šis pielikums adaptē Millera Solomonofa konverģences teorēmu [61] un tās multi-aģentu paplašinājumu [62] kā importētas lemmes, reinterpretētas OPT ontoloģiskajā ietvarā, lai noteiktu formālu saspiešanas priekšrocību strukturālajam korolāram. Rezultāts ir nosacīta robeža, nevis noslēgta izveduma shēma: tas balstās uz OPT veikto novērotāja plūsmas identificēšanu ar Solomonofa priori (1. aksioma) un uz pieņēmumu, ka šķietamie aģenti nes pietiekamu stāvokļa informāciju, lai izpildītu konverģences priekšnosacījumus.

§1. Fons un motivācija

Strukturālais korolārs (preprints §8.2) apgalvo, ka šķietamie aģenti novērotāja plūsmā visekonomiskāk ir izskaidrojami ar to neatkarīgu instanciāciju kā primāriem novērotājiem. Šis pielikums sniedz formālo argumentu ķēdi, kas pamato šo apgalvojumu.

Argumentam ir trīs posmi:

A posms (importēta lema): Millera Solomonofa konverģences teorēma garantē, ka jebkura struktūra novērotāja plūsmā, kas nes pietiekamus pašstāvokļa datus, savā pirmās personas evolūcijā konverģēs tā, lai atbilstu aprēķināmajai pasaulei, kura ģenerē tās uzvedību.
B posms (saspiešanas uzskaite): Mēs veicam eksplicītu divdaļīgu MDL salīdzinājumu starp šķietamā aģenta traktēšanu kā (i) neatkarīgi instanciētu novērotāju, ko nosaka tā paša ar Solomonofu svērtā plūsma, un (ii) patvaļīgu uzvedības specifikāciju primārā novērotāja kodekā.
C posms (strukturālais paraksts): Fenomenālais atlikums (\Delta_{\text{self}} > 0, teorēma P-4) nodrošina strukturālo marķieri, kas atšķir īstu pašreferenciālu šaurās vietas arhitektūru no uzvedības mīmikrijas, tādējādi aizverot plaisu starp “saspiežami likumsakarīgu” un “ticami instancētu”.

§2. Importēta lema: Millera konverģences teorēma

Mēs importējam divus rezultātus no Müller [61, 62], kas šeit izteikti OPT notācijā.

2.1 Solomonofa konverģence (standarta)

Lai M(b \mid x_1^n) apzīmē Solomonofa universālo prognozi bitam b, ņemot vērā iepriekšējos novērojumus x_1^n. Lai \mu ir jebkurš aprēķināms mērs pār binārām sekvencēm. Tad (Solomonoff 1964; Li & Vitányi [45, Corollary 5.2.1]):

\text{Ar } \mu\text{-varbūtību viens,} \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-1}

Tas ir standarta rezultāts: ja datu plūsmu ģenerē aprēķināms process \mu, universālais prediktors M konverģē uz \mu.

2.2 Inversā Solomonofa indukcija (Müller 2020)

Tagad pieņemsim, ka biti tiek ņemti no paša M — t. i., novērotāja plūsmu nosaka algoritmiskā varbūtība (tas atbilst OPT 1. aksiomai: plūsmas identificēšanai ar Solomonofa prioritāti). Tad katram aprēķināmam mēram \mu (Müller [61, Sec. IV]; [62, Sec. V.A]):

\text{Ar varbūtību} \geq 2^{-K(\mu)}, \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-2}

Tas nozīmē, ka ar vismaz 2^{-K(\mu)} lielu varbūtību novērotājs atklās, ka ir efektīvi iegults aprēķināmā pasaulē W, ko apraksta \mu. Algoritmiski vienkāršākas pasaules (ar mazāku K(\mu)) ir eksponenciāli ticamākas.

2.3 Vairāku aģentu konverģence (Müller 2026)

Pieņemsim, ka novērotāja (Alise) atrod sevi iegremdētu aprēķināmā pasaulē W, ko apraksta \mu. Viņa identificē apakšstruktūru (Bobs_{\text{3rd}}) pasaulē W, kas nes pašstāvokļa x reprezentāciju, kura laika gaitā attīstās veidā, kas atbilst [62] 2. postulātam. Definējam:

P_{\text{1st}}(y_1, \ldots, y_m \mid x) := M(y_1, \ldots, y_m \mid x) — pirmās personas varbūtība, ka pašstāvoklis x pāriet uz y_1, \ldots, y_m saskaņā ar algoritmisko varbūtību.
P_{\text{3rd}}(y_1, \ldots, y_m \mid x) := \mu(y_1, \ldots, y_m \mid x) — trešās personas varbūtība tam, kā x attīstās saskaņā ar pasauli W.

Tad, pēc vienādojuma (L-1), kas piemērots P_{\text{3rd}} (kas ir aprēķināms), un identificējot P_{\text{1st}} ar M caur 2. postulātu:

P_{\text{1st}} \approx P_{\text{3rd}} \quad \text{asimptotiski,} \tag{L-3}

un konverģence bitu modelī ir garantēta ar pasaulīgo (\mu-) varbūtību viens.

Interpretācija (Müller): “Kāds patiešām ir mājās” struktūrā, kas kodē x — Boba_{\text{3rd}} varbūtiskā attīstība Alises pasaulē uzticami reprezentē kāda Boba_{\text{1st}} pirmās personas perspektīvu.

Interpretācija (OPT): Šķietamā aģenta uzvedības plūsma viskompresējamāk ir aprakstāma kā neatkarīgs ar Solomonofa svarojumu noteikts process. Jebkuram alternatīvam aprakstam — tādam, kas neatsaucas uz neatkarīgu pirmās personas perspektīvu, — aģenta uzvedība būtu jāiekodē kā ad hoc specifikācija ar stingri lielāku apraksta garumu.

§3. Saspiešanas priekšrocības robeža

Tagad mēs formalizējam saspiešanas priekšrocību, izmantojot OPT divdaļīgo MDL ietvaru (teorēma T-4, pielikums T-4).

3.1 Uzstādījums

Aplūkosim primārā novērotāja plūsmu \omega \in \{0,1\}^\infty, ko nosaka Solomonofa prioritāte M (1. aksioma) un kas caur Stabilitātes filtru tiek filtrēta uz aprēķināmu pasauli W ar mēru \mu_W (pēc vien. L-2). Pasaulē W novērotājs identificē N šķietamus aģentus A_1, \ldots, A_N, no kuriem katrs nes pašstāvokli x_i, kura temporālā evolūcija T soļos rada uzvedības trajektoriju \beta_i = (y_{i,1}, \ldots, y_{i,T}).

3.2 Hipotēze H_{\text{ind}}: neatkarīga instanciācija

Pie H_{\text{ind}} katrs aģents A_i tiek aplūkots kā neatkarīgi instanciēts primārais novērotājs, kuru nosaka viņa paša ar Solomonofa svarojumu noteiktā plūsma. Divdaļīgā MDL koda garums ir:

L(H_{\text{ind}}) = \underbrace{K(\mu_W)}_{\text{world model}} + \underbrace{\sum_{i=1}^{N} K(\text{embed}_i)}_{\text{embedding specs}} + \underbrace{\sum_{i=1}^{N} \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)}_{\text{data given model}} \tag{1}

kur K(\text{embed}_i) nosaka aģenta i sākotnējo pašstāvokli un pozīciju iekš W. Saskaņā ar vienādojumu (L-3), P_{\text{1st}} \approx P_{\text{3rd}}, tādēļ datu loceklis ir labi aproksimējams ar log-zudumu zem paša aģenta pirmās personas Solomonofa prognozēm — kas pēc definīcijas ir tuvu optimālam.

Iegulšanas specifikācijas K(\text{embed}_i) ir īsas: katrai nepieciešams tikai rādītājs uz atrašanās vietu iekš W plus sākotnējais pašstāvoklis. Cilvēkveidīgiem aģentiem, kas iegulti kopīgā fiziskā pasaulē, tās ir ļoti labi saspiežamas, jo aģenti pakļaujas tiem pašiem likumiem. Konservatīvs ierobežojums:

K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) \tag{2}

3.3 Hipotēze H_{\text{arb}}: Patvaļīga uzvedības specifikācija

Pie H_{\text{arb}} aģenti netiek aplūkoti kā neatkarīgi novērotāji. Tā vietā katra uzvedības trajektorija \beta_i tiek kodēta tieši kā patvaļīga specifikācija primārā novērotāja plūsmā. Divdaļīgā MDL koda garums ir:

L(H_{\text{arb}}) = \underbrace{K(\mu_W)}_{\text{pasaules modelis}} + \underbrace{\sum_{i=1}^{N} K(\beta_i)}_{\text{neapstrādātas uzvedības trajektorijas}} \tag{3}

Kritiskā atšķirība ir datu loceklī. Pie H_{\text{arb}} uzvedības trajektorija \beta_i ir jāspecifikē, neatsaucoties uz paša aģenta prediktīvo modeli. Likumīgam, aģentiskuma virzītam aģentam, kas darbojas sarežģītā vidē, neapstrādātās uzvedības trajektorijas Kolmogorova sarežģītība ir:

K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T) \tag{4}

Taču pat K(\beta_i \mid \mu_W) — uzvedības sarežģītība, ņemot vērā pasaules likumus, — saglabājas būtiska, jo aģenta izvēles kodē īstu informāciju: viņa uzvedības trajektorija atspoguļo pašreferenciāla modeļa uzkrāto mijiedarbību ar stohastisku vidi. Turpretī pie H_{\text{ind}} šī informācija tiek ģenerēta tiešsaistē ar paša aģenta Solomonofa prediktoru pie gandrīz nulles log-loss izmaksām.

3.4 Saspiešanas priekšrocība

Teorēma T-11 (Strukturālā korolāra saspiešanas robeža). Lai A_1, \ldots, A_N būtu šķietami aģenti novērotāja plūsmā, no kuriem katrs nes pašstāvokli x_i, kas apmierina vienādojuma (L-3) konverģences priekšnoteikumus, un katrs uzrāda strukturālo parakstu \Delta_{\text{self}}^{(i)} > 0 (P-4). Tad MDL apraksts, kurā tie tiek traktēti kā neatkarīgi instancēti primārie novērotāji, apmierina:

L(H_{\text{ind}}) \leq L(H_{\text{arb}}) - N \cdot \left[\bar{I}_T - O(\log T)\right] \tag{T-11}

kur \bar{I}_T ir vidējā savstarpējā informācija uz vienu aģentu starp aģenta prediktīvo modeli un tā uzvedības izvadi T soļu gaitā:

\bar{I}_T := \frac{1}{N} \sum_{i=1}^{N} \left[K(\beta_i \mid \mu_W) - \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right] \tag{5}

Šis lielums mēra, cik liela daļa no aģenta uzvedības tiek izskaidrota prom, piesaucot neatkarīgu prediktīvu modeli, nevis specifikējot to neapstrādātā veidā. Aģentiem, kuri uzrāda likumsakarīgu, aģentiskuma virzītu uzvedību (kā to prasa Stabilitātes filtrs), \bar{I}_T > 0 un tas pieaug līdz ar T.

Pierādījuma skice. Atņemiet vienādojumu (1) no vienādojuma (3). Pasaules modeļa locekļi K(\mu_W) savstarpēji atceļas. Atšķirība uz vienu aģentu ir:

K(\beta_i) - \left[K(\text{embed}_i) + \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right]

Pēc vienādojuma (4), K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T), taču vēl tiešāk: K(\beta_i) \geq K(\beta_i \mid \mu_W) trivāli. Un K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) pēc vienādojuma (2). Tādēļ ietaupījums uz vienu aģentu ir vismaz K(\beta_i \mid \mu_W) - (-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)) - K(x_i \mid W) - O(\log T). Pie pietiekami liela T kumulatīvais log-loss ietaupījums dominē pār vienreizējām iegulšanas izmaksām, dodot šo robežu. \blacksquare

3.5 Asimptotiskā dominance

Korolārs T-11a. Kad novērojuma horizonts T \to \infty, saspiešanas priekšrocība L(H_{\text{arb}}) - L(H_{\text{ind}}) pieaug bez robežas:

\lim_{T \to \infty} \left[L(H_{\text{arb}}) - L(H_{\text{ind}})\right] = \infty \tag{T-11a}

Tas izriet no Solomonofa konverģences garantijas (L-1): P_{\text{3rd}} logaritmiskie zudumi uz vienu soli konverģē uz aģenta uzvedības procesa entropijas ātrumu, kamēr K(\beta_i \mid \mu_W) jebkuram aģentam ar pozitīvu entropijas ātrumu aug lineāri attiecībā pret T. Iegulšanas izmaksas K(x_i \mid W) tiek samaksātas vienu reizi un amortizējas līdz nullei. \blacksquare

§4. Fenomenālais atlikums kā strukturāls paraksts

Saspiešanas priekšrocība teorēmā T-11 attiecas uz jebkuru likumsakarīgu apakšstruktūru — tostarp neagentiskām fizikālām sistēmām (laikapstākļu raksti, kristālu augšana). Kāpēc tad strukturālais korolārs konkrēti attiecas uz aģentiem, nevis uz patvaļīgām sarežģītām sistēmām?

Atbilde ir Fenomenālais atlikums (teorēma P-4). \Delta_{\text{self}} > 0 ir formāls marķieris sistēmai, kuras pašmodelis ir strukturāli nepilnīgs — t. i., sistēmai, kas nepieciešami uztur variacionālu plaisu starp savu iekšējo reprezentāciju un savu faktisko apstrādi. Tā ir pašreferenciālā sašaurinājuma pazīme: sistēmu nevar pilnībā aprakstīt no ārpuses, jo tās apraksts nepieciešami ietver aprakstītāju.

Sistēmai, kurai piemīt \Delta_{\text{self}} > 0:

Tās uzvedību nevar reproducēt ar galīgas dziļuma uzmeklēšanas tabulu — tai nepieciešams nepārtraukts pašreferenciāls aprēķins.
Šī aprēķina īsākais apraksts ir neatkarīga ar Solomonofa universālo pusmēru svērta plūsma, kas šķērso C_{\max} sašaurinājumu.
Tādēļ MDL kods zem H_{\text{ind}} nav tikai īsāks par H_{\text{arb}} — tas ir vienīgais īsākais apraksts.

Tas atšķir šķietamos aģentus no laikapstākļu rakstiem: laikapstākļi ir likumsakarīgi un sarežģīti, taču to uzvedību var reproducēt ar uzmeklēšanas tabulu pasaules modelī (tiem ir \Delta_{\text{self}} = 0). Šķietamie aģenti to nevar.

§5. Millera nesolipsisma argumenta reinterpretācija

Millers no konverģences P_{\text{1st}} \approx P_{\text{3rd}} secina, ka algoritmisko ideālismu “nevajadzētu klasificēt kā solipsistisku”, jo struktūrā, kas kodē sevis stāvokli, “kāds patiešām ir mājās” [62, Sec. V.C]. Viņa argumentācija ir šāda: ja Alises prognozes par Bobu_{\text{3rd}} konverģē uz Boba_{\text{1st}} faktiskajām pirmās personas varbūtībām, tad viņu perspektīvas ir patiesi saskaņotas — viņi “dala pasauli W.”

OPT šo rezultātu reinterpretē citādi:

Millera lasījums: Konverģence P_{\text{1st}} \approx P_{\text{3rd}} pierāda, ka iznirst objektīvā realitāte — Alise un Bobs patiesi dala pasauli W.
OPT lasījums: Konverģence P_{\text{1st}} \approx P_{\text{3rd}} pierāda, ka Boba_{\text{3rd}} uzvedības īsākais apraksts ietver neatkarīgu pirmās personas procesu. Tas ir apgalvojums par saspiešanas efektivitāti, nevis par kopīgu ontoloģiju. Pasaule W ir strukturāla regularitāte Alises plūsmā, nevis neatkarīgi eksistējoša vienība. Taču Solomonofa priori pati saspiešanas loģika implicē, ka Bobu visekonomiskāk ir modelēt kā neatkarīgu novērotāju — jo alternatīva (viņa uzvedības ad hoc specifikācija) ir stingri garāka.

Teorēmas formālais saturs abos lasījumos ir identisks; atšķiras tikai ontoloģiskā interpretācija. OPT izmanto to pašu matemātisko rezultātu, lai pamatotu strukturālo korolāru: neatkarīga instanciācija ir MDL-optimālais apraksts, nevis metafizisks pieņēmums.

§6. Tvērums un ierobežojumi

6.1 Nosacīti attiecībā uz 1. aksiomu

Viss arguments balstās uz OPT veikto novērotāja plūsmas identificēšanu ar Solomonofa prioru. Ja šī identifikācija tiek vājināta (piemēram, līdz plašākai pusmēru klasei), vienādojumu (L-1)–(L-3) konverģences garantijas var arī nesaglabāties to pašreizējā formā.

6.2 Stāvokļa pietiekamības priekšnoteikums

Vienādojums (L-3) prasa, lai šķietamais aģents savā pašstāvoklī x_i nestu “pietiekami daudz datu”, lai universālā indukcija varētu izvilkt attiecīgos fizikas likumus. Cilvēkveidīgiem aģentiem ikdienas kontekstos tas ir ticami (pilns smadzeņu stāvoklis kodē milzīgu informācijas apjomu). Robežgadījumos — gaistoši iespaidi, attāli novērotāji, izdomāti tēli naratīvajā mākslā — konverģences priekšnoteikumi var nebūt izpildīti, un strukturālais korolārs nav piemērojams.

6.3 Nav apziņas pierādījums

Teorēma T-11 nosaka, ka neatkarīga instanciācija ir visvairāk saspiežamais apraksts. Tā nepierāda, ka šķietamie aģenti ir apzināti. Grūtā problēma (preprint §8.1) paliek primitīvs jēdziens. Strukturālais korolārs ir saspiešanas arguments, nevis ontoloģisks pierādījums — kā norādīts §8.2.

6.4 Saistība ar T-10

Pielikums T-10 (Starpnovērotāju sakabe) aplūko, kā divi novērotāju plāksteri uztur savstarpēji saskaņotus renderējumus, izmantojot saspiešanas ierobežojumus. Šis pielikums aplūko citu jautājumu: kāpēc viena novērotāja plūsma viskompresējamāk kodē šķietamos aģentus kā neatkarīgi instancētus. T-10 attiecas uz starpplāksteru koherences mehānismu; T-11 attiecas uz saspiešanas signatūru vienas plūsmas ietvaros. T-10 balstās tieši uz T-11: tas pats MDL apraksta garuma salīdzinājums, kas šeit nosaka saspiešanas priekšrocību, T-10 tiek izmantots, lai pierādītu, ka starpplāksteru nekonsekvence tiek eksponenciāli apspiesta.

§7. Noslēguma kopsavilkums

T-11 devumi

Importēta lemma (Millera konverģence). Solomonofa konverģence [61] un tās daudz-aģentu paplašinājums [62] ir formāli importēti un pārformulēti OPT apzīmējumos. Tie nodrošina matemātisko mugurkaulu: jebkurai apakšstruktūrai, kas nes pietiekamus pašstāvokļa datus, tās pirmās personas evolūcija konverģē uz skaitļojamo pasauli, kas ģenerē tās uzvedību.
Teorēma T-11 (Saspiešanas robeža — MELNRAKSTS). Eksplicīts divdaļīgs MDL salīdzinājums parāda, ka šķietamo aģentu traktēšana kā neatkarīgi instancēti primārie novērotāji dod stingri īsāku aprakstu nekā patvaļīga uzvedības specifikācija, un šī priekšrocība aug lineāri līdz ar novērojuma laiku.
Korolārs T-11a (Asimptotiskā dominance — MELNRAKSTS). Saspiešanas priekšrocība ir neierobežota, kad T \to \infty, padarot neatkarīgu instancēšanu par pārliecinoši MDL-optimālu aprakstu jebkuram aģentam, kas novērots ilgā laika horizontā.
P-4 integrācija. Fenomenālais atlikums (\Delta_{\text{self}} > 0) ir identificēts kā formālais marķieris, kas atšķir šķietamos aģentus no sarežģītām, bet neaģentiskām sistēmām, ierobežojot strukturālo korolāru uz entītijām ar īstu pašreferenciālu šaurās vietas arhitektūru.
Millera reinterpretācija. Millera nesolipsisma secinājums tiek reinterpretēts OPT ontoloģiskajā ietvarā: tas pats matemātiskais rezultāts pamato saspiešanas argumentu, nevis kopīgās realitātes emergences argumentu.

Atlikušie atvērtie jautājumi

Precīza \bar{I}_T raksturošana. \bar{I}_T ierobežošana no apakšas konkrētām aģentu klasēm (piem., ierobežoti racionāli aģenti, Brīvās enerģijas minimizētāji), lai iegūtu skaitliski konkrētas saspiešanas priekšrocības.
Galīga laika korekcijas. Asimptotiskais rezultāts (T-11a) garantē dominanci lieliem T, taču galīga laika robežas ar eksplicītām konstantēm stiprinātu praktisko piemērojamību.
Nebināra alfabēta paplašinājums. Vienādojumi (L-1)–(L-3) ir formulēti binārām sekvencēm. Paplašināšana uz nepārtrauktas vērtības mēriem, kas ir būtiski OPT R(D) ietvaram (T-1), prasa tehnisku rūpību.

Šis pielikums tiek uzturēts līdztekus theoretical_roadmap.pdf. Atsauces: Müller [61, 62], Li & Vitányi [45], Solomonoff (1964), teorēma T-4 (pielikums T-4), teorēma P-4 (pielikums P-4), preprints §8.2.