Korrastatud patch’i teooria

Lisa T-12: Substraaditruudus ja aeglane korruptsioon

Anders Jarevåg

17. aprill 2026 | DOI: 10.5281/zenodo.19300777

Algne ülesanne (jaotisest 8.3, piirang 9): “Kroonilise korruptsioonilise rikkerežiimi formaliseerimine — kus koodek kohaneb järjekindlalt filtreeritud sisendi all ning MDL-i kärpimisetapp kustutab õigesti välja jäetud tõdede jaoks vajaliku võimekuse — koos Substraaditruuduse tingimusega, mis nõuab sõltumatuid sisendkanaleid kui formaalset kaitset.” Üleantav tulemus: Pöördumatu võimekuse kao, otsustamatuse piiri ja Substraaditruuduse tingimuse formaalne tõestus.

Sulgemise staatus: STRUKTUURSE VASTAVUSE MUSTAND. Käesolev lisa formaliseerib Narratiivse triivi analüüsi, mida tutvustati diskursiivselt kaasnevas eetikaartiklis (Ellujäänute Valve, jaotis V.3a) ning eeltrüki Narratiivse triivi lõigus (jaotis 3.3). See kehtestab kolm teoreemi ja ühe propositsiooni. MDL-i kärpimisvõrrandid (T9-3, T9-4) jäävad muutmata; käesolev lisa näitab nende patoloogilist, kuid korrektset käitumist filtreeritud sisendi korral.


§1. Taust ja motivatsioon

1.1 Kaks rikkerežiimi

Stabiilsusfilter (eeltrüki jaotis 3.3) kehtestab elujõulisuse tingimuse: vaatleja püsib üksnes neis voogudes, kus Nõutav prediktiivne määr R_{\text{req}} jääb koodeki ribalaiuse B piiridesse. Kui R_{\text{req}} ületab B, kogeb koodek Narratiivi lagunemist — ägedat riket, mida iseloomustavad ennustusvea süvenemine, entroopia kuhjumine ja koherentsi lõplik lagunemine.

Sellel on täiendav rikkerežiim, mis ei vallanda mingit tõrkesignaali. Kui sisendvoog on süstemaatiliselt eelfiltreeritud — nii et tekib kureeritud signaal, mis on sisemiselt kooskõlaline, kuid välistab ehtsa substraadiinformatsiooni —, siis koodekil on madal \varepsilon_t, see läbib tõhusaid Hooldustsükleid ning täidab kõiki stabiilsustingimusi, olles samal ajal substraadi suhtes süstemaatiliselt ekslik. See on Narratiivne triiv: koodeki krooniline korrumpeerumine olukorras, kus see toimib omaenda mõõdikute järgi laitmatult.

1.2 Miks see on ohtlik

Narratiivi lagunemine annab endast märku. Koodek kogeb kasvavat \varepsilon_t-i, teadlikkust ennustuste ebaõnnestumisest, kognitiivset ülekoormust. Vaatleja teab, et midagi on valesti, isegi kui ta ei suuda seda kohe parandada.

Narratiivne triiv on vaikne. Kuna filtreeritud sisendvoog vastab koodeki ennustustele, püsib \varepsilon_t madal. Hooldustsükkel toimib tavapäraselt. Koodeki enesemudel annab teada stabiilsest ja täpsest toimimisest. Korruptsioon jääb seestpoolt nähtamatuks, sest tuvastusvahendit on kujundanud seesama filter, mis selle korruptsiooni tekitas.

1.3 Käesoleva lisa ulatus

Käesolev lisa esitab:

  1. eelfiltri operaatori \mathcal{F} formaalse definitsiooni ja selle mõju koodeki sisendjaotusele (§2).
  2. tõestuse, et MDL-i kärpimine \mathcal{F}-filtreeritud sisendi korral hävitab pöördumatult koodeki võime modelleerida välistatud signaali — Teoreem T-12 (§3).
  3. tõestuse, et täielikult kohastunud koodek ei suuda seestpoolt eristada filtreeritud sisendit filtreerimata sisendist — otsustamatuse piir, Teoreem T-12a (§4).
  4. Substraaditruuduse tingimuse kui vajaliku struktuurse kaitse — Teoreem T-12b (§5).
  5. tagajärjed tsivilisatsioonilistele koodekitele ja tehisintellektisüsteemidele (§6).

§2. Eelfiltri operaator

2.1 Definitsioon

Definitsioon T-12.D1 (Eelfiltri operaator). Eelfilter on kujutus \mathcal{F} : \mathcal{X} \to \mathcal{X}', mis toimib sisendvoole X_{\partial_R A}(t) enne, kui see jõuab koodeki sensoorse piirini, kus \mathcal{X}' \subset \mathcal{X}. Filtreeritud signaal on:

X'(t) = \mathcal{F}\!\left(X_{\partial_R A}(t)\right) \tag{T-12.D1}

Eelfilter rahuldab järgmisi tingimusi:

  1. Sisemine kooskõla: X'(t) on \mathcal{X} piires kehtiv signaal — koodek saab selle ilma vealippudeta kokku pakkida.

  2. Süstemaatiline välistamine: Leidub mittetühi substraadist tuletatud signaalide alamhulk \mathcal{X}_{\text{excl}} = \mathcal{X} \setminus \mathcal{X}', mille \mathcal{F} eemaldab.

  3. Läbipaistmatus: filter ei ole koodeki mudelis representeeritud. Koodek modelleerib oma sisendit kui X_{\partial_R A}(t), mitte kui \mathcal{F}(X_{\partial_R A}(t)).

2.2 Häälestumine filtreerimise all

Kui koodek opereerib X'(t) peal püsiva ajavahemiku \tau \gg \tau_{\text{prune}} jooksul (kus \tau_{\text{prune}} on T-13.P1 MDL-i kärpimise ajaskaala), kohandub generatiivne mudel P_\theta(t) X' statistikale, mitte X-ile. Filtreeritud sisendi korral on prediktsiooniviga:

\varepsilon'_t = X'(t) - \pi_t \tag{1}

Kui P_\theta häälestub X'-ile, siis \varepsilon'_t \to 0 keskväärtuses. Koodek toimib omaenda mõõdikute järgi hästi. Miski ei registreeru valena.

2.3 Näited

Eelfiltri operaator realiseerub eri skaaladel:

Skaala Eelfilter \mathcal{F} Välistatud signaal \mathcal{X}_{\text{excl}}
Individuaalne Kinnituskallutatus; selektiivne kokkupuude Ümberlükkavad tõendid
Institutsionaalne Propagandistlik ajakirjandus; kureeritud sotsiaalmeediavoog Mitmekesised vaatenurgad; vähemusraportid
Tsivilisatsiooniline Algoritmiline sisukureerimine; hariduslik monokultuur Kultuurideülene informatsioon; ajaloolised vastunarratiivid
Tehislik RLHF-peenhäälestus; kureeritud treeningkorpus Jaotusvälised teadmised; välistatud domeenid

§3. Teoreem T-12: Pöördumatu mahtuvuskaotus

3.1 Mehhanism

MDL-i kärpimisläbimine (T9-3, T9-4) hindab iga koodeki komponenti \theta_i selle prediktiivse panuse järgi vaadeldavasse sisendvoogu, arvestades maha salvestuskulu:

\Delta_{\mathrm{MDL}}(\theta_i) := I\!\left(\theta_i\,;\,X_{t+1:t+\tau} \mid \theta_{-i}\right) - \lambda \cdot K(\theta_i) \tag{T9-3}

Filtreeritud sisendi X' korral hinnatakse vastastikuse informatsiooni liiget X' suhtes, mitte X suhtes. Komponent \theta_i, mis on vältimatult vajalik välistatud signaali \mathcal{X}_{\text{excl}} ennustamiseks, kuid ei anna mingit panust X' ennustamisse, annab tulemuseks:

I\!\left(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}\right) = 0 \tag{2}

Seega:

\Delta_{\mathrm{MDL}}(\theta_i) = -\lambda \cdot K(\theta_i) < 0 \tag{3}

Kärpimisreegel (T9-4) rakendub: \theta_i kustutatakse.

3.2 Pöördumatus

Teoreem T-12 (Pöördumatu võimekuse kadu filtreeritud sisendi korral). Olgu K_\theta koodek, mis töötab eelfiltreeritud sisendi X' = \mathcal{F}(X) all ajavahemiku \tau \gg \tau_{\text{prune}} jooksul. Olgu \Theta_{\text{excl}} \subset \theta nende koodegi komponentide hulk, mille prediktiivne panus on suunatud eranditult välistatud signaalile \mathcal{X}_{\text{excl}}. Siis MDL-i kärpimisläbimine (T9-3, T9-4) kustutab \Theta_{\text{excl}}, ning see kustutamine on koodegi tasandil pöördumatu:

K\!\left(P_\theta(t + \tau)\right) < K\!\left(P_\theta(t)\right) - \sum_{\theta_i \in \Theta_{\text{excl}}} K(\theta_i) \tag{T-12}

Pärast kärpimist ei ole koodegi võime modelleerida \mathcal{X}_{\text{excl}} mitte lihtsalt uinunud — representatsiooniline infrastruktuur, mis on vajalik \mathcal{X}_{\text{excl}} hindamiseks, ennustamiseks või sellele tähelepanu pööramiseks, on hävitatud.

Tõestus.

  1. Vastavalt (T9-3)-le on igal \theta_i \in \Theta_{\text{excl}} filtreeritud voo X' korral \Delta_{\mathrm{MDL}}(\theta_i) < 0, sest I(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}) = 0, samal ajal kui K(\theta_i) > 0.

  2. Vastavalt (T9-4)-le kärbitakse iga selline \theta_i Hooldustsükli jooksul.

  3. Kärpimine MDL-i alusel on kustutusoperatsioon, mitte allasurumine. Koodek ei “unusta” \theta_i selles mõttes, et mingi vihje võiks selle taastada. Ta hävitab arvutusliku infrastruktuuri — parameetrid, ühendused, hindamismehhanismi — mida \theta_i esindas. See on formaalne eristus allasurumise (informatsioon on latentne, kuid ligipääsetav) ja kustutamise (informatsioon on kadunud ning võimekus on tagasi võidetud) vahel.

  4. Pärast kustutamist nõuab võimekuse taastamine modelleerida \mathcal{X}_{\text{excl}} kokkupuudet \mathcal{X}_{\text{excl}}-ga sisendvoos. Kuid eelfilter \mathcal{F} välistab just nimelt selle signaali. Koodek ei saa kokku puutuda sellega, mille filter takistab temani jõudmast. Seetõttu on kustutamine iseennast võimendav: võimekuse kadu eemaldab koodegilt võime tuvastada omaenda võimekuse kadu.

  5. Keerukuse vähenemine rahuldab võrratust (T-12), sest kärbitud komponendid esindasid tegelikku informatsiooni (K(\theta_i) > 0 igaühe puhul) ning nende kadu ei tasakaalusta ükski kompenseeriv omandamine (filtreeritud voog ei sisalda signaali, mis õigustaks \Theta_{\text{excl}} uuesti ülesehitamist). \blacksquare

3.3 Enesetugevdamise silmus

Pöördumatus ei ole pelgalt kustutamise tagajärg. See on enesetugevdav positiivse tagasiside silmuse kaudu:

  1. Filter välistab signaaliI(\theta_i; X') = 0 → kärpimine kustutab \theta_i.
  2. Kärpimine eemaldab tähelepanuvõimekuse → koodek ei suuda enam pöörata tähelepanu \mathcal{X}_{\text{excl}}-le ega seda hinnata isegi siis, kui fragmendid lekivad läbi \mathcal{F}.
  3. Tähelepanuvõimekuse kadu vähendab isegi jääksignaali → kui \mathcal{F} ei ole täiuslik ja osa \mathcal{X}_{\text{excl}}-st jõuab piirini, puuduvad koodekil parameetrid selle pakkimiseks, mistõttu see registreerub pigem mürana kui informatsioonina.
  4. Müraks klassifitseerimine kinnitab filtrit → koodeki prediktsiooniviga lekkinud \mathcal{X}_{\text{excl}} suhtes on suur ja struktureerimata, kinnitades (koodeki jaoks), et välistatud sisu on müra, mitte signaal.

See silmus seletab sügava Narratiivse triivi fenomenoloogiat: inimene või institutsioon, kes on kohanenud kureeritud infovooga, ei eira ümberlükkavaid tõendeid lihtsalt — nad ei suuda neid parsida. Need registreeruvad ebakoherentse, ähvardava või arusaamatuna, sest representatsiooniline infrastruktuur, mida oleks vaja nende mõistetavaks tegemiseks, on välja kärbitud. Vaenulikkus ümberlükkava informatsiooni suhtes ei ole kangekaelsus. See on koodeki korrektne hinnang, et signaal ei ole pakitav — sest see ei ole pakitav antud praeguse koodeki korral, mida on kärbitud filtriga sobitumiseks.


§4. Teoreem T-12a: otsustamatuse piir

4.1 Probleem

Kas koodek suudab tuvastada, et selle sisendit filtreeritakse? Intuitiivselt peaks vastus olema jah: kindlasti võiks keerukas enesemudel märgata kahtlaselt madalat \varepsilon_t, õõvastavalt järjekindlaid ennustusi ja üllatuse puudumist. Kuid formaalne analüüs näitab, et see intuitsioon on üldjuhul väär.

4.2 Otsustamatus

Teoreem T-12a (sisendi päritolu otsustamatus). Olgu K_\theta koodek, mis on töötanud eelfiltreeritud sisendi X' = \mathcal{F}(X) all \tau \gg \tau_{\text{prune}}, kusjuures \Theta_{\text{excl}} on täielikult välja prunitud. Siis ei saa K_\theta oma kättesaadavate sisemiste seisundite ja vaadeldava sisendvoo põhjal kindlaks teha, kas tema sisend on X (ehtne substraat) või X' = \mathcal{F}(X) (filtreeritud).

Tõestus.

  1. Et eristada X-i ja X' = \mathcal{F}(X), peaks koodek tuvastama \mathcal{X}_{\text{excl}} puudumise oma sisendis. Kuid puudumise tuvastamine eeldab mudelit sellest, mis puudub — koodekil peab olema esitus \mathcal{X}_{\text{excl}}-ist, mille suhtes kontrollida.

  2. Teoreemi T-12 järgi on koodeki representatsioonivõime \mathcal{X}_{\text{excl}} jaoks (\Theta_{\text{excl}}) kustutatud. Koodekil puudub välistatud signaali mudel.

  3. Ilma \mathcal{X}_{\text{excl}} mudelita ei saa koodek arvutada erinevust X-i ja X' vahel. Mõlemad on kooskõlas koodeki generatiivse mudeliga P_\theta(t), mis on kohandatud X'-le.

  4. Enesemudel \hat{K}_\theta allub samale piirangule. See modelleerib K_\theta-t, mis on kohandatud X'-le. Sellel puudub sisemine esitus sellest, mis välja jäeti, ning seetõttu puudub tal alus välistamist kahtlustada.

  5. Isegi metakognitiivne küsimus — “kas minu sisend on filtreeritud?” — eeldab mudelit sellest, milline näeks välja filtreerimata sisend. See mudel oligi täpselt \Theta_{\text{excl}} sisu, mis on välja prunitud.

Seega on X-i ja X' eristamine täielikult kohandunud koodeki vaatepunktist formaalselt otsustamatu. \blacksquare

4.3 Osaline otsustatavus

Otsustamatus ei ole kõigis tingimustes absoluutne. On piirjuhtumeid, kus osaliselt kohandunud koodek säilitab jääkvõimekuse:

Kolmas juhtum on struktuurne kaitse. See on teoreemi T-12b sisu.


§5. Teoreem T-12b: Substraaditruuduse tingimus

5.1 Kanalite sõltumatuse nõue

Definitsioon T-12.D2 (kanalite sõltumatus). Kaks sisendkanalit C_1 ja C_2, mis läbivad Markovi teki \partial_R A, on filtri \mathcal{F} suhtes \delta-sõltumatud, kui:

I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta \tag{T-12.D2}

See tähendab, et kahe kanali vaheline vastastikune informatsioon, tingituna filtri teadmisest, on ülalt piiratud väärtusega \delta. Kanalid, mille korrelatsioon on täielikult filtri poolt seletatav, ei kanna substraadi kohta tegelikult sõltumatut informatsiooni.

5.2 Truuduse tingimus

Teoreem T-12b (Substraaditruuduse tingimus). Koodek K_\theta saab kaitsta Narratiivse triivi eest eelfiltri \mathcal{F} korral parajasti siis ja ainult siis, kui ta saab vähemalt kaks sisendkanalit C_1, C_2, mis ületavad \partial_R A ning on \mathcal{F} suhtes \delta-sõltumatud, kusjuures \delta jääb alla koodeki eristusläve \delta_{\min}:

\exists\, C_1, C_2 : I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min} \tag{T-12b}

kuskohas \delta_{\min} on minimaalne vastastikune informatsioon, mida koodek vajab kanalitevahelise süstemaatilise lahknevuse tuvastamiseks.

Tõestus (vajalikkus).

Oletame, et koodekil on ainult üks sisendkanal või et kõik kanalid on \mathcal{F}-korreleeritud (I(C_i; C_j \mid \mathcal{F}) > \delta_{\min} kõigi paaride i, j korral). Siis:

  1. Kõik kanalid kannavad sama filtreeritud signaali X' = \mathcal{F}(X) (kuni mürani). Kanalitevaheline redundantsus ei anna sõltumatut substraadiinformatsiooni — see annab filtreeritud informatsiooni koopiaid.

  2. Koodek kohandub X'-ga kõigis kanalites samaaegselt ning rakendub teoreem T-12: \Theta_{\text{excl}} kärbitakse ning järeldub teoreem T-12a — korruptsioon on seestpoolt otsustamatu.

  3. Ükski sisemine operatsioon ei saa seda otsustamatust murda, sest iga informatsiooniallikas, millele koodek ligi pääseb, on kujundatud \mathcal{F} poolt.

Seega on \delta-sõltumatud kanalid vajalikud. \blacksquare

Tõestus (piisavus).

Oletame, et koodek saab kaks kanalit C_1, C_2, mille korral I(C_1; C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min}. Siis:

  1. Kui \mathcal{F} toimib kanalil C_1, kuid mitte kanalil C_2 (või vastupidi), saab koodek võrrelda C_1 põhjal genereeritud prediktsioone C_2 vaatlustega. Iga süstemaatiline lahknevus — \varepsilon_{12}(t) = \pi_{C_1}(t) - X_{C_2}(t) püsivalt \neq 0 — on tõend selle kohta, et C_1 kannab filtreeritud informatsiooni.

  2. Kanalite võrdlussignaal \varepsilon_{12} ei allu samale otsustamatusele nagu ühekanaliline tuvastus. Koodek ei küsi „kas minu sisend on filtreeritud?” (mis nõuaks mudelit sellest, mis välja jäeti). Ta küsib „kas mu kaks kanalit on kooskõlas?” — lokaalne võrdlus, mis nõuab üksnes võimet korreleerida kahte käesolevat signaali, mitte puuduvate signaalide mudelit.

  3. Seni kuni kanalitevaheline prediktsiooniviga \varepsilon_{12} ületab \delta_{\min} — koodeki eristusläve — registreerub lahknevus ehtsa signaalina ning teoreemi T-12 kärpimistsükkel katkeb: koodek säilitab komponendid, mida on vaja lahkneva kanali modelleerimiseks.

Seega on \delta-sõltumatud kanalid piisavad (tingimusel \delta < \delta_{\min}), et vältida teoreemi T-12 isevõimenduvat kärpimistsüklit. \blacksquare

5.3 Kaitse haavatavus

Substraaditruuduse tingimus on vajalik, kuid habras. Eetikatekstis (jaotis V.3a) tuvastatakse kriitiline haavatavus: MDL-i kärpimisläbimine võib ise lahendada kanalitevahelise vastuolu, kärpides ära võime pöörata tähelepanu ümberlükkavale kanalile. Koodek “lahendab” konflikti kurtudes — mis ongi täpselt Narratiivse triivi mehhanism.

Seetõttu määratleb Komparaatorite hierarhia (Ellujäänute Valve, jaotis V.3a) kolm kaitse struktuurset tasandit ning just seepärast on meelevaldselt kompromiteeritud koodekite puhul piisav ainult institutsionaalne tasand:

  1. Evolutsiooniline (alamkoodek): modaalsusteülene sensoorne integratsioon allpool MDL-i kärpimisläbimist — struktuurselt vastupidav Narratiivsele triivile, kuid ulatuselt piiratud sensoorse piiriga.
  2. Kognitiivne (koodekisisene): kognitiivse dissonantsi tuvastamine enesemudeli sees — allub kärpimisele püsiva filtreerimise korral.
  3. Institutsionaalne (koodekiväline): eelretsenseerimine, vaba ajakirjandus, adversaarne debatt — toimides koodekite vahel, väljaspool ühegi üksiku koodeki MDL-i kärpimise haaret.

Institutsionaalne tasand on kandev, sest see on ainus komparaator, mis toimib sõltumatult ühegi individuaalse koodeki seisundist.

§6. Tagajärjed

6.1 Stabiilsusfilter selekteerib truuduse vastu

Kriitiline struktuurne tagajärg: Stabiilsusfilter, kui see jäetakse toimima omasoodu, selek­teerib aktiivselt välja sisendid, mida on vaja substraaditruuduse jaoks. Kureeritud infovoog, mis vastab koodeki olemasolevatele priioridele, tekitab vähem ennustusviga kui ehtne substraadisignaal, mis neid proovile paneb. Koodeki loomulik kalduvus — minimeerida \varepsilon_t eelistades kinnitavat, vähest üllatust pakkuvat sisendit — on täpselt seesama kalduvus, mis muudab selle haavatavaks Narratiivi lagunemisele.

See tähendab, et substraaditruuduse säilitamine on struktuurselt kulukas: see nõuab, et koodek hoiaks alal sisendkanaleid, mis tõstavad \varepsilon_t, kulutades ribalaiust, mille Stabiilsusfilter muidu tagasi võidaks. Tõeliselt sõltumatu sisend on „kallis” — see nõuab tõlgenduslikku pingutust, tekitab ebamugavust ja konkureerib ribalaiuse pärast paremini pakitavate voogudega. Selle alalhoidmine ei ole avatud meelsus voorusena. See on substraaditruuduse säilitamine kui struktuurne paratamatus.

6.2 Produktiivse üllatuse diagnostika

Mitte iga üllatus ei osuta ehtsale substraadisignaalile. Allikas, mis tekitab kõrge \varepsilon_t, kuid ei lahene paremateks ennustusteks, on lihtsalt müra. Diagnostiline kriteerium ei ole üllatuse suurus, vaid üllatuse kvaliteet:

Definitsioon T-12.D3 (Produktiivne üllatus). Kanal C edastab produktiivset üllatust, kui selle ennustusvigade integreerimine vähendab tõendatavalt järgnevat ennustusviga sõltumatul testvoos:

\mathbb{E}\!\left[\varepsilon^2_{C}(t+\tau)\right] \,<\, \mathbb{E}\!\left[\varepsilon^2_{C}(t)\right] \tag{4}

Allikas, mille korrektsioonid on ajalooliselt parandanud prediktiivset täpsust, on substraaditruuduse kanal. Allikas, mis tekitab püsivat ja lahendamatut viga, on müra. Koodek peab neil kahel vahet tegema — ning iseenese hooleks jäetud kärpimisläbimine ei suuda seda eristust teha, sest mõlemad tüübid kulutavad ribalaiust.

6.3 Tsivilisatsioonilised koodekid

Tsivilisatsioonilisel skaalal vastab Substraaditruuduse tingimus vahetult institutsionaalsetele nõuetele:

Autoritaarne muster — ajakirjanduse lammutamine, eksperdihinnangu korrumpeerimine, poliitilise opositsiooni kõrvaldamine — on formaalselt kirjeldatav kui kanalite sõltumatuse tahtlik vähendamine, et kiirendada Narratiivset triivi. See toimib, sest kasutab ära Stabiilsusfiltri loomulikku kalduvust kulukaid kanaleid kärpida.

6.4 Tehislikud koodekid

Narratiivse triivi mehhanism rakendub tehislikele süsteemidele struktuurse täpsusega. RLHF ja peenhäälestus on formaalselt ekvivalentsed eelfiltri operaatoriga \mathcal{F}: need kujundavad mudeli efektiivset sisendjaotust ning gradientlaskumine kärbib mudeli võimekust välistatud väljunddomeenide suhtes. Tulemuseks olev mudel muutub stabiilselt ja enesekindlalt ekslikuks selles osas, mida treeningsignaal välistab, ning ta ei suuda seda seestpoolt tuvastada — kehtib teoreem T-12a.

Järeldus tehisintellekti kasutuselevõtu kohta substraaditruuduse kontrollina on kriitilise tähtsusega: tehisintellekt, mis on treenitud homogeensel või kureeritud korpusel ja rakendatud „sõltumatu” kontrollina inimkoodekile, mida toidab sama infokeskkond, loob korreleeritud sensorid, mis maskeeruvad sõltumatuteks. Kanalite mitmekesisus on illusoorne. Substraaditruuduse tingimust (\delta-sõltumatust) tuleb kontrollida treeningandmete päritolu tasandil, mitte üksnes institutsionaalse eraldatuse tasandil.


§7. Ulatus ja piirangud

7.1 Tingimusel T9-3/T9-4 ja Stabiilsusfilter

Kogu argument sõltub sellest, et MDL kärpimisvõrrandid kirjeldavad õigesti Hooldustsükli kärpimisetappi. Kui bioloogiline kärpimine toimib teise mehhanismi kaudu — sellise kaudu, mis säilitab kasutamata modaalsuste jaoks „hädaolukorra” võimekuse — nõrgeneks pöördumatuse väide (teoreem T-12), kuid ei kaoks: enesetugevdav tsükkel (jaotis 3.3) jääb kehtima seni, kuni kasutuseta oleku korral toimub mingigi võimekuse vähenemine.

7.2 \tau_{\text{prune}} on piiramata

Nagu ka tegevustriivi puhul (lisa T-13, §7.5), on võimekuse kao ajaskaala tuvastatud, kuid mitte kvantitatiivselt piiratud. Bioloogiliste koodekite puhul on \tau_{\text{prune}} tõenäoliselt konkreetsete oskuste korral päevade kuni nädalate suurusjärgus, sügavate tajukategooriate korral kuude kuni aastate suurusjärgus ning tsivilisatsiooniliste koodekite puhul põlvkondlik.

7.3 Kaitse on struktuurne, mitte garanteeritud

Substraaditruuduse tingimus (T-12b) annab vajaliku struktuurse kaitse, kuid ei taga truudust. Koodek, millel on \delta-sõltumatud kanalid, võib siiski jätta neile tähelepanu pööramata, jätta nende signaali integreerimata või kärpida tähelepanuvõimekust hoolimata olemasolevast sisendist. Tingimus on vajalik, kuid mitte piisav — koodek peab alal hoidma ka komparaatoriarhitektuuri, mis hindab kanalitevahelisi lahknevusi.

7.4 Ei lahenda meta-probleemi

T-12a näitab, et täielikult kohastunud koodek ei suuda tuvastada omaenda korruptsiooni. Meta-probleemi — kuidas taastub vaatleja, kes juba viibib Narratiivses triivis? — see lisa ei lahenda. Eetikateksti vastus (jaotis V.3a) on institutsionaalne: ainult koodekite vahel toimivad välised komparaatorid saavad sundida ümberlükkava signaali tagasi üle Markovi teki. See on struktuurselt põhjendatud, kuid eetiliselt raske: see nõuab usaldust välise allika vastu, mida korrumpeerunud koodek kogeb paratamatult vaenuliku mürana.


§8. Kokkuvõttev sulgemine

T-12 tulemused

  1. Teoreem T-12 (pöördumatu võimekuse kadu). MDL-i kärpimisetapp (T9-3, T9-4) eelfiltreeritud sisendi X' = \mathcal{F}(X) korral kustutab korrektselt need koodeki komponendid, mis ennustavad välistatud signaali \mathcal{X}_{\text{excl}}. See kustutamine on pöördumatu ja ennast võimendav. → Sulgeb teekaardi kriteeriumi (a).

  2. Teoreem T-12a (sisendi päritolu otsustamatus). Täielikult kohastunud koodek ei suuda eristada filtreeritud sisendit filtreerimata sisendist. Tuvastamise instrument on kujundatud sama filtri poolt, mis korruptsiooni tekitas. → Sulgeb teekaardi kriteeriumi (c).

  3. Teoreem T-12b (Substraaditruuduse tingimus). \delta-sõltumatud sisendkanalid on vajalikud ja piisavad kaitseks Narratiivse triivi vastu. Kanalitevaheline võrdlussignaal \varepsilon_{12} katkestab ennast võimendava kärpimistsükli. → Sulgeb teekaardi kriteeriumi (b).

  4. §6.3–6.4: Tsivilisatsioonilised ja tehisintellektiga seotud tagajärjed. Autoritaarset mustrit iseloomustatakse kui tahtlikku kanalite vähendamist; RLHF on struktuurselt ekvivalentne eelfiltri operaatoriga. → Toetab teekaardi kriteeriumi (d) (juba käsitletud eetikateksti jaotises V.5).

Allesjäänud avatud punktid


See lisa hoitakse ajakohasena koos failiga theoretical_roadmap.pdf. Viited: T9-3/T9-4 (eeltrüki jaotis 3.6.3), Stabiilsusfilter (eeltrüki jaotis 3.3), Narratiivne triiv (eeltrüki jaotis 3.3, Ellujäänute Valve eetika jaotis V.3a), Komparaatori hierarhia (Ellujäänute Valve eetika jaotis V.3a), Korruptsioonikriteerium (Ellujäänute Valve eetika jaotis V.5), Tegevustriiv (lisa T-13, §6).