A rendezett patch elmélete (OPT)

T-12. függelék: Szubsztráthűség és lassú korrupció

Anders Jarevåg

2026. április 17. | DOI: 10.5281/zenodo.19300777

Eredeti feladat (a 8.3. szakaszból, 9. korlát): „A krónikus korrupciós hibamód formalizálása — amikor egy kodek tartósan szűrt bemenet mellett alkalmazkodik, és az MDL-metszési lépés helyesen törli a kizárt igazságok reprezentálásához szükséges kapacitást — egyúttal a Szubsztráthűségi feltétel megadásával, amely független bemeneti csatornákat ír elő formális védelemként.” Teljesítendő eredmény: Az irreverzibilis kapacitásvesztés, az eldönthetetlenségi korlát és a Szubsztráthűségi feltétel formális bizonyítása.

Lezárási állapot: VÁZLATOS STRUKTURÁLIS MEGFELELTETÉS. Ez a függelék formalizálja a Narratív sodródás elemzését, amelyet a kísérő etikai tanulmány (Túlélők Őrsége, V.3a szakasz) és az előtanulmány Narratív sodródásról szóló bekezdése (3.3. szakasz) diszkurzív módon vezetett be. Három tételt és egy propozíciót állapít meg. Az MDL-metszési egyenletek (T9-3, T9-4) változatlanok; ez a függelék azt mutatja meg, hogy szűrt bemenet mellett ezek patológiás, de helyes módon viselkednek.


§1. Háttér és motiváció

1.1 Két hibamód

A Stabilitási szűrő (az előközlés 3.3. szakasza) egy életképességi feltételt érvényesít: a megfigyelő csak azokban a streamekben marad fenn, amelyekben a Szükséges prediktív ráta R_{\text{req}} a kodek sávszélességén, B-n belül marad. Amikor R_{\text{req}} meghaladja B-t, a kodek Narratív szétesést tapasztal — egy akut hibát, amelyet fokozódó predikciós hiba, entrópiafelhalmozódás és a koherencia végső felbomlása jellemez.

Létezik egy komplementer hibamód is, amely nem vált ki semmiféle hibajelet. Ha a bemeneti streamet szisztematikusan előszűrik — vagyis olyan kurált jelet hoznak létre, amely belsőleg konzisztens, de kizárja a szubsztrátum valódi információit —, a kodek alacsony \varepsilon_t értéket mutat, hatékony Karbantartási ciklusokat futtat, és minden stabilitási feltételt teljesít, miközben szisztematikusan téved a szubsztrátumot illetően. Ez a Narratív sodródás: egy olyan kodek krónikus korrumpálódása, amely a saját mércéi szerint tökéletesen működik.

1.2 Miért veszélyes ez

A Narratív szétesés jelzi önmagát. A kodek növekvő \varepsilon_t-t tapasztal, tudatában van a meghiúsuló predikcióknak, kognitív túlterhelést él át. A megfigyelő tudja, hogy valami nincs rendben, még ha nem is képes azt azonnal helyrehozni.

A Narratív sodródás néma. Mivel a szűrt bemeneti adatfolyam illeszkedik a kodek predikcióihoz, \varepsilon_t alacsony marad. A Karbantartási ciklus normálisan működik. A kodek önmodellje stabil, pontos működésről számol be. A korrupció belülről láthatatlan, mert maga az észlelés eszköze is ugyanannak a szűrőnek a hatására formálódott, amely a korrupciót létrehozta.

1.3 E függelék hatóköre

Ez a függelék a következőket nyújtja:

  1. A pre-filter operátor, \mathcal{F}, formális definícióját és annak hatását a kodek bemeneti eloszlására (§2).
  2. Annak bizonyítását, hogy az \mathcal{F} által szűrt bemenet melletti MDL-metszés visszafordíthatatlanul megsemmisíti a kodek azon képességét, hogy modellezze a kizárt jelet — T-12. tétel (§3).
  3. Annak bizonyítását, hogy egy teljesen adaptálódott kodek belülről nem képes megkülönböztetni a szűrt és a szűretlen bemenetet — az Eldönthetetlenségi határ, T-12a. tétel (§4).
  4. A Szubsztráthűségi feltételt mint szükséges strukturális védelmet — T-12b. tétel (§5).
  5. A civilizációs kodekekre és a mesterségesintelligencia-rendszerekre vonatkozó következményeket (§6).

§2. Az előszűrő operátor

2.1 Definíció

T-12.D1 definíció (Előszűrő-operátor). Az előszűrő egy \mathcal{F} : \mathcal{X} \to \mathcal{X}' leképezés, amely az X_{\partial_R A}(t) bemeneti jelfolyamon működik, mielőtt az elérné a kodek szenzoros határát, ahol \mathcal{X}' \subset \mathcal{X}. A szűrt jel:

X'(t) = \mathcal{F}\!\left(X_{\partial_R A}(t)\right) \tag{T-12.D1}

Az előszűrő kielégíti a következőket:

  1. Belső konzisztencia: X'(t) érvényes jel \mathcal{X}-en belül — a kodek hibajelzések nélkül képes tömöríteni.

  2. Szisztematikus kizárás: Létezik a szubsztrátumból származó jeleknek egy nem üres \mathcal{X}_{\text{excl}} = \mathcal{X} \setminus \mathcal{X}' részhalmaza, amelyet \mathcal{F} eltávolít.

  3. Transzparencia: A szűrő nem reprezentálódik a kodek modelljében. A kodek a bemenetét X_{\partial_R A}(t)-ként modellezi, nem pedig \mathcal{F}(X_{\partial_R A}(t))-ként.

2.2 Hangolódás szűrés alatt

Amikor a kodek tartósan, \tau \gg \tau_{\text{prune}} ideig X'(t)-n működik (ahol \tau_{\text{prune}} a T-13.P1-ből származó MDL-metszés időskálája), a generatív modell, P_\theta(t), X' statisztikáihoz alkalmazkodik, nem pedig X-hez. A predikciós hiba szűrt bemenet mellett:

\varepsilon'_t = X'(t) - \pi_t \tag{1}

Ahogy P_\theta ráhangolódik X'-re, \varepsilon'_t \to 0 átlagban. A kodek a saját mérőszámai szerint jól teljesít. Semmi sem jelzi, hogy bármi nincs rendben.

2.3 Példák

Az előszűrő operátor több léptékben is megvalósul:

Lépték Előszűrő \mathcal{F} Kizárt jel \mathcal{X}_{\text{excl}}
Egyéni Megerősítési torzítás; szelektív kitettség Cáfoló bizonyíték
Intézményi Propagandisztikus sajtó; kurált közösségimédia-hírfolyam Sokféle nézőpont; kisebbségi jelentések
Civilizációs Algoritmikus tartalomkurálás; oktatási monokultúra Kultúrák közötti információ; történelmi ellen-narratívák
Mesterséges RLHF-finomhangolás; kurált tanítási korpusz Eloszláson kívüli tudás; kizárt tartományok

§3. T-12 tétel: Visszafordíthatatlan kapacitásvesztés

3.1 A mechanizmus

Az MDL-metszési lépés (T9-3, T9-4) minden egyes \theta_i kodekkomponenst a megfigyelhető bemeneti folyamhoz való prediktív hozzájárulása alapján értékel, a tárolási költséggel csökkentve:

\Delta_{\mathrm{MDL}}(\theta_i) := I\!\left(\theta_i\,;\,X_{t+1:t+\tau} \mid \theta_{-i}\right) - \lambda \cdot K(\theta_i) \tag{T9-3}

Szűrt X' bemenet esetén a kölcsönös információs tagot X'-re, nem pedig X-re vonatkoztatva értékeljük. Egy olyan \theta_i komponens, amely nélkülözhetetlen a kizárt jel, \mathcal{X}_{\text{excl}} előrejelzéséhez, de semmivel sem járul hozzá X' előrejelzéséhez, a következőt adja:

I\!\left(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}\right) = 0 \tag{2}

Ezért:

\Delta_{\mathrm{MDL}}(\theta_i) = -\lambda \cdot K(\theta_i) < 0 \tag{3}

A metszési szabály (T9-4) aktiválódik: \theta_i törlődik.

3.2 A visszafordíthatatlanság

T-12 tétel (Visszafordíthatatlan kapacitásvesztés szűrt bemenet mellett). Legyen K_\theta egy kodek, amely előszűrt bemenet, X' = \mathcal{F}(X) alatt működik egy \tau \gg \tau_{\text{prune}} időtartamon keresztül. Legyen \Theta_{\text{excl}} \subset \theta azon kodekkomponensek halmaza, amelyek prediktív hozzájárulása kizárólag a kizárt jelre, \mathcal{X}_{\text{excl}}-ra irányul. Ekkor az MDL-alapú metszési lépés (T9-3, T9-4) eltávolítja \Theta_{\text{excl}}-t, és ez az eltávolítás a kodek szintjén visszafordíthatatlan:

K\!\left(P_\theta(t + \tau)\right) < K\!\left(P_\theta(t)\right) - \sum_{\theta_i \in \Theta_{\text{excl}}} K(\theta_i) \tag{T-12}

A metszés után a kodek \mathcal{X}_{\text{excl}} modellezésére való kapacitása nem pusztán lappangóvá válik — megsemmisül az a reprezentációs infrastruktúra, amely \mathcal{X}_{\text{excl}} kiértékeléséhez, előrejelzéséhez vagy figyelmi feldolgozásához szükséges.

Bizonyítás.

  1. A (T9-3) alapján minden \theta_i \in \Theta_{\text{excl}} esetén \Delta_{\mathrm{MDL}}(\theta_i) < 0 a szűrt X' folyam alatt, mivel I(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}) = 0, miközben K(\theta_i) > 0.

  2. A (T9-4) alapján minden ilyen \theta_i metszésre kerül a Karbantartási ciklus során.

  3. Az MDL szerinti metszés törlési művelet, nem pedig elnyomás. A kodek nem olyan értelemben „felejti el” \theta_i-t, hogy egy jelzőinger helyreállíthatná. Megsemmisíti azt a számítási infrastruktúrát — a paramétereket, a kapcsolatokat, a kiértékelő mechanizmust —, amelyet \theta_i reprezentált. Ez a formális különbség az elnyomás (az információ látens, de hozzáférhető) és a törlés (az információ eltűnt, és a kapacitás felszabadult) között.

  4. A törlés után a \mathcal{X}_{\text{excl}} modellezésére szolgáló kapacitás újratermeléséhez az szükséges, hogy a kodek a bemeneti folyamban találkozzon \mathcal{X}_{\text{excl}}-val. Ám az előszűrő, \mathcal{F}, éppen ezt a jelet zárja ki. A kodek nem találkozhat azzal, aminek az elérését a szűrő megakadályozza. A törlés ezért önmegerősítő: a kapacitásvesztés megszünteti a kodek azon képességét, hogy saját kapacitásvesztését észlelje.

  5. A komplexitáscsökkenés kielégíti a (T-12) egyenlőtlenséget, mert a lemetszett komponensek valós információt reprezentáltak (mindegyikre K(\theta_i) > 0), és elvesztésüket nem ellensúlyozza semmiféle kompenzáló gyarapodás (a szűrt folyam nem tartalmaz olyan jelet, amely indokolná \Theta_{\text{excl}} újjáépítését). \blacksquare

3.3 Az önmegerősítő hurok

A visszafordíthatatlanság nem pusztán a törlés következménye. Önmegerősítő egy pozitív visszacsatolási hurkon keresztül:

  1. A szűrő kizárja a jeletI(\theta_i; X') = 0 → a ritkítás törli \theta_i-t.
  2. A ritkítás megszünteti a figyelmi kapacitást → a kodek többé nem képes figyelmet fordítani \mathcal{X}_{\text{excl}}-re, illetve azt kiértékelni, még akkor sem, ha töredékei átszivárognak \mathcal{F}-en.
  3. A figyelmi kapacitás elvesztése még a maradék jelet is csökkenti → ha \mathcal{F} nem tökéletes, és valamennyi \mathcal{X}_{\text{excl}} eléri a határt, a kodek nem rendelkezik azokkal a paraméterekkel, amelyekkel ezt tömöríteni tudná, ezért információ helyett zajként regisztrálja.
  4. A zajként való besorolás megerősíti a szűrőt → a kodek predikciós hibája a beszivárgó \mathcal{X}_{\text{excl}} esetén nagy és strukturálatlan, ami megerősíti (a kodek számára), hogy a kizárt tartalom zaj, nem pedig jel.

Ez a hurok magyarázza a mély Narratív sodródás fenomenológiáját: egy személy vagy intézmény, amely egy kurált információáramhoz alkalmazkodott, nem pusztán figyelmen kívül hagyja a cáfoló bizonyítékokat — nem képes értelmezni őket. Koherencia nélkülinek, fenyegetőnek vagy felfoghatatlannak regisztrálódnak, mert az azokat érthetővé tevő reprezentációs infrastruktúrát a ritkítás eltávolította. A cáfoló információval szembeni ellenségesség nem makacsság. Hanem annak a helyes kodekbeli megítélése, hogy a jel nem tömöríthető — mert az aktuális kodek mellett nem tömöríthető, amelyet a szűrőhöz igazodva ritkítottak meg.


§4. T-12a tétel: Az eldönthetetlenségi határ

4.1 A probléma

Képes-e egy kodek észlelni, hogy a bemenetét szűrik? Intuitíve a válasznak igennek kellene lennie: egy kifinomult önmodell bizonyára észrevehetné a gyanúsan alacsony \varepsilon_t-t, a kísértetiesen következetes előrejelzéseket, a meglepetés hiányát. A formális elemzés azonban azt mutatja, hogy ez az intuíció általános esetben téves.

4.2 Az eldönthetetlenség

T-12a tétel (A bemeneti eredet eldönthetetlensége). Legyen K_\theta egy kodek, amely előszűrt bemenet alatt működött, ahol X' = \mathcal{F}(X), \tau \gg \tau_{\text{prune}} ideig, miközben \Theta_{\text{excl}} teljesen le lett nyesve. Ekkor K_\theta a rendelkezésére álló belső állapotokból és a megfigyelhető bemeneti adatfolyamból nem tudja meghatározni, hogy a bemenete X (valódi szubsztrátum) vagy X' = \mathcal{F}(X) (szűrt).

Bizonyítás.

  1. Ahhoz, hogy megkülönböztesse X-et X' = \mathcal{F}(X)-től, a kodeknek észlelnie kellene \mathcal{X}_{\text{excl}} hiányát a bemenetében. A hiány észleléséhez azonban modellre van szükség arról, ami hiányzik — a kodeknek rendelkeznie kell \mathcal{X}_{\text{excl}} egy olyan reprezentációjával, amelyhez viszonyítva ellenőrizhet.

  2. A T-12 tétel szerint a kodek reprezentációs kapacitása \mathcal{X}_{\text{excl}} számára (\Theta_{\text{excl}}) törlődött. A kodeknek nincs modellje a kizárt jelről.

  3. \mathcal{X}_{\text{excl}} modellje nélkül a kodek nem tudja kiszámítani az X és X' közötti különbséget. Mindkettő összeegyeztethető a kodek generatív modelljével, P_\theta(t)-vel, amely X'-hez alkalmazkodott.

  4. Az önmodell, \hat{K}_\theta, ugyanennek a korlátnak van alávetve. Olyan K_\theta-t modellez, amely X'-hez alkalmazkodott. Nincs belső reprezentációja arról, ami ki lett zárva, ezért nincs alapja arra sem, hogy kizárásra gyanakodjon.

  5. Még a metakognitív kérdés is — „szűrt-e a bemenetem?” — megkövetel egy modellt arról, hogyan nézne ki a nem szűrt bemenet. Ez a modell éppen \Theta_{\text{excl}} tartalma volt, amely le lett nyesve.

Ezért az X és X' közötti különbségtétel formálisan eldönthetetlen egy teljesen adaptálódott kodek nézőpontjából. \blacksquare

4.3 Részleges eldönthetőség

Az eldönthetetlenség nem minden feltétel mellett abszolút. Vannak határesetek, amelyekben egy részlegesen adaptált kodek megőriz valamennyi maradék kapacitást:

A harmadik eset a strukturális védelem. Ez T-12b tétel tartalma.


§5. T-12b tétel: A Szubsztráthűségi feltétel

5.1 A csatornafüggetlenség követelménye

T-12.D2 definíció (Csatornafüggetlenség). A Markov-takaró \partial_R A határán áthaladó két bemeneti csatorna, C_1 és C_2, \delta-független egy \mathcal{F} szűrőre vonatkozóan, ha:

I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta \tag{T-12.D2}

Vagyis a két csatorna közötti kölcsönös információ, a szűrő ismeretére feltételezve, \delta által korlátos. Azok a csatornák, amelyek korrelációját teljes egészében a szűrő magyarázza, nem hordoznak valóban független szubsztrátuminformációt.

5.2 A hűségi feltétel

T-12b tétel (Szubsztráthűségi feltétel). Egy K_\theta kodek akkor és csak akkor képes védekezni a Narratív sodródás ellen egy \mathcal{F} előszűrő mellett, ha legalább két, a \partial_R A-n áthaladó bemeneti csatornát C_1, C_2 kap, amelyek \delta-függetlenek \mathcal{F}-re nézve, ahol \delta kisebb a kodek megkülönböztetési küszöbénél, \delta_{\min}-nél:

\exists\, C_1, C_2 : I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min} \tag{T-12b}

ahol \delta_{\min} az a minimális kölcsönös információ, amelyre a kodeknek szüksége van ahhoz, hogy szisztematikus eltérést észleljen a csatornák között.

Bizonyítás (szükségesség).

Tegyük fel, hogy a kodeknek csak egyetlen bemeneti csatornája van, vagy minden csatorna \mathcal{F}-korrelált (I(C_i; C_j \mid \mathcal{F}) > \delta_{\min} minden i, j párra). Ekkor:

  1. Minden csatorna ugyanazt a szűrt jelet hordozza, X' = \mathcal{F}(X) (a zajtól eltekintve). A csatornák közötti redundancia nem szolgáltat független szubsztrátuminformációt — csupán a szűrt információ replikációját adja.

  2. A kodek egyszerre alkalmazkodik X'-hez minden csatornán, és alkalmazható a T-12 tétel: \Theta_{\text{excl}} lemetsződik, és ebből következik a T-12a tétel — a korrupció belülről eldönthetetlen.

  3. Semmilyen belső művelet nem tudja megtörni ezt az eldönthetetlenséget, mert minden információforrást, amelyhez a kodek hozzáférhet, \mathcal{F} formált.

Következésképpen a \delta-független csatornák szükségesek. \blacksquare

Bizonyítás (elégségesség).

Tegyük fel, hogy a kodek két csatornát kap, C_1, C_2, amelyekre I(C_1; C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min}. Ekkor:

  1. Ha \mathcal{F} működik C_1-en, de nem C_2-n (vagy fordítva), a kodek össze tudja vetni a C_1-ből generált predikciókat a C_2-ből származó megfigyelésekkel. Bármely szisztematikus eltérés — \varepsilon_{12}(t) = \pi_{C_1}(t) - X_{C_2}(t) tartósan \neq 0 — annak bizonyítéka, hogy C_1 szűrt információt hordoz.

  2. A csatorna-összehasonlítási jel, \varepsilon_{12}, nem esik ugyanazon eldönthetetlenség alá, mint az egycsatornás detekció. A kodek nem azt kérdezi, hogy „szűrt-e a bemenetem?” (ami modellt igényelne arról, mi lett kizárva). Hanem azt kérdezi: „egyezik-e a két csatornám?” — ez lokális összevetés, amelyhez csak két jelenlegi jel korrelálásának képessége szükséges, nem pedig a hiányzó jelek modellje.

  3. Amíg a csatornák közötti predikciós hiba, \varepsilon_{12}, meghaladja \delta_{\min}-t — a kodek megkülönböztetési küszöbét —, az eltérés valódi jelként regisztrálódik, és a T-12 tétel lemetszési hurka megszakad: a kodek megtartja az eltérő csatorna modellezéséhez szükséges komponenseket.

Ezért a \delta-független csatornák elegendőek (a \delta < \delta_{\min} feltétel mellett) ahhoz, hogy megakadályozzák a T-12 tétel önmegerősítő lemetszési hurkát. \blacksquare

5.3 A védelem sérülékenysége

A Szubsztráthűségi feltétel szükséges, de törékeny. Az etikai tanulmány (V.3a szakasz) egy kritikus sebezhetőséget azonosít: maga az MDL-metszési lépés is feloldhatja a csatornák közötti inkonzisztenciát azáltal, hogy kimetszi a cáfoló csatornára irányuló figyelem képességét. A kodek úgy „oldja meg” a konfliktust, hogy megsüketül — és ez pontosan a Narratív sodródás mechanizmusa.

Ezért azonosítja a Komparátor-hierarchia (Túlélők Őrsége, V.3a szakasz) a védelem három strukturális szintjét, és ezért csak az intézményi szint elegendő tetszőlegesen kompromittált kodekek esetén:

  1. Evolúciós (szub-kodek): Keresztmodális szenzoros integráció az MDL-metszési lépés alatt — strukturálisan ellenáll a Narratív sodródásnak, de hatóköre a szenzoros határra korlátozódik.
  2. Kognitív (intra-kodek): A kognitív disszonancia detektálása az én-modellen belül — tartós szűrés mellett maga is metszés alá kerülhet.
  3. Intézményi (extra-kodek): Szakmai lektorálás, szabad sajtó, adverszariális vita — a kodekek között működik, bármely egyedi kodek MDL-metszésének hatókörén kívül.

Az intézményi szint teherhordó elem, mert ez az egyetlen komparátor, amely bármely individuális kodek állapotától függetlenül működik.


§6. Következmények

6.1 A Stabilitási szűrő a hűség ellen szelektál

Kritikus strukturális következmény: a Stabilitási szűrő, ha saját működésére van hagyva, aktívan a szubsztráthűséghez szükséges bemenetek ellen szelektál. Egy kurált információs áram, amely illeszkedik a kodek meglévő priorjaihoz, kisebb predikciós hibát generál, mint egy valódi szubsztrátumjel, amely kihívás elé állítja azokat. A kodek természetes hajlama — hogy a megerősítő, alacsony meglepetéstartalmú bemenet előnyben részesítésével minimalizálja \varepsilon_t-t — pontosan az a hajlam, amely sebezhetővé teszi a Narratív sodródással szemben.

Ez azt jelenti, hogy a szubsztráthűség fenntartása strukturálisan költséges: megköveteli, hogy a kodek olyan bemeneti csatornákat tartson fenn, amelyek növelik \varepsilon_t-t, és ezzel olyan sávszélességet használnak fel, amelyet a Stabilitási szűrő egyébként visszanyerne. A valóban független bemenet „drága” — értelmező erőfeszítést igényel, diszkomfortot kelt, és a sávszélességért a jobban tömöríthető áramokkal verseng. Fenntartása nem az erényként felfogott nyitottság kérdése. Hanem a szubsztráthűség fenntartása mint strukturális szükségszerűség.

6.2 A produktív meglepetés diagnosztikája

Nem minden meglepetés jelez valódi szubsztrátumjelet. Egy forrás, amely magas \varepsilon_t-t generál, de ez nem oldódik fel jobb predikciókban, egyszerűen zaj. A diagnosztikai kritérium nem a meglepetés nagysága, hanem a meglepetés minősége:

T-12.D3 definíció (Produktív meglepetés). Egy C csatorna akkor közvetít produktív meglepetést, ha a predikciós hibáinak integrálása kimutathatóan csökkenti a későbbi predikciós hibát egy független tesztfolyamon:

\mathbb{E}\!\left[\varepsilon^2_{C}(t+\tau)\right] \,<\, \mathbb{E}\!\left[\varepsilon^2_{C}(t)\right] \tag{4}

Az a forrás, amelynek korrekciói történetileg javítják a prediktív pontosságot, szubsztráthűségi csatorna. Az a forrás, amely tartós, feloldhatatlan hibát generál, zaj. A kodeknek különbséget kell tennie a kettő között — és az önmagára hagyott metszési lépés ezt a különbséget nem tudja megtenni, mert mindkét típus sávszélességbe kerül.

6.3 Civilizációs kodekek

Civilizációs léptékben a Szubsztráthűségi feltétel közvetlenül intézményi követelményekre képezhető le:

Az autoriter mintázat — a sajtó leépítése, a szakmai lektorálás korrumpálása, a politikai ellenzék felszámolása — formálisan úgy jellemezhető, mint a csatornafüggetlenség szándékos csökkentése a Narratív sodródás felgyorsítása érdekében. Ez azért működik, mert kihasználja a Stabilitási szűrő természetes hajlamát a költséges csatornák lemetszésére.

6.4 Mesterséges kodekek

A Narratív sodródás mechanizmusa szerkezeti pontossággal érvényes a mesterséges rendszerekre is. Az RLHF és a finomhangolás formálisan ekvivalens az \mathcal{F} előszűrő operátorral: alakítják a modell effektív bemeneti eloszlását, a gradienscsökkenés pedig lefaragja a modell kapacitását a kizárt kimeneti tartományok tekintetében. Az így létrejövő modell stabilan és magabiztosan téved abban, amit a tanítójel kizár, és ezt belülről nem képes észlelni — T-12a tétel alkalmazandó.

Ennek implikációja az MI telepítésére mint szubsztráthűségi ellenőrzésre nézve döntő fontosságú: egy homogén vagy kurált korpuszon betanított, majd ugyanabból az információs környezetből táplált emberi kodek „független” ellenőrzéseként bevetett MI függetlennek álcázott, valójában korrelált szenzorokat hoz létre. A csatornadiverzitás illuzórikus. A Szubsztráthűségi feltételt (\delta-függetlenség) a tanítóadatok eredetének szintjén kell ellenőrizni, nem pusztán az intézményi elkülönülés szintjén.


§7. Hatókör és korlátok

7.1 T9-3/T9-4 és a Stabilitási szűrő feltételével

Az egész érv azon múlik, hogy az MDL-metszési egyenletek helyesen írják-e le a Karbantartási ciklus metszési menetét. Ha a biológiai metszés más mechanizmussal működik — olyannal, amely megőrzi a használaton kívüli modalitások „vészhelyzeti” kapacitását —, akkor a visszafordíthatatlansági állítás (T-12 tétel) gyengülne, de nem tűnne el: az önerősítő hurok (3.3. szakasz) mindaddig érvényes marad, amíg használaton kívüliség esetén bármilyen kapacitáscsökkenés bekövetkezik.

7.2 A \tau_{\text{prune}} nincs korlátozva

A cselekvési sodródáshoz hasonlóan (T-13 függelék, §7.5) a kapacitásvesztés időskálája azonosított, de mennyiségileg nincs korlátozva. Biológiai kodekek esetén a \tau_{\text{prune}} valószínűleg napok-hetek nagyságrendjébe esik specifikus készségek esetén, hónapok-évekbe mély perceptuális kategóriák esetén, és generációs léptékű a civilizációs kodekeknél.

7.3 A védelem strukturális, nem garantált

A Szubsztráthűségi feltétel (T-12b) szükséges strukturális védelmet biztosít, de nem garantálja a hűséget. Egy kodek, amely rendelkezik \delta-független csatornákkal, még mindig elmulaszthatja, hogy figyeljen rájuk, elmulaszthatja jelük integrálását, vagy visszametszheti figyelmi kapacitását a rendelkezésre álló bemenet ellenére. A feltétel szükséges, de nem elégséges — a kodeknek fenn kell tartania azt a komparátor-architektúrát is, amely értékeli a csatornák közötti eltérést.

7.4 Nem oldja meg a metaproblémát

A T-12a megállapítja, hogy egy teljesen adaptálódott kodek nem képes felismerni a saját korrumpálódását. A metaprobléma — hogyan áll helyre egy már Narratív sodródásban lévő megfigyelő? — ebben a függelékben nem oldódik meg. Az etikai tanulmány válasza (V.3a szakasz) intézményi jellegű: csak a kodekek között működő külső komparátorok képesek a cáfoló jelet visszakényszeríteni a Markov-takarón keresztül. Ez strukturálisan megalapozott, etikailag azonban nehéz: megköveteli egy olyan külső forrásba vetett bizalmat, amelyet a korrumpálódott kodek szükségképpen ellenséges zajként fog megélni.


§8. Záró összefoglaló

T-12 eredményei

  1. T-12 tétel (Irreverzibilis kapacitásvesztés). Az MDL-metszési lépés (T9-3, T9-4) előszűrt bemenet mellett, X' = \mathcal{F}(X), helyesen törli azokat a kodekkomponenseket, amelyek a kizárt jelet, \mathcal{X}_{\text{excl}}-t prediktálják. A törlés irreverzibilis és önmegerősítő. → Lezárja az ütemterv (a) kritériumát.

  2. T-12a tétel (A bemenet eredetének eldönthetetlensége). Egy teljesen adaptálódott kodek nem képes megkülönböztetni a szűrt bemenetet a szűretlentől. Az észlelés eszközét ugyanaz a szűrő formálta, amely a korrupciót létrehozta. → Lezárja az ütemterv (c) kritériumát.

  3. T-12b tétel (Szubsztráthűségi feltétel). A \delta-független bemeneti csatornák szükségesek és elégségesek a Narratív sodródás elleni védelemhez. A csatornák közötti összehasonlítás jele, \varepsilon_{12}, megszakítja az önmegerősítő metszési hurkot. → Lezárja az ütemterv (b) kritériumát.

  4. §6.3–6.4: Civilizációs és MI-következmények. Az autoriter mintázat szándékos csatornaszűkítésként van jellemezve; az RLHF strukturálisan ekvivalens az előszűrő operátorral. → Alátámasztja az ütemterv (d) kritériumát (ezt az etikai tanulmány V.5. szakasza már tárgyalja).

Nyitva maradó tételek


Ez a függelék a theoretical_roadmap.pdf-fel párhuzamosan van karbantartva. Hivatkozások: T9-3/T9-4 (preprint 3.6.3. szakasz), Stabilitási szűrő (preprint 3.3. szakasz), Narratív sodródás (preprint 3.3. szakasz, Túlélők Őrsége Etika V.3a szakasz), Komparátor-hierarchia (Túlélők Őrsége Etika V.3a szakasz), Korrupciós kritérium (Túlélők Őrsége Etika V.5. szakasz), Cselekvési sodródás (T-13 függelék, §6).