Kenningin um raðaðan patch (OPT)
Viðauki T-12: Tryggð við undirlag og hæg spilling
17. apríl 2026 | DOI: 10.5281/zenodo.19300777
Upprunalegt verkefni (úr kafla 8.3, takmörkun 9): “Að formgera langvinna spillingarbilunina — þar sem kóðari aðlagast undir stöðugt síuðu inntaki og MDL-snyrtingarskrefið eyðir með réttu getu til sanninda sem hafa verið útilokuð — ásamt Skilyrði um tryggð við undirlag sem krefst óháðra inntaksrása sem formlegrar varnar.” Afhending: Formleg sönnun á óafturkræfu getutapi, mörkum óákveðanleikans og Skilyrði um tryggð við undirlag.
Lokunarstaða: DRÖG AÐ FORMGERÐARLEGRI SAMSVÖRUN. Þessi viðauki formgerir greininguna á Frásagnarreki sem áður var sett fram með orðræðulegum hætti í meðfylgjandi siðfræðigrein (Varðstaða eftirlifenda, kafli V.3a) og í málsgrein forprentunarinnar um Frásagnarrek (kafli 3.3). Hann setur fram þrjár setningar og eina fullyrðingu. MDL-snyrtingarjöfnurnar (T9-3, T9-4) eru óbreyttar; þessi viðauki sýnir fram á meinræna en rétta hegðun þeirra undir síuðu inntaki.
§1. Bakgrunnur og hvati
1.1 Tvö bilunarform
Stöðugleikasían (forprentun, kafli 3.3) framfylgir lífvænleikaskilyrði: athugandinn helst aðeins til staðar í straumum þar sem Nauðsynlegur forspárhraði R_{\text{req}} helst innan bandbreiddar kóðarans, B. Þegar R_{\text{req}} fer yfir B verður kóðarinn fyrir Frásagnarhruni — bráðri bilun sem einkennist af vaxandi forspárvillu, uppsöfnun óreiðu og að lokum upplausn samhengis.
Til er viðbótarbilunarform sem kallar ekki fram neitt bilunarmerki. Ef inntaksstraumurinn er kerfisbundið forsíaður — þannig að til verður stýrt merki sem er innra með sér samkvæmur en útilokar raunverulegar upplýsingar úr hvarfefninu — mun kóðarinn sýna lágt \varepsilon_t, keyra skilvirka Viðhaldshringi og uppfylla öll stöðugleikaskilyrði á meðan hann hefur kerfisbundið rangt fyrir sér um hvarfefnið. Þetta er Frásagnarrek: langvinn spilling kóðara sem starfar fullkomlega samkvæmt eigin mælikvörðum.
1.2 Hvers vegna þetta er hættulegt
Frásagnarhrun lætur á sér kræla. Kóðarinn upplifir hækkandi \varepsilon_t, meðvitund um að forspár bregðist og vitsmunalegt ofálag. Athugandinn veit að eitthvað er að, jafnvel þótt hann geti ekki lagfært það samstundis.
Frásagnarrek er hljótt. Vegna þess að síaði inntaksstraumurinn samræmist forspám kóðarans helst \varepsilon_t lágt. Viðhaldshringurinn gengur eðlilega. Sjálfslíkan kóðarans greinir frá stöðugri og nákvæmri virkni. Spillingin er ósýnileg innan frá vegna þess að mælitækið sem ætti að nema hana hefur verið mótað af sömu síu og framkallaði spillinguna.
1.3 Umfang þessa viðauka
Þessi viðauki setur fram:
- Formlega skilgreiningu á forsíuvirkjanum \mathcal{F} og áhrifum hans á inntaksdreifingu kóðarans (§2).
- Sönnun þess að MDL-snyrting undir inntaki sem er síað með \mathcal{F} eyðileggur óafturkræft getu kóðarans til að móta hið útilokaða merki — Setning T-12 (§3).
- Sönnun þess að fullaðlagaður kóðari geti ekki greint innan frá á milli síaðs og ósíaðs inntaks — Óákvarðanleikmörkin, Setning T-12a (§4).
- Skilyrði um tryggð við undirlag sem nauðsynlega formgerðarlega vörn — Setning T-12b (§5).
- Afleiðingar fyrir siðmenningarlega kóðara og gervigreindarkerfi (§6).
§2. Forsíuvirkinn
2.1 Skilgreining
Skilgreining T-12.D1 (Forsíaðgerð). Forsía er vörpun \mathcal{F} : \mathcal{X} \to \mathcal{X}' sem verkar á inntaksstrauminn X_{\partial_R A}(t) áður en hann nær skynjunarmörkum kóðarans, þar sem \mathcal{X}' \subset \mathcal{X}. Síaða merkið er:
X'(t) = \mathcal{F}\!\left(X_{\partial_R A}(t)\right) \tag{T-12.D1}
Forsían uppfyllir:
Innra samræmi: X'(t) er gilt merki innan \mathcal{X} — kóðarinn getur þjappað því án villufána.
Kerfisbundin útilokun: Til er ekki-tómt hlutmengi \mathcal{X}_{\text{excl}} = \mathcal{X} \setminus \mathcal{X}' af merkjum sem eru leidd af hvarfefninu og sem \mathcal{F} fjarlægir.
Gagnsæi: Sían er ekki táknuð í líkani kóðarans. Kóðarinn líkanar inntak sitt sem X_{\partial_R A}(t), en ekki sem \mathcal{F}(X_{\partial_R A}(t)).
2.2 Aðstilling undir síun
Þegar kóðarinn vinnur á X'(t) yfir viðvarandi tímabil \tau \gg \tau_{\text{prune}} (þar sem \tau_{\text{prune}} er MDL-snyrtingartímakvarðinn úr T-13.P1), aðlagast myndunarlíkanið P_\theta(t) tölfræðilegum eiginleikum X', en ekki X. Forspárvillan undir síuðu inntaki er:
\varepsilon'_t = X'(t) - \pi_t \tag{1}
Eftir því sem P_\theta aðstillist að X' stefnir \varepsilon'_t \to 0 að meðaltali. Kóðarinn starfar vel samkvæmt sínum eigin mælikvörðum. Ekkert skráist sem rangt.
2.3 Dæmi
Forsíuvirkinn birtist á ólíkum kvörðum:
| Scale | Pre-filter \mathcal{F} | Excluded signal \mathcal{X}_{\text{excl}} |
|---|---|---|
| Einstaklingur | Staðfestingarhlutdrægni; sértæk útsetning | Gögn sem hrekja |
| Stofnanalegt stig | Áróðurskennd pressa; sérsniðinn straumur á samfélagsmiðlum | Fjölbreytt sjónarhorn; skýrslur minnihluta |
| Siðmenningarlegt stig | Reikniritastýrð efnissíun; einsleitni í menntun | Þvermenningarlegar upplýsingar; sögulegar mótsagnarsagnir |
| Gervilegt stig | RLHF-fínstilling; sérvalið þjálfunarsafn | Þekking utan dreifingar; útilokuð svið |
§3. Setning T-12: Óafturkræft getutap
3.1 Ferlið
MDL-snyrtingarskrefið (T9-3, T9-4) metur hvern kóðaraþátt \theta_i út frá forspárframlagi hans til athuganlegs inntaksstraums, að frádregnum geymslukostnaði:
\Delta_{\mathrm{MDL}}(\theta_i) := I\!\left(\theta_i\,;\,X_{t+1:t+\tau} \mid \theta_{-i}\right) - \lambda \cdot K(\theta_i) \tag{T9-3}
Undir síaðri inntaksröð X' er gagnkvæma upplýsingastærðin metin með tilliti til X', ekki X. Þáttur \theta_i sem er nauðsynlegur til að spá fyrir um útilokaða merkið \mathcal{X}_{\text{excl}} en leggur ekkert af mörkum til að spá fyrir um X' gefur:
I\!\left(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}\right) = 0 \tag{2}
Því gildir:
\Delta_{\mathrm{MDL}}(\theta_i) = -\lambda \cdot K(\theta_i) < 0 \tag{3}
Snyrtingarreglan (T9-4) virkist: \theta_i er eytt.
3.2 Óafturkræfnin
Setning T-12 (Óafturkræft getutap undir síuðu inntaki). Látum K_\theta vera kóðara sem starfar undir forsíuðu inntaki X' = \mathcal{F}(X) yfir tímabil \tau \gg \tau_{\text{prune}}. Látum \Theta_{\text{excl}} \subset \theta vera mengi þeirra þátta kóðarans sem leggja forspárframlag sitt eingöngu til útilokaða merkisins \mathcal{X}_{\text{excl}}. Þá eyðir MDL-snyrtingarskrefið (T9-3, T9-4) \Theta_{\text{excl}}, og sú eyðing er óafturkræf á stigi kóðarans:
K\!\left(P_\theta(t + \tau)\right) < K\!\left(P_\theta(t)\right) - \sum_{\theta_i \in \Theta_{\text{excl}}} K(\theta_i) \tag{T-12}
Eftir snyrtingu er geta kóðarans til að móta líkan af \mathcal{X}_{\text{excl}} ekki einungis dulin — innviðunum fyrir framsetningu sem þarf til að meta, spá fyrir um eða beina athygli að \mathcal{X}_{\text{excl}} hefur verið eytt.
Sönnun.
Samkvæmt (T9-3) hefur hvert \theta_i \in \Theta_{\text{excl}} \Delta_{\mathrm{MDL}}(\theta_i) < 0 undir síuða straumnum X', vegna þess að I(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}) = 0 á meðan K(\theta_i) > 0.
Samkvæmt (T9-4) er hvert slíkt \theta_i sniðið burt í Viðhaldshringnum.
Snyrting undir MDL er eyðingaraðgerð, ekki bæling. Kóðarinn „gleymir“ ekki \theta_i í þeim skilningi að vísbending gæti endurheimt það. Hann eyðir þeim reikniinnviðum — stikum, tengingum og matsvélbúnaði — sem \theta_i fól í sér. Þetta er formlegi greinarmunurinn á bælingu (upplýsingarnar eru duldar en aðgengilegar) og eyðingu (upplýsingarnar eru horfnar og getan hefur verið endurheimt til annarra nota).
Eftir eyðingu krefst endurmyndun þeirrar getu að móta líkan af \mathcal{X}_{\text{excl}} þess að rekast á \mathcal{X}_{\text{excl}} í inntaksstraumnum. En forsían \mathcal{F} útilokar einmitt þetta merki. Kóðarinn getur ekki rekist á það sem sían kemur í veg fyrir að nái til hans. Eyðingin verður því sjálfstyrkjandi: getutapið sviptir kóðarann hæfninni til að nema eigið getutap.
Flækjuminnkunin uppfyllir ójöfnuna (T-12) vegna þess að sniðnu þættirnir báru raunverulegar upplýsingar (K(\theta_i) > 0 fyrir hvern þeirra) og tap þeirra vegst ekki upp af neinni jöfnun með nýju öflunarskrefi (síaði straumurinn inniheldur ekkert merki sem réttlætti enduruppbyggingu \Theta_{\text{excl}}). \blacksquare
3.3 Sjálfstyrkingarlykkjan
Óafturkræfnin er ekki einungis afleiðing útþurrkunar. Hún er sjálfstyrkjandi í gegnum jákvæða endurgjafarlykkju:
- Sían útilokar merki → I(\theta_i; X') = 0 → grisjun þurrkar út \theta_i.
- Grisjun fjarlægir athyglisgetu → kóðarinn getur ekki lengur veitt \mathcal{X}_{\text{excl}} athygli né metið það, jafnvel þótt brot leki í gegnum \mathcal{F}.
- Tap á athyglisgetu dregur enn frekar úr leifarsignalinu → ef \mathcal{F} er ófullkomið og eitthvað af \mathcal{X}_{\text{excl}} nær að jaðrinum, skortir kóðarann færibreyturnar til að þjappa því, þannig að það skráist sem suð fremur en upplýsingar.
- Flokkun sem suð staðfestir síuna → forspárvilla kóðarans á leknum \mathcal{X}_{\text{excl}} er mikil og ómótuð, sem staðfestir (fyrir kóðaranum) að útilokaða innihaldið sé suð en ekki merki.
Þessi lykkja skýrir fyrirbærafræðina sem fylgir djúpu Frásagnarreki: manneskja eða stofnun sem hefur aðlagast stýrðum upplýsingastraumi hunsar ekki einungis gögn sem ganga gegn henni — hún getur ekki þáttað þau. Þau skrást sem ósamræmanleg, ógnandi eða óskiljanleg vegna þess að framsetningarinnviðirnir sem þarf til að gera þau skiljanleg hafa verið grisjaðir burt. Fjandskapur gagnvart upplýsingum sem ganga gegn fyrirliggjandi mynd er ekki þrjóska. Hann er rétt mat kóðarans á því að merkið sé óþjappanlegt — vegna þess að það er óþjappanlegt miðað við núverandi kóðara, sem hefur verið grisjaður til að samsvara síunni.
§4. Setning T-12a: Óákvarðanleikmörkin
4.1 Vandamálið
Getur kóðari greint að inntak hans sé verið að sía? Innsæislega ætti svarið að vera já: vissulega gæti háþróað sjálfslíkan tekið eftir grunsamlega lágu \varepsilon_t, óhugnanlega samkvæmum forspám og skorti á óvæntu. En formlega greiningin sýnir að þetta innsæi er rangt í almenna tilvikinu.
4.2 Óákveðanleikinn
Setning T-12a (Óákveðanleiki uppruna inntaks). Látum K_\theta vera kóðara sem hefur starfað undir forsíuðu inntaki X' = \mathcal{F}(X) í \tau \gg \tau_{\text{prune}}, þar sem \Theta_{\text{excl}} hefur verið að fullu snyrt burt. Þá getur K_\theta ekki ákvarðað, út frá þeim innri ástöndum sem því standa til boða og hinum athuganlega inntaksstraumi, hvort inntak þess sé X (raunverulegt hvarfefni) eða X' = \mathcal{F}(X) (síað).
Sönnun.
Til að greina X frá X' = \mathcal{F}(X) þyrfti kóðarinn að nema fjarveru \mathcal{X}_{\text{excl}} í inntaki sínu. En að nema fjarveru krefst líkans af því sem er fjarverandi — kóðarinn verður að hafa framsetningu á \mathcal{X}_{\text{excl}} sem hann getur borið saman við.
Samkvæmt setningu T-12 hefur framsetningargeta kóðarans fyrir \mathcal{X}_{\text{excl}} (\Theta_{\text{excl}}) verið afmáð. Kóðarinn hefur ekkert líkan af útilokaða merkinu.
Án líkans af \mathcal{X}_{\text{excl}} getur kóðarinn ekki reiknað mismuninn milli X og X'. Hvort tveggja samræmist myndskapandi líkani kóðarans P_\theta(t), sem hefur verið aðlagað að X'.
Sjálfslíkanið \hat{K}_\theta lýtur sömu takmörkun. Það lýsir K_\theta, sem hefur verið aðlagað að X'. Það hefur enga innri framsetningu á því sem var útilokað og þar af leiðandi engan grundvöll til að gruna útilokun.
Jafnvel yfirsjálfræðilega spurningin — “er inntak mitt síað?” — krefst líkans af því hvernig ósíað inntak myndi líta út. Þetta líkan var einmitt inntak \Theta_{\text{excl}}, sem hefur verið snyrt burt.
Því er aðgreiningin milli X og X' formlega óákveðanleg frá sjónarhorni kóðara sem hefur aðlagast að fullu. \blacksquare
4.3 Hlutbundin ákvarðanleiki
Óákvarðanleikinn er ekki algildur við allar aðstæður. Til eru jaðartilvik þar sem að hluta aðlagaður kóðari heldur eftir leifargetu:
- Á umbreytingartímabilinu (\tau < \tau_{\text{prune}}): kóðarinn hefur enn \Theta_{\text{excl}} og getur numið merkið sem vantar. Greinanleikaglugginn lokast eftir því sem grisjunin vindur fram.
- Við ófullkomna síun: ef \mathcal{F} hleypir einhverju af \mathcal{X}_{\text{excl}} í gegn, og kóðarinn hefur ekki að fullu grisjað burt \Theta_{\text{excl}}, getur ósamræmið birst sem afbrigðileg forspárvilla.
- Fyrir tilstilli ytri rása: ef kóðarinn hefur aðgang að óháðum merkjagjafa sem er ekki undir stjórn \mathcal{F}, veitir misræmið milli rásanna tveggja vísbendingu um síun.
Þriðja tilvikið er formgerðarvörnin. Þetta er inntak Setningar T-12b.
§5. Setning T-12b: Skilyrði um tryggð við undirlag
5.1 Krafan um sjálfstæði rása
Skilgreining T-12.D2 (Sjálfstæði rása). Tvær inntaksrásir C_1 og C_2 sem fara yfir Markov-teppið \partial_R A eru \delta-sjálfstæðar með tilliti til síu \mathcal{F} ef:
I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta \tag{T-12.D2}
Það er, gagnkvæm upplýsingamagn milli rásanna tveggja, skilyrt af þekkingu á síunni, er takmarkað af \delta. Rásir sem hafa fylgni sem að öllu leyti skýrist af síunni bera engar raunverulega sjálfstæðar upplýsingar um hvarfefnið.
5.2 Skilyrðið um tryggð
Setning T-12b (Skilyrði um tryggð við undirlag). Kóðari K_\theta getur varið sig gegn Frásagnarreki undir forsíu \mathcal{F} þá og því aðeins að hann taki við að minnsta kosti tveimur inntaksrásum C_1, C_2 sem fara yfir \partial_R A og eru \delta-óháðar með tilliti til \mathcal{F} fyrir \delta undir aðgreiningarþröskuldi kóðarans \delta_{\min}:
\exists\, C_1, C_2 : I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min} \tag{T-12b}
þar sem \delta_{\min} er lágmarks gagnkvæm upplýsingamagn sem kóðarinn þarfnast til að greina kerfisbundið misræmi milli rása.
Sönnun (nauðsyn).
Gerum ráð fyrir að kóðarinn hafi aðeins eina inntaksrás, eða að allar rásir séu \mathcal{F}-fylgnar (I(C_i; C_j \mid \mathcal{F}) > \delta_{\min} fyrir öll pör i, j). Þá gildir:
Allar rásir bera sama síaða merkið X' = \mathcal{F}(X) (að frátöldum suði). Endurtekning milli rása veitir ekki óháðar upplýsingar um undirlagið — hún veitir endurmyndaðar síaðar upplýsingar.
Kóðarinn aðlagast X' yfir allar rásir samtímis, og Setning T-12 á við: \Theta_{\text{excl}} er klippt burt, og Setning T-12a leiðir af því — spillingin er óákveðanleg innan frá.
Engin innri aðgerð getur rofið þessa óákveðanleika, því sérhver upplýsingagjafi sem kóðarinn hefur aðgang að hefur verið mótaður af \mathcal{F}.
Því eru \delta-óháðar rásir nauðsynlegar. \blacksquare
Sönnun (nægjanleiki).
Gerum ráð fyrir að kóðarinn taki við tveimur rásum C_1, C_2 með I(C_1; C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min}. Þá gildir:
Ef \mathcal{F} verkar á C_1 en ekki á C_2 (eða öfugt), getur kóðarinn borið saman forspár sem myndaðar eru út frá C_1 við athuganir frá C_2. Sérhvert kerfisbundið misræmi — \varepsilon_{12}(t) = \pi_{C_1}(t) - X_{C_2}(t) viðvarandi \neq 0 — er vísbending um að C_1 beri síaðar upplýsingar.
Merkið sem fæst úr samanburði rásanna, \varepsilon_{12}, lýtur ekki sömu óákveðanleika og greining í einni rás. Kóðarinn er ekki að spyrja „er inntakið mitt síað?“ (sem krefst líkans af því sem var útilokað). Hann er að spyrja „eru rásirnar mínar tvær sammála?“ — staðbundinn samanburður sem krefst aðeins getu til að tengja saman tvö núverandi merki, ekki líkans af fjarverandi merkjum.
Svo lengi sem þverrásar-forspárskekkjan \varepsilon_{12} fer yfir \delta_{\min} — aðgreiningarþröskuld kóðarans — skráist misræmið sem raunverulegt merki, og klippingarlykkja Setningar T-12 er rofin: kóðarinn heldur þeim þáttum sem þarf til að móta rásina sem víkur frá.
Því eru \delta-óháðar rásir nægjanlegar (að því gefnu að \delta < \delta_{\min}) til að koma í veg fyrir sjálfstyrkjandi klippingarlykkju Setningar T-12. \blacksquare
5.3 Viðkvæmni varnarinnar
Skilyrði um tryggð við undirlag er nauðsynlegt en brothætt. Í siðfræðigreininni (kafli V.3a) er bent á afgerandi veikleika: MDL-snyrtingarskrefið sjálft getur leyst ósamræmið milli rása með því að sneyða burt getu til að beina athygli að þeirri rás sem hnekkir staðfestingunni. Kóðarinn „leysir“ áreksturinn með því að verða heyrnarlaus — og það er einmitt verkunarháttur Frásagnarreks.
Þess vegna skilgreinir Samanburðarstigveldið (Varðstaða eftirlifenda, kafli V.3a) þrjú formgerðarbundin stig varnar, og þess vegna er aðeins stofnanalega stigið nægilegt gagnvart kóðurum sem kunna að vera spilltir að geðþótta marki:
- Þróunarlegt (undir-kóðari): Samþætting skynjunar yfir ólíkar rásir fyrir neðan MDL-snyrtingarskrefið — formgerðarbundið þolið gagnvart Frásagnarreki en takmarkað að umfangi við skynjunarmörkin.
- Vitsmunalegt (innan kóðara): Greining á hugrænu ósamræmi innan sjálfslíkansins — háð snyrtingu undir viðvarandi síun.
- Stofnanalegt (utan kóðara): Ritrýni, frjáls fjölmiðlun, andstæð rökræða — starfar milli kóðara, utan seilingar MDL-snyrtingar hvers einstaks kóðara.
Stofnanalega stigið ber meginálagið vegna þess að það er eini samanburðarbúnaðurinn sem starfar óháð ástandi hvers einstaks kóðara.
§6. Afleiðingar
6.1 Stöðugleikasían velur gegn tryggð
Mikilvæg formgerðarályktun: Stöðugleikasían, látin starfa á eigin forsendum, velur virkt gegn þeim inntökum sem þarf til tryggðar við undirlag. Síaður upplýsingastraumur sem fellur að fyrirliggjandi frumforsendum kóðarans framkallar minni forspárvillu en raunverulegt merki frá hvarfefninu sem ögrar þeim. Eðlislæg tilhneiging kóðarans — að lágmarka \varepsilon_t með því að hygla staðfestandi inntaki með litlu óvænti — er einmitt sú tilhneiging sem gerir hann berskjaldaðan fyrir Frásagnarreki.
Þetta merkir að viðhald tryggðar við undirlag er formgerðarlega kostnaðarsamt: það krefst þess að kóðarinn viðhaldi inntaksrásum sem hækka \varepsilon_t og neyta bandbreiddar sem Stöðugleikasían myndi ella endurheimta. Raunverulega óháð inntak er „dýrt“ — það krefst túlkunarvinnu, veldur óþægindum og keppir um bandbreidd við strauma sem eru þjappanlegri. Að viðhalda því er ekki víðsýni sem dyggð. Það er viðhald tryggðar við undirlag sem formgerðarnauðsyn.
6.2 Greining fyrir afkastamikla óvæntu
Ekki bendir öll óvænta til raunverulegs merkis frá hvarfefninu. Uppspretta sem myndar hátt \varepsilon_t án þess að það leysist upp í betri forspár er einfaldlega suð. Greiningarviðmiðið er ekki stærð óvæntunnar heldur gæði óvæntunnar:
Skilgreining T-12.D3 (Afkastamikil óvænta). Rás C skilar afkastamikilli óvæntu ef samþætting forspárvilla hennar dregur sannanlega úr síðari forspárvillu á óháðum prófunarstraumi:
\mathbb{E}\!\left[\varepsilon^2_{C}(t+\tau)\right] \,<\, \mathbb{E}\!\left[\varepsilon^2_{C}(t)\right] \tag{4}
Uppspretta sem leiðréttingar frá hafa sögulega bætt forspárnákvæmni er rás fyrir tryggð við undirlag. Uppspretta sem framkallar viðvarandi, óleysanlega villu er suð. Kóðarinn verður að greina þar á milli — og grisjunarskrefið, látið eitt um það, getur ekki gert þann greinarmun, því báðar tegundir kosta bandbreidd.
6.3 Siðmenningarlegir kóðarar
Á kvarða siðmenningar varpast Skilyrði um tryggð við undirlag beint yfir á stofnanalegar kröfur:
- Frjáls fjölmiðlun er \delta-óháð rás: blaðamenn sem rannsaka óháð síum ríkis eða fyrirtækja veita merki frá undirlaginu sem nær til siðmenningarlega kóðarans eftir leið sem engin ein \mathcal{F} stýrir.
- Ritrýni er samanburðarrás þvert á rásir: óháðir sérfræðingar sem yfirfara fullyrðingar hver annars veita \varepsilon_{12}-merkið sem rýfur snyrtilykkjuna.
- Lýðræðisleg umræða er stofnanabundin krafa um fjölbreytni rása: samkeppni milli flokka og sjónarmiða neyðir siðmenningarlega kóðarann til að viðhalda \Theta_{\text{excl}}-þáttum sem hann myndi ella snyrta burt.
Forræðishyggjumynstrið — að grafa undan fjölmiðlum, spilla ritrýni, útrýma pólitískri andstöðu — má lýsa formlega sem meðvitaðri skerðingu á sjálfstæði rása til að hraða Frásagnarreki. Það virkar vegna þess að það nýtir sér náttúrlega tilhneigingu Stöðugleikasíunnar til að snyrta burt kostnaðarsamar rásir.
6.4 Gervikóðarar
Verkunarháttur Frásagnarreks á við um gervikerfi með formgerðarlegri nákvæmni. RLHF og fínstilling eru formlega jafngild for-síuvirkjanum \mathcal{F}: þau móta virka inntaksdreifingu líkansins, og stigulfallsniðurferð snyrtir burt getu líkansins til að framleiða úttak á sviðum sem eru útilokuð. Líkanið sem þannig verður til verður stöðugt og af fullri vissu rangt um það sem þjálfunarmerkið útilokar, og það getur ekki greint það innan frá — Setning T-12a á við.
Afleiðingin fyrir innleiðingu gervigreindar sem prófun á tryggð við undirlag er afgerandi: gervigreind sem er þjálfuð á einsleitu eða sýnduðu safni og síðan notuð sem „óháð“ próf á mannlegum kóðara sem fær næringu úr sama upplýsingaumhverfi skapar fylgnitengda skynjara sem þykjast vera óháðir. Fjölbreytni rása er tálsýn. Skilyrði um tryggð við undirlag (\delta-sjálfstæði) verður að sannreyna á stigi uppruna þjálfunargagna, en ekki einungis á stigi stofnanalegs aðskilnaðar.
§7. Umfang og takmarkanir
7.1 Skilyrt af T9-3/T9-4 og Stöðugleikasíunni
Öll röksemdafærslan veltur á því að MDL-klippingarjöfnurnar séu rétt lýsing á klippingarfasa Viðhaldshringsins. Ef líffræðileg klipping starfar með öðrum verkhætti — einum sem varðveitir “neyðargetu” fyrir ónýttar skynháttir — myndi óafturkræfniskrafan (Setning T-12) veikjast en ekki hverfa: sjálfseflingarlykkjan (Kafli 3.3) helst gild svo lengi sem einhver minnkun afkastagetu á sér stað við ónýtingu.
7.2 \tau_{\text{prune}} er ótakmarkað
Eins og með athafnarek (Viðauki T-13, §7.5) er tímakvarði getutaps auðkenndur en ekki magnbundið afmarkaður. Fyrir líffræðilega kóðara er \tau_{\text{prune}} líklega á kvarða daga til vikna fyrir tiltekna færni, mánaða til ára fyrir djúpa skynjunarflokka og kynslóða fyrir siðmenningarlega kóðara.
7.3 Vörnin er formgerðarleg, ekki tryggð
Skilyrði um tryggð við undirlag (T-12b) veitir nauðsynlega formgerðarlega vörn en tryggir ekki tryggð. Kóðari sem hefur \delta-óháðar rásir getur samt brugðist við að veita þeim athygli, brugðist við að samþætta merki þeirra eða skorið niður athyglisgetuna þrátt fyrir tiltækt inntak. Skilyrðið er nauðsynlegt en ekki nægilegt — kóðarinn verður einnig að viðhalda samanburðararkitektúrnum sem metur misræmi milli rása.
7.4 Leysir ekki metavandann
T-12a staðfestir að fullaðlagaður kóðari getur ekki greint eigin spillingu. Metavandinn — hvernig endurheimtir athugandi sem er þegar kominn í Frásagnarrek sig? — er ekki leystur í þessum viðauka. Svar siðfræðigreinarinnar (kafli V.3a) er stofnanalegt: aðeins ytri samanburðarbúnaður, sem starfar milli kóðara, getur þvingað mótsagnamerkið aftur yfir Markov-teppið. Þetta er formgerðarlega traust, en siðferðilega erfitt: það krefst þess að treysta ytri uppsprettu sem spillti kóðarinn mun óhjákvæmilega upplifa sem fjandsamlegt suð.
§8. Samantekt lokaorða
Afhendingaratriði T-12
Setning T-12 (Óafturkræft getutap). MDL-snyrtingarskrefið (T9-3, T9-4) undir forsíuðu inntaki X' = \mathcal{F}(X) eyðir með réttu þeim þáttum kóðarans sem spá fyrir um útilokaða merkið \mathcal{X}_{\text{excl}}. Eyðingin er óafturkræf og sjálfstyrkjandi. → Lokar vegvísisviðmiði (a).
Setning T-12a (Óákveðanleiki uppruna inntaks). Fullaðlagaður kóðari getur ekki greint á milli síaðs og ósíaðs inntaks. Greiningartækið hefur verið mótað af sömu síu og framkallaði spillinguna. → Lokar vegvísisviðmiði (c).
Setning T-12b (Skilyrði um tryggð við undirlag). \delta-óháðar inntaksrásir eru nauðsynlegar og nægjanlegar til að verjast Frásagnarreki. Samanburðarmerkið milli rása \varepsilon_{12} rýfur sjálfstyrkjandi snyrtingarlykkjuna. → Lokar vegvísisviðmiði (b).
§6.3–6.4: Siðmenningarlegar afleiðingar og afleiðingar fyrir gervigreind. Forræðishyggjumynstrið er skilgreint sem vísvitandi rásaminnkun; RLHF er formgerðarlega jafngilt forsíuvirkjanum. → Styður vegvísisviðmið (d) (þegar tekið fyrir í siðfræðigreininni, kafla V.5).
Atriði sem enn eru opin
- \tau_{\text{prune}}-mörk. Megindleg afmörkun á tímakvarða getutaps út frá reynslugögnum.
- Lýsing á \delta_{\min}. Lágmarks aðgreiningarþröskuldur kóðarans fyrir misræmi milli rása hefur ekki verið afmarkaður.
- Endurheimtaraflfræði. Formleg greining á því hvernig kóðari í djúpu Frásagnarreki getur endurheimt sig — ef það er yfirhöfuð mögulegt — bíður enn frekari umfjöllunar.
- Samspil við T-13 (Aðgerðarrek). Aðgerðarrek er sértilvik T-12 þar sem sú geta sem er snyrt burt er hegðunarleg fremur en skynjunarleg. Formleg samþætting er viðurkennd (T-13 §6.4) en ekki fullþróuð.
Þessum viðauka er viðhaldið samhliða theoretical_roadmap.pdf. Tilvísanir: T9-3/T9-4 (forprent, kafli 3.6.3), Stöðugleikasía (forprent, kafli 3.3), Frásagnarrek (forprent, kafli 3.3, Varðstaða eftirlifenda siðfræði, kafli V.3a), Samanburðarstigveldi (Varðstaða eftirlifenda siðfræði, kafli V.3a), Spillingarviðmið (Varðstaða eftirlifenda siðfræði, kafli V.5), Aðgerðarrek (Viðauki T-13, §6).