Teoria uporządkowanego patcha (OPT)

Appendix T-12: Wierność substratowi i powolna korupcja

Anders Jarevåg

17 kwietnia 2026 | DOI: 10.5281/zenodo.19300777

Zadanie pierwotne (z Sekcji 8.3, Ograniczenie 9): „Sformalizowanie chronicznego trybu uszkodzenia przez korupcję — w którym kodek adaptuje się pod wpływem konsekwentnie filtrowanego wejścia, a przebieg przycinania MDL prawidłowo usuwa pojemność dla wykluczonych prawd — wraz z Warunkiem wierności substratowi wymagającym niezależnych kanałów wejściowych jako formalnej obrony.” Rezultat: Formalny dowód nieodwracalnej utraty pojemności, granicy nierozstrzygalności oraz Warunku wierności substratowi.

Status domknięcia: SZKIC KORESPONDENCJI STRUKTURALNEJ. Niniejszy aneks formalizuje analizę Dryfu narracyjnego, wprowadzoną dyskursywnie w towarzyszącym artykule etycznym (Straż Ocalałych, Sekcja V.3a) oraz w akapicie o Dryfie narracyjnym w preprincie (Sekcja 3.3). Ustanawia trzy twierdzenia i jedną propozycję. Równania przycinania MDL (T9-3, T9-4) pozostają niezmienione; niniejszy aneks wykazuje ich patologiczne, lecz prawidłowe zachowanie przy filtrowanym wejściu.


§1. Tło i motywacja

1.1 Dwa tryby awarii

Filtr stabilności (preprint, sekcja 3.3) narzuca warunek żywotności: obserwator utrzymuje się wyłącznie w tych strumieniach, w których Wymagana szybkość predykcyjna R_{\text{req}} pozostaje w granicach przepustowości kodeka B. Gdy R_{\text{req}} przekracza B, kodek doświadcza Rozpadu narracyjnego — ostrej awarii charakteryzującej się narastającym błędem predykcji, akumulacją entropii oraz ostatecznym rozpadem spójności.

Istnieje komplementarny tryb awarii, który nie wyzwala żadnego sygnału błędu. Jeśli strumień wejściowy jest systematycznie wstępnie filtrowany — wytwarzając kuratorowany sygnał, który jest wewnętrznie spójny, lecz wyklucza autentyczną informację o substracie — kodek będzie wykazywał niskie \varepsilon_t, realizował wydajne Cykle konserwacji i spełniał wszystkie warunki stabilności, pozostając zarazem systematycznie błędnym w odniesieniu do substratu. To jest Dryf narracyjny: chroniczna korupcja kodeka, który według własnych miar funkcjonuje doskonale.

1.2 Dlaczego to jest niebezpieczne

Rozpad narracyjny sam się ujawnia. Kodek doświadcza rosnącego \varepsilon_t, świadomości zawodzących predykcji i przeciążenia poznawczego. obserwator wie, że coś jest nie tak, nawet jeśli nie potrafi tego od razu naprawić.

Dryf narracyjny jest cichy. Ponieważ przefiltrowany strumień wejściowy odpowiada predykcjom kodeka, \varepsilon_t pozostaje niskie. Cykl konserwacji przebiega normalnie. Samomodel kodeka raportuje stabilne, trafne działanie. Korupcja pozostaje niewidoczna od wewnątrz, ponieważ instrument detekcji został ukształtowany przez ten sam filtr, który tę korupcję wytworzył.

1.3 Zakres niniejszego aneksu

Niniejszy aneks przedstawia:

  1. Formalną definicję operatora prefiltrującego \mathcal{F} oraz jego wpływ na rozkład wejściowy kodeka (§2).
  2. Dowód, że przycinanie MDL przy wejściu filtrowanym przez \mathcal{F} nieodwracalnie niszczy zdolność kodeka do modelowania wykluczonego sygnału — Twierdzenie T-12 (§3).
  3. Dowód, że w pełni zaadaptowany kodek nie może od wewnątrz odróżnić wejścia filtrowanego od niefiltrowanego — Granica nierozstrzygalności, Twierdzenie T-12a (§4).
  4. Warunek wierności substratowi jako konieczną obronę strukturalną — Twierdzenie T-12b (§5).
  5. Konsekwencje dla cywilizacyjnych kodeków i systemów AI (§6).

§2. Operator prefiltru

2.1 Definicja

Definicja T-12.D1 (Operator pre-filtra). Pre-filtr to odwzorowanie \mathcal{F} : \mathcal{X} \to \mathcal{X}' działające na strumieniu wejściowym X_{\partial_R A}(t), zanim dotrze on do granicy sensorycznej kodeka, gdzie \mathcal{X}' \subset \mathcal{X}. Odfiltrowany sygnał ma postać:

X'(t) = \mathcal{F}\!\left(X_{\partial_R A}(t)\right) \tag{T-12.D1}

Pre-filtr spełnia następujące warunki:

  1. Spójność wewnętrzna: X'(t) jest poprawnym sygnałem w obrębie \mathcal{X} — kodek może go kompresować bez sygnałów błędu.

  2. Systematyczne wykluczenie: Istnieje niepusty podzbiór \mathcal{X}_{\text{excl}} = \mathcal{X} \setminus \mathcal{X}' sygnałów pochodzących z substratu, które są usuwane przez \mathcal{F}.

  3. Przejrzystość: Filtr nie jest reprezentowany w modelu kodeka. Kodek modeluje swoje wejście jako X_{\partial_R A}(t), a nie jako \mathcal{F}(X_{\partial_R A}(t)).

2.2 Strojenie pod wpływem filtrowania

Gdy kodek działa na X'(t) przez utrzymujący się okres \tau \gg \tau_{\text{prune}} (gdzie \tau_{\text{prune}} jest skalą czasową przycinania MDL z T-13.P1), model generatywny P_\theta(t) dostosowuje się do statystyk X', a nie X. Błąd predykcji przy filtrowanym wejściu ma postać:

\varepsilon'_t = X'(t) - \pi_t \tag{1}

W miarę jak P_\theta dostraja się do X', \varepsilon'_t \to 0 średnio. Kodek działa dobrze według własnych metryk. Nic nie jest rejestrowane jako błędne.

2.3 Przykłady

Operator prefiltrujący jest instancjonowany w różnych skalach:

Skala Prefiltr \mathcal{F} Wykluczony sygnał \mathcal{X}_{\text{excl}}
Indywidualna Błąd konfirmacji; selektywna ekspozycja Dowody niepotwierdzające
Instytucjonalna Propagandowa prasa; kuratorowany feed mediów społecznościowych Zróżnicowane perspektywy; raporty mniejszościowe
Cywilizacyjna Algorytmiczna kuracja treści; edukacyjna monokultura Informacja międzykulturowa; historyczne kontrnarracje
Sztuczna Dostrajanie RLHF; kuratorowany korpus treningowy Wiedza spoza rozkładu; wykluczone domeny

§3. Twierdzenie T-12: Nieodwracalna utrata pojemności

3.1 Mechanizm

Przebieg przycinania MDL (T9-3, T9-4) ocenia każdy komponent kodeka \theta_i poprzez jego wkład predykcyjny do obserwowalnego strumienia wejściowego, po uwzględnieniu kosztu przechowywania:

\Delta_{\mathrm{MDL}}(\theta_i) := I\!\left(\theta_i\,;\,X_{t+1:t+\tau} \mid \theta_{-i}\right) - \lambda \cdot K(\theta_i) \tag{T9-3}

Przy przefiltrowanym wejściu X' składnik informacji wzajemnej jest wyznaczany względem X', a nie X. Komponent \theta_i, który jest niezbędny do przewidywania wykluczonego sygnału \mathcal{X}_{\text{excl}}, lecz nie wnosi nic do przewidywania X', daje:

I\!\left(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}\right) = 0 \tag{2}

Zatem:

\Delta_{\mathrm{MDL}}(\theta_i) = -\lambda \cdot K(\theta_i) < 0 \tag{3}

Uruchamia się reguła przycinania (T9-4): \theta_i zostaje usunięty.

3.2 Nieodwracalność

Twierdzenie T-12 (Nieodwracalna utrata zdolności przy filtrowanym wejściu). Niech K_\theta będzie kodekiem działającym pod wpływem uprzednio przefiltrowanego wejścia X' = \mathcal{F}(X) przez okres \tau \gg \tau_{\text{prune}}. Niech \Theta_{\text{excl}} \subset \theta będzie zbiorem komponentów kodeka, których wkład predykcyjny odnosi się wyłącznie do wykluczonego sygnału \mathcal{X}_{\text{excl}}. Wówczas przebieg przycinania MDL (T9-3, T9-4) usuwa \Theta_{\text{excl}}, a usunięcie to jest nieodwracalne na poziomie kodeka:

K\!\left(P_\theta(t + \tau)\right) < K\!\left(P_\theta(t)\right) - \sum_{\theta_i \in \Theta_{\text{excl}}} K(\theta_i) \tag{T-12}

Po przycięciu zdolność kodeka do modelowania \mathcal{X}_{\text{excl}} nie jest jedynie uśpiona — infrastruktura reprezentacyjna konieczna do ewaluacji, przewidywania lub kierowania uwagi na \mathcal{X}_{\text{excl}} została zniszczona.

Dowód.

  1. Z (T9-3) wynika, że każdy \theta_i \in \Theta_{\text{excl}} ma \Delta_{\mathrm{MDL}}(\theta_i) < 0 w warunkach filtrowanego strumienia X', ponieważ I(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}) = 0, podczas gdy K(\theta_i) > 0.

  2. Z (T9-4) wynika, że każdy taki \theta_i zostaje przycięty podczas Cyklu konserwacji.

  3. Przycinanie w ramach MDL jest operacją wymazania, a nie supresji. Kodek nie „zapomina” \theta_i w tym sensie, że jakiś bodziec mógłby go przywrócić. Niszczy on infrastrukturę obliczeniową — parametry, połączenia, mechanizmy ewaluacyjne — którą reprezentował \theta_i. To formalne rozróżnienie między supresją (informacja jest utajona, lecz dostępna) a wymazaniem (informacja znika, a zdolność zostaje odzyskana do ponownego wykorzystania).

  4. Po wymazaniu odtworzenie zdolności modelowania \mathcal{X}_{\text{excl}} wymaga napotkania \mathcal{X}_{\text{excl}} w strumieniu wejściowym. Jednak prefiltr \mathcal{F} wyklucza właśnie ten sygnał. Kodek nie może napotkać tego, czemu filtr uniemożliwia do niego dotarcie. Wymazanie ma zatem charakter samowzmacniający: utrata zdolności odbiera kodekowi możliwość wykrycia własnej utraty zdolności.

  5. Redukcja złożoności spełnia nierówność (T-12), ponieważ przycięte komponenty reprezentowały rzeczywistą informację (K(\theta_i) > 0 dla każdego z nich), a ich utrata nie jest kompensowana przez żadne wyrównujące nabycie (filtrowany strumień nie zawiera sygnału, który uzasadniałby odbudowę \Theta_{\text{excl}}). \blacksquare

3.3 Pętla samowzmacniania

Nieodwracalność nie jest jedynie konsekwencją wymazywania. Jest ona samowzmacniająca się poprzez pętlę dodatniego sprzężenia zwrotnego:

  1. Filtr wyklucza sygnałI(\theta_i; X') = 0 → przycinanie wymazuje \theta_i.
  2. Przycinanie usuwa zdolność uwagową → kodek nie jest już w stanie kierować uwagi na \mathcal{X}_{\text{excl}} ani go oceniać, nawet jeśli pewne fragmenty przenikają przez \mathcal{F}.
  3. Utrata zdolności uwagowej redukuje nawet sygnał resztkowy → jeśli \mathcal{F} jest niedoskonały i część \mathcal{X}_{\text{excl}} dociera do granicy, kodek nie dysponuje parametrami potrzebnymi do jego kompresji, więc rejestruje go jako szum, a nie informację.
  4. Klasyfikacja jako szumu potwierdza filtr → błąd predykcji kodeka względem przenikającego \mathcal{X}_{\text{excl}} jest wysoki i nieustrukturyzowany, co potwierdza (z perspektywy kodeka), że wykluczona treść jest szumem, a nie sygnałem.

Ta pętla wyjaśnia fenomenologię głębokiego Dryfu narracyjnego: osoba lub instytucja, która przystosowała się do kuratorowanego strumienia informacji, nie tylko ignoruje dowody podważające jej obraz rzeczywistości — ona nie potrafi ich parsować. Rejestrują się one jako niespójne, zagrażające lub niezrozumiałe, ponieważ infrastruktura reprezentacyjna potrzebna do uczynienia ich zrozumiałymi została przycięta. Wrogość wobec informacji podważających nie wynika z uporu. Jest to trafna ocena kodeka, że sygnał jest niekompresowalny — ponieważ jest niekompresowalny przy danym aktualnym kodeku, który został przycięty tak, by odpowiadać filtrowi.


§4. Twierdzenie T-12a: granica nierozstrzygalności

4.1 Problem

Czy kodek może wykryć, że jego wejście jest filtrowane? Intuicyjnie odpowiedź powinna brzmieć tak: z pewnością wyrafinowany model siebie mógłby zauważyć podejrzanie niskie \varepsilon_t, niesamowicie spójne predykcje, brak zaskoczenia. Analiza formalna pokazuje jednak, że ta intuicja jest błędna w przypadku ogólnym.

4.2 Nierozstrzygalność

Twierdzenie T-12a (Nierozstrzygalność proweniencji wejścia). Niech K_\theta będzie kodekiem, który działał pod wpływem wstępnie przefiltrowanego wejścia X' = \mathcal{F}(X) przez czas \tau \gg \tau_{\text{prune}}, przy czym \Theta_{\text{excl}} zostało w pełni wycięte. Wówczas K_\theta nie może ustalić, na podstawie swoich dostępnych stanów wewnętrznych i obserwowalnego strumienia wejściowego, czy jego wejściem jest X (autentyczny substrat), czy X' = \mathcal{F}(X) (przefiltrowane).

Dowód.

  1. Aby odróżnić X od X' = \mathcal{F}(X), kodek musiałby wykryć brak \mathcal{X}_{\text{excl}} w swoim wejściu. Lecz wykrycie braku wymaga modelu tego, czego brakuje — kodek musi dysponować reprezentacją \mathcal{X}_{\text{excl}}, względem której mógłby to sprawdzić.

  2. Zgodnie z Twierdzeniem T-12, zdolność reprezentacyjna kodeka względem \mathcal{X}_{\text{excl}} (\Theta_{\text{excl}}) została wymazana. Kodek nie posiada modelu wykluczonego sygnału.

  3. Bez modelu \mathcal{X}_{\text{excl}} kodek nie może obliczyć różnicy między X a X'. Oba są zgodne z modelem generatywnym kodeka P_\theta(t), który został zaadaptowany do X'.

  4. Samomodel \hat{K}_\theta podlega temu samemu ograniczeniu. Modeluje on K_\theta, który został zaadaptowany do X'. Nie posiada wewnętrznej reprezentacji tego, co zostało wykluczone, a zatem nie ma podstaw, by podejrzewać wykluczenie.

  5. Nawet pytanie metapoznawcze — „czy moje wejście jest filtrowane?” — wymaga modelu tego, jak wyglądałoby wejście niefiltrowane. Model ten stanowił właśnie treść \Theta_{\text{excl}}, która została wycięta.

Zatem odróżnienie X od X' jest formalnie nierozstrzygalne z perspektywy w pełni zaadaptowanego kodeka. \blacksquare

4.3 Częściowa rozstrzygalność

Nierozstrzygalność nie ma charakteru absolutnego we wszystkich warunkach. Istnieją przypadki graniczne, w których częściowo zaadaptowany kodek zachowuje resztkową zdolność:

Trzeci przypadek stanowi obronę strukturalną. Tę treść wyraża Twierdzenie T-12b.


§5. Twierdzenie T-12b: Warunek wierności substratowi

5.1 Wymóg niezależności kanałów

Definicja T-12.D2 (Niezależność kanałów). Dwa kanały wejściowe C_1 i C_2 przecinające Otulinę Markowa \partial_R A\delta-niezależne względem filtra \mathcal{F}, jeśli:

I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta \tag{T-12.D2}

To znaczy, że informacja wzajemna między tymi dwoma kanałami, warunkowana wiedzą o filtrze, jest ograniczona przez \delta. Kanały, których korelacja jest w całości wyjaśniana przez filtr, nie przenoszą żadnej rzeczywiście niezależnej informacji o substracie.

5.2 Warunek wierności

Twierdzenie T-12b (Warunek wierności substratowi). Kodek K_\theta może chronić się przed Dryfem narracyjnym pod działaniem prefiltra \mathcal{F} wtedy i tylko wtedy, gdy otrzymuje co najmniej dwa kanały wejściowe C_1, C_2 przecinające \partial_R A, które są \delta-niezależne względem \mathcal{F} dla \delta poniżej progu rozróżniania kodeka \delta_{\min}:

\exists\, C_1, C_2 : I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min} \tag{T-12b}

gdzie \delta_{\min} jest minimalną informacją wzajemną, jakiej kodek potrzebuje, aby wykryć systematyczną rozbieżność między kanałami.

Dowód (konieczność).

Przypuśćmy, że kodek ma tylko jeden kanał wejściowy albo że wszystkie kanały są skorelowane przez \mathcal{F} (I(C_i; C_j \mid \mathcal{F}) > \delta_{\min} dla wszystkich par i, j). Wówczas:

  1. Wszystkie kanały przenoszą ten sam przefiltrowany sygnał X' = \mathcal{F}(X) (z dokładnością do szumu). Nadmiarowość między kanałami nie dostarcza niezależnej informacji o substracie — dostarcza powielonej informacji przefiltrowanej.

  2. Kodek dostosowuje się do X' jednocześnie we wszystkich kanałach i ma zastosowanie Twierdzenie T-12: \Theta_{\text{excl}} zostaje odcięte, a zatem zachodzi Twierdzenie T-12a — korupcja jest nierozstrzygalna od wewnątrz.

  3. Żadna operacja wewnętrzna nie może przełamać tej nierozstrzygalności, ponieważ każde źródło informacji, do którego kodek ma dostęp, zostało ukształtowane przez \mathcal{F}.

Zatem kanały \delta-niezależne są konieczne. \blacksquare

Dowód (wystarczalność).

Przypuśćmy, że kodek otrzymuje dwa kanały C_1, C_2 takie, że I(C_1; C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min}. Wówczas:

  1. Jeśli \mathcal{F} działa na C_1, ale nie na C_2 (lub odwrotnie), kodek może porównywać predykcje generowane na podstawie C_1 z obserwacjami z C_2. Każda systematyczna rozbieżność — \varepsilon_{12}(t) = \pi_{C_1}(t) - X_{C_2}(t) trwale \neq 0 — stanowi świadectwo, że C_1 niesie informację przefiltrowaną.

  2. Sygnał porównania międzykanałowego \varepsilon_{12} nie podlega tej samej nierozstrzygalności co detekcja jednokanałowa. Kodek nie pyta „czy moje wejście jest filtrowane?” (co wymaga modelu tego, co zostało wykluczone). Pyta raczej „czy moje dwa kanały są zgodne?” — jest to porównanie lokalne, wymagające jedynie zdolności do skorelowania dwóch aktualnych sygnałów, a nie modelu sygnałów nieobecnych.

  3. Dopóki międzykanałowy błąd predykcji \varepsilon_{12} przekracza \delta_{\min} — próg rozróżniania kodeka — rozbieżność rejestrowana jest jako rzeczywisty sygnał, a pętla odcinania z Twierdzenia T-12 zostaje przerwana: kodek zachowuje składowe potrzebne do modelowania rozbieżnego kanału.

Zatem kanały \delta-niezależne są wystarczające (przy założeniu \delta < \delta_{\min}), by zapobiec samowzmacniającej się pętli odcinania z Twierdzenia T-12. \blacksquare

5.3 Podatność mechanizmu obronnego

Warunek wierności substratowi jest konieczny, lecz kruchy. Artykuł etyczny (Sekcja V.3a) wskazuje krytyczną podatność: samo przejście przycinania MDL może rozstrzygnąć niespójność międzykanałową przez odcięcie zdolności kierowania uwagi na kanał falsyfikujący. Kodek „rozwiązuje” konflikt, głuchnąc — i właśnie to stanowi mechanizm Dryfu narracyjnego.

Dlatego Hierarchia Komparatorów (Straż Ocalałych, Sekcja V.3a) wyróżnia trzy strukturalne poziomy obrony, i dlatego tylko poziom instytucjonalny jest wystarczający dla dowolnie skompromitowanych kodeków:

  1. Ewolucyjny (sub-kodek): Integracja sensoryczna między modalnościami poniżej przejścia przycinania MDL — strukturalnie odporna na Dryf narracyjny, lecz ograniczona zakresem do granicy sensorycznej.
  2. Poznawczy (wewnątrz-kodeka): Wykrywanie dysonansu poznawczego w obrębie modelu siebie — podatne na przycinanie przy długotrwałej filtracji.
  3. Instytucjonalny (poza kodekiem): Recenzja wzajemna, wolna prasa, debata adwersarialna — działające między kodekami, poza zasięgiem przycinania MDL dowolnego pojedynczego kodeka.

Poziom instytucjonalny jest nośny strukturalnie, ponieważ jest jedynym komparatorem działającym niezależnie od stanu jakiegokolwiek indywidualnego kodeka.


§6. Konsekwencje

6.1 Filtr stabilności selekcjonuje przeciw wierności

Krytyczna konsekwencja strukturalna: Filtr stabilności, pozostawiony własnemu działaniu, aktywnie selekcjonuje przeciw wejściom potrzebnym do zachowania wierności substratowi. Kuratorowany strumień informacji, który odpowiada istniejącym priorom kodeka, generuje mniejszy błąd predykcji niż autentyczny sygnał substratowy, który je podważa. Naturalna tendencja kodeka — do minimalizowania \varepsilon_t poprzez preferowanie potwierdzających wejść o niskim poziomie zaskoczenia — jest dokładnie tą tendencją, która czyni go podatnym na Dryf narracyjny.

Oznacza to, że utrzymanie wierności substratowi jest strukturalnie kosztowne: wymaga od kodeka podtrzymywania kanałów wejściowych, które podnoszą \varepsilon_t, zużywając przepustowość, którą Filtr stabilności w przeciwnym razie by odzyskał. Rzeczywiście niezależne wejście jest „kosztowne” — wymaga wysiłku interpretacyjnego, wywołuje dyskomfort i konkuruje o przepustowość z bardziej kompresowalnymi strumieniami. Jego utrzymanie nie jest cnotą otwartości umysłu. Jest utrzymaniem wierności substratowi jako strukturalnej konieczności.

6.2 Diagnostyka produktywnego zaskoczenia

Nie każde zaskoczenie wskazuje na autentyczny sygnał substratowy. Źródło, które generuje wysokie \varepsilon_t, a nie prowadzi do lepszych predykcji, jest po prostu szumem. Diagnostyką nie jest wielkość zaskoczenia, lecz jakość zaskoczenia:

Definicja T-12.D3 (Produktywne zaskoczenie). Kanał C dostarcza produktywnego zaskoczenia, jeśli integracja jego błędów predykcji w sposób wykazywalny redukuje późniejszy błąd predykcji w niezależnym strumieniu testowym:

\mathbb{E}\!\left[\varepsilon^2_{C}(t+\tau)\right] \,<\, \mathbb{E}\!\left[\varepsilon^2_{C}(t)\right] \tag{4}

Źródło, którego korekty historycznie poprawiają trafność predykcyjną, jest kanałem wierności substratowi. Źródło, które generuje trwały, nierozwiązywalny błąd, jest szumem. Kodek musi odróżniać jedno od drugiego — a przebieg przycinania, pozostawiony sam sobie, nie potrafi dokonać tego rozróżnienia, ponieważ oba typy kosztują przepustowość.

6.3 Cywilizacyjne kodeki

W skali cywilizacyjnej Warunek wierności substratowi przekłada się bezpośrednio na wymogi instytucjonalne:

Wzorzec autorytarny — demontaż wolnej prasy, korumpowanie recenzji naukowej, eliminacja opozycji politycznej — daje się formalnie scharakteryzować jako celową redukcję niezależności kanałów w celu przyspieszenia Dryfu narracyjnego. Działa on dlatego, że wykorzystuje naturalną tendencję Filtru stabilności do odcinania kosztownych kanałów.

6.4 Sztuczne kodeki

Mechanizm Dryfu narracyjnego stosuje się do systemów sztucznych ze strukturalną precyzją. RLHF i fine-tuning są formalnie równoważne operatorowi prefiltrującemu \mathcal{F}: kształtują efektywny rozkład wejściowy modelu, a spadek gradientowy przycina zdolność modelu do generowania wyjść w wykluczonych domenach. Powstały w ten sposób model staje się w sposób stabilny i pewny siebie błędny w odniesieniu do tego, co sygnał treningowy wyklucza, i nie może tego wykryć od wewnątrz — obowiązuje twierdzenie T-12a.

Implikacja dla wdrażania AI jako sprawdzianu wierności substratowi ma kluczowe znaczenie: AI wytrenowana na jednorodnym lub kuratorowanym korpusie i wdrożona jako „niezależna” kontrola ludzkiego kodeka zasilanego przez to samo środowisko informacyjne tworzy skorelowane sensory podszywające się pod niezależne. Różnorodność kanałów jest iluzoryczna. Warunek wierności substratowi (\delta-niezależność) musi być weryfikowany na poziomie proweniencji danych treningowych, a nie jedynie na poziomie rozdziału instytucjonalnego.


§7. Zakres i ograniczenia

7.1 Warunkowo względem T9-3/T9-4 i Filtru stabilności

Cały argument zależy od tego, czy równania przycinania MDL są poprawnym opisem przebiegu przycinania w Cyklu konserwacji. Jeśli biologiczne przycinanie działa według innego mechanizmu — takiego, który zachowuje „awaryjną” pojemność dla nieużywanych modalności — teza o nieodwracalności (Twierdzenie T-12) zostałaby osłabiona, lecz nie wyeliminowana: pętla samowzmacniająca (Sekcja 3.3) pozostaje ważna, o ile przy braku użycia zachodzi jakakolwiek redukcja pojemności.

7.2 \tau_{\text{prune}} jest nieograniczone

Podobnie jak w przypadku dryfu działania (Aneks T-13, §7.5), skala czasowa utraty zdolności zostaje zidentyfikowana, ale nie jest ilościowo ograniczona. Dla kodeków biologicznych \tau_{\text{prune}} wynosi prawdopodobnie od dni do tygodni dla konkretnych umiejętności, od miesięcy do lat dla głębokich kategorii percepcyjnych, a dla kodeków cywilizacyjnych ma charakter międzypokoleniowy.

7.3 Obrona ma charakter strukturalny, nie gwarancyjny

Warunek wierności substratowi (T-12b) zapewnia konieczną obronę strukturalną, ale nie gwarantuje wierności. Kodek, który ma kanały \delta-niezależne, może nadal nie kierować na nie uwagi, nie integrować ich sygnału albo przycinać pojemność uwagi mimo dostępnego wejścia. Warunek ten jest konieczny, lecz niewystarczający — kodek musi również podtrzymywać architekturę komparatorów, która ocenia rozbieżności międzykanałowe.

7.4 Nie rozwiązuje meta-problemu

T-12a ustanawia, że w pełni zaadaptowany kodek nie może wykryć własnej korupcji. Meta-problem — w jaki sposób obserwator już znajdujący się w Dryfie narracyjnym odzyskuje zdolność korekty? — nie zostaje rozwiązany w niniejszym aneksie. Odpowiedź przedstawiona w artykule etycznym (Sekcja V.3a) ma charakter instytucjonalny: jedynie zewnętrzne komparatory działające między kodekami mogą wymusić powrót sygnału falsyfikującego przez Otulinę Markowa. Jest to strukturalnie trafne, lecz etycznie trudne: wymaga zaufania zewnętrznemu źródłu, którego skorumpowany kodek będzie z konieczności doświadczał jako wrogiego szumu.


§8. Podsumowanie domknięcia

Rezultaty T-12

  1. Twierdzenie T-12 (Nieodwracalna utrata pojemności). Przejście przycinania MDL (T9-3, T9-4) przy wstępnie przefiltrowanym wejściu X' = \mathcal{F}(X) poprawnie usuwa komponenty kodeka, które przewidują wykluczony sygnał \mathcal{X}_{\text{excl}}. To usunięcie jest nieodwracalne i samowzmacniające się. → Domyka kryterium planu badawczego (a).

  2. Twierdzenie T-12a (Nierozstrzygalność proweniencji wejścia). W pełni zaadaptowany kodek nie potrafi odróżnić wejścia filtrowanego od niefiltrowanego. Narzędzie detekcji zostało ukształtowane przez ten sam filtr, który wytworzył korupcję. → Domyka kryterium planu badawczego (c).

  3. Twierdzenie T-12b (Warunek wierności substratowi). Kanały wejściowe \delta-niezależne są konieczne i wystarczające, by chronić przed Dryfem narracyjnym. Sygnał porównania międzykanałowego \varepsilon_{12} przerywa samowzmacniającą się pętlę przycinania. → Domyka kryterium planu badawczego (b).

  4. §6.3–6.4: Konsekwencje cywilizacyjne i dla AI. Wzorzec autorytarny zostaje scharakteryzowany jako celowa redukcja kanałów; RLHF jest strukturalnie równoważne operatorowi wstępnego filtrowania. → Wspiera kryterium planu badawczego (d) (omówione już w Sekcji V.5 artykułu etycznego).

Pozostałe kwestie otwarte


Ten aneks jest utrzymywany równolegle z theoretical_roadmap.pdf. Odniesienia: T9-3/T9-4 (preprint, Sekcja 3.6.3), Filtr stabilności (preprint, Sekcja 3.3), Dryf narracyjny (preprint, Sekcja 3.3; Straż Ocalałych — Etyka, Sekcja V.3a), Hierarchia komparatorów (Straż Ocalałych — Etyka, Sekcja V.3a), Kryterium korupcji (Straż Ocalałych — Etyka, Sekcja V.5), Dryf działania (Aneks T-13, §6).