Ordered Patch Theory
Dodatak T-1: Filtar stabilnosti
April 3, 2026 | DOI: 10.5281/zenodo.19300777
Izvorni zadatak T-1: Filtar stabilnosti — puna specifikacija teorije stope i distorzije Problem: Shannonova teorija stope i distorzije zahtijeva: izvor X, reprodukcijsku abecedu i funkciju distorzije d(x, \hat{x}). Preprint se poziva na R_{pred}(D), a da pritom ne specificira ta tri elementa za supstrat OPT-a. Isporuka: Potpuna specifikacija (\mathcal{X}, \hat{\mathcal{X}}, P_X, d) za problem stope i distorzije u OPT-u.
Ova revizija razlikuje višak entropije od statističke složenosti, dokazuje identitet prediktivnog-KL-a na konačnom horizontu, dokazuje opću donju ogradu R_{T,h}(D)\ge E_{T,h}-D te navodi točan kriterij jednakosti za slučaj kada se ta donja ograda postiže. C_{\max} ostaje empirijski parametar, a ne veličina izvedena iz formalizma stope i distorzije.
Status zaključenja: DJELOMIČNO RIJEŠENO. Uspostavljeni su specifikacija četvorke, identitet prediktivnog-KL-a i opća donja ograda R_{T,h}(D) \geq E_{T,h}(\nu) - D, uz točan kriterij jednakosti. Ranija generička tvrdnja o zatvorenom obliku R(D) = C_\mu - D povučena je; ispravan rezultat jest donja ograda. C_{\max} ostaje empirijski parametar, a ne veličina izvedena iz formalizma stope i distorzije.
§0. Razina formulacije
Radna formulacija. Fiksirajmo T,h<\infty. Neka X:=X_{1:T} označava prošli blok, a Y:=X_{T+1:T+h} budući blok unaprijednog pogleda pod fiksnom izračunljivom stacionarnom ergodičkom mjerom \nu\in\mathcal M. Definirajmo prediktivnu informaciju na konačnom horizontu E_{T,h}(\nu):=I(X;Y). Kada postoji granica na beskonačnom horizontu, definirajmo višak entropije E_\nu := I(\overleftarrow X;\overrightarrow X). Ako S označava puno kauzalno stanje \epsilon-stroja, definirajmo statističku složenost C_{\mu,\nu}:=H(S). To su različite veličine. Problem teorije stope i distorzije na konačnom horizontu u ovom dodatku formuliran je u terminima E_{T,h}, a ne C_{\mu,\nu}. Solomonoffova semimjera \xi pojavljuje se samo kao meta-priorno ponderiranje (preprint, jednadžba 1): pojedinačne krivulje R(D) računaju se za svaku mjeru \nu. Rezultati koji zahtijevaju punu mješavinu \xi izloženi su zasebno.
§1. Potpuna specifikacija četvorke
1.1 Izvor X i distribucija P_X
Fiksirajmo izračunljivu stacionarnu ergodičku mjeru \nu \in \mathcal{M} na \{0,1\}^\infty. Izvor je proces (X_t)_{t \ge 1} distribuiran prema \nu. Za ulogu meta-priora, \xi iz jednadžbe (1) preprinta pridružuje svakoj takvoj \nu težinu w_\nu \approx 2^{-K(\nu)}. Pišemo P_X = \nu za fiksni član od \mathcal{M}. Svi rezultati u nastavku vrijede po mjeri \nu; Solomonoffova veza ulazi preko granice dominacije u §4.
1.2 Reprodukcijska abeceda \hat{X}
Za fiksne T,h, definirajmo relaciju prediktivne ekvivalencije konačnog horizonta na prošlim blokovima: x \sim_h x' \iff \nu(Y\in A\mid X=x)=\nu(Y\in A\mid X=x') \quad\text{za sve mjerljive }A\subseteq\{0,1\}^h. Neka je S_h klasa ekvivalencije od X s obzirom na \sim_h. Tada je S_h minimalna dostatna statistika za predviđanje Y iz X na horizontu h.
Puno kauzalno stanje \epsilon-stroja S jest objekt beskonačnog horizonta dobiven prijelazom na polubeskonačne prošlosti i punu budućnost. Ovaj dodatak koristi S_h za izvode na konačnom horizontu, a S zadržava za puni granični slučaj kauzalnog stanja.
Status izračunljivosti. Za općenitu izračunljivu \nu, ovaj dodatak ne tvrdi egzaktivu izračunljivost particije prediktivnih stanja. Ona se tretira kao idealizirani mjerljivi objekt. Egzaktna izračunljivost tvrdi se samo za eksplicitno identificirane potklase, poput procesa s konačnom memorijom.
1.3 Funkcija distorzije d_h(x, z)
Funkcija distorzije jest KL prediktivna divergencija: d_h(x,z):=D_{\mathrm{KL}}\!\big(P_\nu(Y\mid X=x)\,\|\,P_\nu(Y\mid Z=z)\big). Ovdje je Z reprezentacijska varijabla koju proizvodi enkoder p(z\mid x). Kada je Z=S_h, to je egzaktna distorzija prediktivnog stanja; kada je Z ogrubljenje ili stohastički kod, P_\nu(Y\mid Z=z) je inducirani prediktivni zakon.
Potpuni četverac
| Element | Definicija |
|---|---|
| X | (X_t)_{t \ge 1} — stacionarni ergodički proces pod \nu \in \mathcal{M} |
| \hat{X} | S_h — prediktivna stanja konačnog horizonta |
| P_X | \nu — fiksni izračunljivi član od \mathcal{M}; Solomonoffov \xi je meta-prior |
| d_h(x, z) | D_{\mathrm{KL}}( P_\nu(\cdot\|x) \| P_\nu(\cdot\|z) ) — KL prediktivna divergencija preko horizonta h |
§2. Izvod R_{T,h}(D) pod četvorkom
Funkcija stopa-distorzija za četvorku iz §1 glasi:
R_{T,h}(D) = \min_{p(z|x) : \mathbb{E}[d_h(X,Z)] \le D} I(X ; Z)
2.1 KL identitet distorzije
Neka je X:=X_{1:T}, Y:=X_{T+1:T+h}, a Z bilo koja reprezentacija proizvedena enkoderom p(z\mid x). Budući da je Z-X-Y Markovljev lanac, \mathbb E[d_h(X,Z)] = \mathbb E\!\left[D_{\mathrm{KL}}(P(Y\mid X)\|P(Y\mid Z))\right] = H(Y\mid Z)-H(Y\mid X) = I(X;Y\mid Z). Ekvivalentno, \mathbb E[d_h(X,Z)] = I(X;Y)-I(Z;Y)=E_{T,h}(\nu)-I(Z;Y). Stoga je ograničenje distorzije \mathbb E[d_h(X,Z)]\le D ekvivalentno uvjetu I(Z;Y)\ge E_{T,h}(\nu)-D.
2.2 Reformulacija uskog grla informacije
Ograničenje distorzije sužava prostor dopuštenih enkodera na one koji zadovoljavaju \mathbb{E}[d_h(X,Z)] \le D. To točno odgovara postavljanju donje granice na I(Z;Y), čime se dobiva problem uskog grla informacije s ograničenjem. Budući da je ostvarivo područje \{(I(Z;Y), I(X;Z))\} konveksno prema standardnim argumentima vremenskog dijeljenja, vrijedi jaka dualnost. To omogućuje egzaktnu reformulaciju pomoću Lagrangijana uskog grla informacije (Tishby, Pereira & Bialek 1999 [28]): \mathcal{L}[p(z|x)] = I(X ; Z) - \beta \cdot I(Z ; Y) pri čemu je Lagrangeov multiplikator \beta određen s D. IB Lagrangijan ocrtava Paretoovu frontu između stope kompresije i prediktivne vjernosti.
2.3 Glavni teorem: opća donja granica i kriterij jednakosti
Uspostavljamo granicu za funkciju stopa–distorzija:
Propozicija (opća donja granica i kriterij
jednakosti).
Za bilo koji enkoder p(z\mid x), neka
D:=\mathbb E[d_h(X,Z)].
Tada
I(X;Z)=E_{T,h}(\nu)-D+I(X;Z\mid Y).
Posljedično,
R_{T,h}(D)\ge E_{T,h}(\nu)-D.
Za kompaktne konačne reprodukcijske alfabete, gdje kontinuitet
jamči da je infimum po enkoderima dosegnut, jednakost pri zadanoj
distorziji D vrijedi ako i samo ako
postoji enkoder koji postiže tu distorziju uz
I(X;Z\mid Y)=0.
Za determinističke enkodere Z=g(X), to je ekvivalentno s
H(Z\mid Y)=0.
Pri nultoj distorziji, minimalna dostatna statistika S_h postiže R_{T,h}(0)=I(X;S_h)=H(S_h). Primijetimo da ta stopa nulte distorzije H(S_h) općenito leži strogo iznad donje granice E_{T,h}. Razlika je nenegativni jaz H(S_h) - E_{T,h} = H(S_h|Y). Taj jaz fizički predstavlja strukturnu ‘pohranjenu informaciju’ u prošlosti koju sam budući prozor ne uspijeva rekonstruirati. Jednakost pri nultoj distorziji (H(S_h|Y)=0) vrlo je degeneriran slučaj koji je generički netočan za složene procese.
U punom limitu kauzalnih stanja, R(0)=C_{\mu,\nu}=H(S). To je jednako E_\nu samo u posebnim slučajevima; općenito vrijedi E_\nu < C_{\mu,\nu}.
2.4 Ponašanje za grublje reprodukcijske alfabete
Za svako determinističko ogrubljivanje Z=g(S_h), I(X;Z)=I(Z;Y)+I(X;Z\mid Y)=E_{T,h}(\nu)-D+I(X;Z\mid Y)\ge E_{T,h}(\nu)-D. Nenegativni član slobodnog prostora I(X;Z\mid Y) iščezava samo kada se ogrubljena reprezentacija može rekonstruirati iz budućeg prozora Y. Stoga grublji alfabeti općenito proizvode krivulje stopa-distorzija strogo iznad pravca E_{T,h}-D. Taj je pravac univerzalna donja granica, a ne generički ostvarena ovojnica. Svaki praktično izračunljiv kodek koristi aproksimaciju kauzalnih stanja s konačnom memorijom i stoga ima krivulju iznad te granice.
2.5 Granične evaluacije
| Granica | Vrijednost | Tumačenje |
|---|---|---|
| D = 0 | R_{T,h}(0) = I(X; S_h) | Egzaktna kompresija prediktivnog stanja; očuvana je maksimalna količina informacija |
| D = E_{T,h} | R_{T,h}(E_{T,h}) = 0 | Trivijalna reprezentacija; odbačene su sve prediktivne informacije |
| D = D_{\min} | R_{T,h}(D_{\min}) \ge E_{T,h}(\nu) - D_{\min} | Minimalna donja granica za održivog promatrača; prag Filtra stabilnosti |
(Napomena: U granici beskonačnog horizonta, točka nulte stope nalazi se pri distorziji E_\nu, a ne pri C_{\mu,\nu})
§3. C_{\max} — Karakterizacija i granice
3.1 Lema konvergencije na beskonačnom horizontu
Glavni teorem (§2.3) uspostavlja donju granicu R_{T,h}(D) \ge E_{T,h}(\nu) - D za konačne (T, h). Sada pokazujemo da se to proširuje na postavku beskonačnog horizonta.
Lema (proširenje na beskonačni horizont). Neka je \nu stacionarna ergodička mjera na \{0,1\}^\infty. Tada vrijedi:
- E_{T,h}(\nu) = I(X_{1:T}\,;\,X_{T+1:T+h}) je neopadajuća u odnosu i na T i na h (prema nejednakosti obrade podataka: uvjetovanje na duljim blokovima ne može smanjiti uzajamnu informaciju između prošlosti i budućnosti pod stacionarnošću).
- Granica E_\nu := \lim_{T,h \to \infty} E_{T,h}(\nu) postoji (moguće i +\infty) po monotonoj konvergenciji.
- Za svaki fiksni D \ge 0, niz R_{T,h}(D) je neopadajući u T (dulje prošlosti ne mogu smanjiti optimalnu stopu kompresije) i neopadajući u h. Skica dokaza monotonosti u h: Funkcija distorzije rastavlja se kao d_{h+1}(x, z) = D_{\mathrm{KL}}\!\left(P_\nu(\cdot \mid x) \,\|\, P_z(\cdot \mid z)\right) preko h+1 budućih koraka, što se pravilom lanca može zapisati kao d_h(x,z) + D_{\mathrm{KL}}\!\left(P_\nu(X_{T+h+1} \mid x, X_{T+1:T+h}) \,\|\, P_z(X_{T+h+1} \mid z, X_{T+1:T+h})\right). Budući da je drugi član nenegativan, vrijedi d_{h+1} \geq d_h točkasto. Stoga je skup ograničenja \{P(z|x) : E[d_{h+1}] \leq D\} \subseteq \{P(z|x) : E[d_h] \leq D\}, a minimizacija nad manjim dopuštenim skupom ne može smanjiti stopu: R_{T,h+1}(D) \geq R_{T,h}(D).
- Prema tome, R_\nu(D) := \lim_{T,h \to \infty} R_{T,h}(D) postoji.
Budući da R_{T,h}(D) \ge E_{T,h}(\nu) - D vrijedi u svakoj konačnoj fazi, a obje strane konvergiraju monotono, granica se prenosi na limes:
R_\nu(D) \ge E_\nu - D
To je donja granica na beskonačnom horizontu na koju se pozivaju Propozicije T-1a i T-1c u nastavku. Napomena: Za procese s E_\nu = +\infty (npr. de Bruijnove cikluse visokog reda kada k \to \infty), granica je trivijalno zadovoljena; takvi su procesi isključeni iz skupa kompatibilnog s promatračem O_{C_{\max},D_{\min}} za svaki konačni C_{\max}.
3.2 Particija od M pomoću Filtra stabilnosti — Propozicija T-1a
Propozicija T-1a (netrivijalna particija).
Fiksirajmo empirijske C_{\max}>0,
\Delta t>0 i D_{\min}\ge0. Definirajmo
O_{C_{\max},D_{\min}}
:=
\{\nu\in\mathcal M: R_\nu(D_{\min})\le C_{\max}\Delta t\}.
Tada su i O_{C_{\max},D_{\min}}
i njegov komplement neprazni.
Dokaz. Konstantni proces pripada skupu O_{C_{\max},D_{\min}} jer ima E_\nu=0 i R_\nu(D)=0.
Za komplement odaberimo binarni proces de Bruijnova ciklusa reda k: stacionarni ergodički binarni proces
perioda 2^k s uniformnom fazom, u kojem
se svaka riječ duljine k pojavljuje
točno jednom po ciklusu. Za taj proces vrijedi
E_\nu=C_{\mu,\nu}=k.
Stoga
R_\nu(D_{\min})\ge k-D_{\min}.
Odabirom k>C_{\max}\Delta t +
D_{\min} dobiva se R_\nu(D_{\min})>C_{\max}\Delta t, pa \nu\notin O_{C_{\max},D_{\min}}. \square
3.3 Definicija/karakterizacija C_{\max} — T-1b
Definicija T-1b (empirijski parametar
propusnosti).
C_{\max} uzima se kao empirijski
parametar propusnosti svjesnog pristupa, izvan formalizma stope i
distorzije. Za zadani C_{\max} definira
se s promatračem kompatibilna klasa
O_{C_{\max},D_{\min}}
:=
\{\nu\in\mathcal M: R_\nu(D_{\min})\le C_{\max}\Delta t\}.
Ako se želi sažeti zasebno specificirana referentna klasa \mathcal{O}_{ref}, definira se
C^{ref}_{max}:=\frac{1}{\Delta
t}\sup_{\nu\in\mathcal{O}_{ref}}R_\nu(D_{\min}).
To je sažetna statistika odabrane klase, a ne definicija same
klase.
3.4 Barijera ne-emergencije — skica dokaza T-1c
Skica dokaza T-1c (nema konačne univerzalne granice samo iz
\xi).
Solomonoffova univerzalna semimjera \xi
pridružuje pozitivnu apriornu težinu svakoj izračunljivoj mjeri \nu\in\mathcal M. Klasa \mathcal M sadrži stacionarne ergodičke
binarne procese s proizvoljno velikom suvišnom entropijom E_\nu (na primjer, gore navedenu obitelj de
Bruijnovih nizova). Budući da
R_\nu(D_{\min})\ge E_\nu-D_{\min},
ne postoji konačna gornja granica na R_\nu(D_{\min}) koja bi vrijedila na cijelom
nosaču i koja bi se mogla izvesti samo iz \xi. Svaki konačni C_{\max} stoga zahtijeva dodatni empirijski
unos ili ograničenje klase povrh golog Solomonoffova apriora. \square
§4. Veza sa Solomonoffovim meta-priorom
Četvorka iz §1 i derivacija R(D) iz §2 formulirane su po mjeri \nu. Solomonoffova veza — način na koji meta-prior \xi ponderira tokove kompatibilne s promatračem — strukturna je korespondencija, a ne derivacija.
Za svaki \nu \in O_{C_{\max},D_{\min}} kompatibilan s promatračem, ravnoteža stope i distorzije osigurava da je komprimirani tok z_{0:T} reprezentacija odabrana Filtrom stabilnosti. Solomonoffov prior \xi toj mjeri \nu pridružuje težinu w_\nu \approx 2^{-K(\nu)}: jednostavniji (niži K) procesi kompatibilni s promatračem eksponencijalno su vjerojatniji pod \xi. To je formalni izraz argumenta parsimonije (Dodatak T-4): Filtar stabilnosti, djelujući na \xi, odabire najjednostavniji kodek koji se uklapa unutar propusnosti.
Granica dominacije iz T-4b primjenjuje se izravno: za svaku izračunljivu fizikalnu mjeru \nu s K(\nu) < \infty:
-\log \xi(y_{1:T}) \le -\log \nu(y_{1:T}) + K(\nu)
To osigurava da OPT meta-prior \xi nikada ne dodjeljuje manju vjerojatnost tokovima kompatibilnima s promatračem nego bilo koji fiksni izračunljivi model fizike, do na vlastitu duljinu opisa modela K(\nu).
§5. Iskustveni bit-kvant h^\ast (pregled E-1)
Zadan empirijski odabir C_{\max} i empirijski prozor svjesnog ažuriranja \Delta t, definirajmo h^*:=C_{\max}\Delta t. Za C_{\max}\approx 10 bitova/s i \Delta t\in[50,80] ms, h^*\approx 0.5\text{–}0.8 bitova po svjesnom trenutku.
Svaki stacionarni ergodički proces \nu \in \mathcal{M} koji zadovoljava E_{T,h}(\nu) - D_{\min} > h^\ast legitimno će pokrenuti Narativni raspad. Razlog je to što R_{T,h}(D_{\min}) \ge E_{T,h} - D_{\min} > h^\ast = C_{\max} \Delta t, čime se eksplicitno krši kriterij kompatibilnosti. Međutim, to je dostatan uvjet za kolaps, a ne strogo nužan: budući da je donja ograda rijetko tijesna (R_{T,h} > E_{T,h} - D_{\min} generički prema §2.4), procesi mogu proći kroz Narativni raspad čak i kada je E_{T,h} - D_{\min} \le h^\ast. To daje kvantitativno predviđanje za E-1; osjetljivost na izbor \Delta t \in [40, 300] ms razmatra se u dodatku za E-1.
§6. Sažetak zaključka
T-1 isporuke — revidirani status
- Četvorka je specificirana u prediktivnom okviru s konačnim horizontom.
- Prediktivni-KL identitet ispravno je izveden.
- Generički teorem R(D)=C_\mu-D zamijenjen je ispravnom donjom granicom R_{T,h}(D)\ge E_{T,h}-D zajedno s točnim kriterijem jednakosti I(X;Z\mid Y)=0.
- Kodiranje s nultom distorzijom karakterizirano je minimalnom dovoljnom statistikom S_h, a u punom limitu kauzalnog stanja vrijedi R(0)=C_{\mu,\nu}.
- C_{\max} tretira se kao empirijski, a ne kao interno izveden.
- h^*=C_{\max}\Delta t jest empirijska parametrizacija, a ne teorem iz §2.
Ovaj se dodatak održava kao dio repozitorija projekta OPT uz theoretical_roadmap.pdf.