Teorija uređenog patcha
Appendix T-1: Filter stabilnosti
April 3, 2026 | DOI: 10.5281/zenodo.19300777
Originalni zadatak T-1: Filter stabilnosti — puna specifikacija teorije odnosa stopa-distorzija Problem: Šenonova teorija odnosa stopa-distorzija zahteva: izvor X, alfabet reprodukcije i funkciju distorzije d(x, \hat{x}). Preprint se poziva na R_{pred}(D), a da pritom ne specificira ova tri elementa za supstrat OPT-a. Isporuka: Potpuna specifikacija (\mathcal{X}, \hat{\mathcal{X}}, P_X, d) za OPT-ov problem odnosa stopa-distorzija.
Ova revizija razlikuje višak entropije od statističke kompleksnosti, dokazuje identitet prediktivnog-KL pri konačnom horizontu, dokazuje opštu donju granicu R_{T,h}(D)\ge E_{T,h}-D, i navodi tačan kriterijum jednakosti za slučaj kada se ta donja granica dostiže. C_{\max} ostaje empirijski parametar, a ne veličina izvedena iz formalizma odnosa stopa-distorzija.
Status zatvaranja: DELIMIČNO RAZREŠENO. Specifikacija četvorke, identitet prediktivnog-KL i opšta donja granica R_{T,h}(D) \geq E_{T,h}(\nu) - D su uspostavljeni, uz tačan kriterijum jednakosti. Ranija generička tvrdnja o zatvorenoj formi R(D) = C_\mu - D je povučena; ispravan rezultat je donja granica. C_{\max} ostaje empirijski parametar, a ne veličina izvedena iz formalizma odnosa stopa-distorzija.
§0. Nivo formulacije
Radna formulacija. Fiksirajmo T,h<\infty. Neka X:=X_{1:T} označava blok prošlosti, a Y:=X_{T+1:T+h} blok budućeg predviđanja pri fiksiranoj izračunljivoj stacionarnoj ergodičkoj meri \nu\in\mathcal M. Definišimo prediktivnu informaciju na konačnom horizontu E_{T,h}(\nu):=I(X;Y). Kada postoji granica za beskonačni horizont, definišimo višak entropije E_\nu := I(\overleftarrow X;\overrightarrow X). Ako S označava puno kauzalno stanje \epsilon-mašine, definišimo statističku kompleksnost C_{\mu,\nu}:=H(S). To su različite veličine. Problem stope-distorzije na konačnom horizontu u ovom dodatku formulisan je u terminima E_{T,h}, a ne C_{\mu,\nu}. Solomonovljeva univerzalna semimera \xi ulazi samo kao meta-priorno ponderisanje (preprint, jednačina 1): pojedinačne krive R(D) računaju se za svaku meru \nu. Rezultati koji zahtevaju punu mešavinu \xi izloženi su odvojeno.
§1. Potpuna specifikacija četvorke
1.1 Izvor X i distribucija P_X
Fiksirajmo izračunljivu stacionarnu ergodičku meru \nu \in \mathcal{M} na \{0,1\}^\infty. Izvor je proces (X_t)_{t \ge 1} distribuiran prema \nu. Za ulogu meta-priora, \xi iz jednačine (1) preprinta dodeljuje težinu svakoj takvoj \nu kao w_\nu \approx 2^{-K(\nu)}. Pišemo P_X = \nu za fiksirani član od \mathcal{M}. Svi rezultati u nastavku važe po meri \nu; Solomonovljeva veza ulazi kroz granicu dominacije u §4.
1.2 Reprodukcioni alfabet \hat{X}
Za fiksirane T,h, definišemo relaciju prediktivne ekvivalencije na blokovima prošlosti sa konačnim horizontom: x \sim_h x' \iff \nu(Y\in A\mid X=x)=\nu(Y\in A\mid X=x') \quad\text{za sve merljive }A\subseteq\{0,1\}^h. Neka je S_h klasa ekvivalencije od X u odnosu na \sim_h. Tada je S_h minimalna dovoljna statistika za predviđanje Y na osnovu X pri horizontu h.
Puno kauzalno stanje \epsilon-mašine, S, jeste objekat beskonačnog horizonta koji se dobija prelaskom na polubeskonačne prošlosti i punu budućnost. Ovaj dodatak koristi S_h za izvođenja na konačnom horizontu, a S zadržava za puni granični slučaj kauzalnog stanja.
Status izračunljivosti. Za opštu izračunljivu \nu, ovaj dodatak ne tvrdi egzaktну izračunljivost particije prediktivnih stanja. Ona se tretira kao idealizovani merljivi objekat. Egzaktna izračunljivost tvrdi se samo za eksplicitno identifikovane potklase, kao što su procesi sa konačnom memorijom.
1.3 Funkcija distorzije d_h(x, z)
Funkcija distorzije je KL prediktivna divergencija: d_h(x,z):=D_{\mathrm{KL}}\!\big(P_\nu(Y\mid X=x)\,\|\,P_\nu(Y\mid Z=z)\big). Ovde je Z reprezentaciona promenljiva koju proizvodi enkoder p(z\mid x). Kada je Z=S_h, to je egzaktna distorzija prediktivnog stanja; kada je Z grubljenje ili stohastički kod, P_\nu(Y\mid Z=z) je indukovani prediktivni zakon.
Potpuna četvorka
| Element | Definicija |
|---|---|
| X | (X_t)_{t \ge 1} — stacionarni ergodički proces pod \nu \in \mathcal{M} |
| \hat{X} | S_h — prediktivna stanja konačnog horizonta |
| P_X | \nu — fiksni izračunljivi član od \mathcal{M}; Solomonovljeva \xi je meta-prior |
| d_h(x, z) | D_{\mathrm{KL}}( P_\nu(\cdot\|x) \| P_\nu(\cdot\|z) ) — KL prediktivna divergencija preko horizonta h |
§2. Izvođenje R_{T,h}(D) pod četvorkom
Funkcija odnosa stopa-distorzija za četvorku iz §1 glasi:
R_{T,h}(D) = \min_{p(z|x) : \mathbb{E}[d_h(X,Z)] \le D} I(X ; Z)
2.1 KL identitet distorzije
Neka je X:=X_{1:T}, Y:=X_{T+1:T+h}, i neka je Z bilo koja reprezentacija proizvedena enkoderom p(z\mid x). Pošto je Z-X-Y Markovljev lanac, \mathbb E[d_h(X,Z)] = \mathbb E\!\left[D_{\mathrm{KL}}(P(Y\mid X)\|P(Y\mid Z))\right] = H(Y\mid Z)-H(Y\mid X) = I(X;Y\mid Z). Ekvivalentno, \mathbb E[d_h(X,Z)] = I(X;Y)-I(Z;Y)=E_{T,h}(\nu)-I(Z;Y). Prema tome, ograničenje distorzije \mathbb E[d_h(X,Z)]\le D ekvivalentno je sa I(Z;Y)\ge E_{T,h}(\nu)-D.
2.2 Reformulacija informacionog uskog grla
Ograničenje distorzije sužava prostor dozvoljenih enkodera na one koji zadovoljavaju \mathbb{E}[d_h(X,Z)] \le D. To tačno odgovara postavljanju donje granice na I(Z;Y), čime se dobija problem informacionog uskog grla sa ograničenjem. Pošto je dostižni region \{(I(Z;Y), I(X;Z))\} konveksan pod standardnim argumentima vremenskog deljenja, važi jaka dualnost. To omogućava egzaktnu reformulaciju pomoću Lagranžijana informacionog uskog grla (Tishby, Pereira & Bialek 1999 [28]): \mathcal{L}[p(z|x)] = I(X ; Z) - \beta \cdot I(Z ; Y) gde je Lagranžov multiplikator \beta određen sa D. IB Lagranžijan prati Paretoovu granicu između stope kompresije i prediktivne vernosti.
2.3 Glavna teorema: opšta donja granica i kriterijum jednakosti
Uspostavljamo ograničenje za funkciju stopa-distorzija:
Propozicija (opšta donja granica i kriterijum
jednakosti).
Za svaki enkoder p(z\mid x), neka je
D:=\mathbb E[d_h(X,Z)].
Tada važi
I(X;Z)=E_{T,h}(\nu)-D+I(X;Z\mid Y).
Sledstveno,
R_{T,h}(D)\ge E_{T,h}(\nu)-D.
Za kompaktne konačne reprodukcione alfabete, gde kontinuitet
garantuje da se infimum nad enkoderima dostiže, jednakost pri datoj
distorziji D važi ako i samo ako
postoji enkoder koji postiže tu distorziju sa
I(X;Z\mid Y)=0.
Za determinističke enkodere Z=g(X), ovo je ekvivalentno sa
H(Z\mid Y)=0.
Pri nultoj distorziji, minimalna dovoljna statistika S_h postiže R_{T,h}(0)=I(X;S_h)=H(S_h). Treba primetiti da ova stopa nulte distorzije H(S_h) u opštem slučaju leži strogo iznad donje granice E_{T,h}. Razlika je nenegativni jaz H(S_h) - E_{T,h} = H(S_h|Y). Taj jaz fizički predstavlja strukturnu „uskladištenu informaciju“ u prošlosti koju sam budući prozor ne uspeva da rekonstruiše. Jednakost pri nultoj distorziji (H(S_h|Y)=0) jeste visoko degenerisan slučaj koji je generički netačan za složene procese.
U punoj granici kauzalnih stanja, R(0)=C_{\mu,\nu}=H(S). Ovo je jednako E_\nu samo u posebnim slučajevima; uopšteno važi E_\nu < C_{\mu,\nu}.
2.4 Ponašanje za grublje reprodukcione alfabete
Za svako determinističko ogrubljavanje Z=g(S_h), I(X;Z)=I(Z;Y)+I(X;Z\mid Y)=E_{T,h}(\nu)-D+I(X;Z\mid Y)\ge E_{T,h}(\nu)-D. Nenegativni član slobode I(X;Z\mid Y) iščezava samo kada se ogrubljena reprezentacija može rekonstruisati iz budućeg prozora Y. Otuda grublji alfabeti uopšteno proizvode krive stopa-distorzija koje leže strogo iznad prave E_{T,h}-D. Ta prava je univerzalna donja granica, a ne generički ostvariva omotačnica. Svaki praktično izračunljiv кодек koristi aproksimaciju kauzalnih stanja sa konačnom memorijom i stoga ima krivu iznad ove granice.
2.5 Granične evaluacije
| Granica | Vrednost | Tumačenje |
|---|---|---|
| D = 0 | R_{T,h}(0) = I(X; S_h) | Egzaktna kompresija prediktivnog stanja; očuvana je maksimalna količina informacija |
| D = E_{T,h} | R_{T,h}(E_{T,h}) = 0 | Trivijalna reprezentacija; sve prediktivne informacije su odbačene |
| D = D_{\min} | R_{T,h}(D_{\min}) \ge E_{T,h}(\nu) - D_{\min} | Minimalna donja granica za održivog posmatrača; prag Filtera stabilnosti |
(Napomena: U granici beskonačnog horizonta, tačka nulte stope nalazi se pri distorziji E_\nu, a ne pri C_{\mu,\nu})
§3. C_{\max} — Karakterizacija i barijere
3.1 Lema konvergencije na beskonačnom horizontu
Glavna teorema (§2.3) uspostavlja donju granicu R_{T,h}(D) \ge E_{T,h}(\nu) - D za konačne (T, h). Sada pokazujemo da se ovo proširuje na postavku beskonačnog horizonta.
Lema (proširenje na beskonačni horizont). Neka je \nu stacionarna ergodička mera na \{0,1\}^\infty. Tada:
- E_{T,h}(\nu) = I(X_{1:T}\,;\,X_{T+1:T+h}) je neopadajuća i u T i u h (po nejednakosti obrade podataka: uslovljavanje na dužim blokovima ne može smanjiti uzajamnu informaciju između prošlosti i budućnosti pod stacionarnošću).
- Granica E_\nu := \lim_{T,h \to \infty} E_{T,h}(\nu) postoji (moguće +\infty) po monotonoj konvergenciji.
- Za svako fiksno D \ge 0, niz R_{T,h}(D) je neopadajući u T (duže prošlosti ne mogu smanjiti optimalnu stopu kompresije) i neopadajući u h. Skica dokaza za monotonost u h: Funkcija distorzije se razlaže kao d_{h+1}(x, z) = D_{\mathrm{KL}}\!\left(P_\nu(\cdot \mid x) \,\|\, P_z(\cdot \mid z)\right) preko h+1 budućih koraka, što se pravilom lanca može zapisati kao d_h(x,z) + D_{\mathrm{KL}}\!\left(P_\nu(X_{T+h+1} \mid x, X_{T+1:T+h}) \,\|\, P_z(X_{T+h+1} \mid z, X_{T+1:T+h})\right). Pošto je drugi član nenegativan, sledi da je d_{h+1} \geq d_h tačkasto. Prema tome, skup ograničenja \{P(z|x) : E[d_{h+1}] \leq D\} \subseteq \{P(z|x) : E[d_h] \leq D\}, a minimizacija preko manjeg dopustivog skupa ne može smanjiti stopu: R_{T,h+1}(D) \geq R_{T,h}(D).
- Dakle, R_\nu(D) := \lim_{T,h \to \infty} R_{T,h}(D) postoji.
Pošto R_{T,h}(D) \ge E_{T,h}(\nu) - D važi na svakom konačnom stupnju, a obe strane konvergiraju monotono, granica se prenosi na limes:
R_\nu(D) \ge E_\nu - D
Ovo je donja granica na beskonačnom horizontu na koju se pozivaju Propozicije T-1a i T-1c u nastavku. Napomena: Za procese sa E_\nu = +\infty (npr. de Bruijnovim ciklusima visokog reda kada k \to \infty), granica je trivijalno zadovoljena; takvi procesi su isključeni iz skupa kompatibilnog sa posmatračem O_{C_{\max},D_{\min}} za svako konačno C_{\max}.
3.2 Particija skupa M pomoću Filtera stabilnosti — Propozicija T-1a
Propozicija T-1a (netrivijalna particija).
Fiksirajmo empirijske C_{\max}>0,
\Delta t>0 i D_{\min}\ge0. Definišimo
O_{C_{\max},D_{\min}}
:=
\{\nu\in\mathcal M: R_\nu(D_{\min})\le C_{\max}\Delta t\}.
Tada su i O_{C_{\max},D_{\min}}
i njegov komplement neprazni.
Dokaz. Konstantni proces pripada skupu O_{C_{\max},D_{\min}} jer za njega važi E_\nu=0 i R_\nu(D)=0.
Za komplement, izaberimo binarni de Bruijnov ciklički proces reda k: stacionaran ergodički binarni proces
perioda 2^k sa uniformnom fazom, u
kojem se svaka reč dužine k pojavljuje
tačno jednom po ciklusu. Za ovaj proces,
E_\nu=C_{\mu,\nu}=k.
Otuda
R_\nu(D_{\min})\ge k-D_{\min}.
Izborom k>C_{\max}\Delta t +
D_{\min} dobijamo R_\nu(D_{\min})>C_{\max}\Delta t, pa \nu\notin O_{C_{\max},D_{\min}}. \square
3.3 Definicija/karakterizacija C_{\max} — T-1b
Definicija T-1b (empirijski parametar propusnog
opsega).
C_{\max} se uzima kao empirijski
parametar propusnog opsega svesnog pristupa, spoljašnji u odnosu na
formalizam stope-distorzije. Za dato C_{\max}, definiše se klasa kompatibilna sa
posmatračem
O_{C_{\max},D_{\min}}
:=
\{\nu\in\mathcal M: R_\nu(D_{\min})\le C_{\max}\Delta t\}.
Ako se želi sažeti zasebno specificirana referentna klasa \mathcal{O}_{ref}, definiše se
C^{ref}_{max}:=\frac{1}{\Delta
t}\sup_{\nu\in\mathcal{O}_{ref}}R_\nu(D_{\min}).
Ovo je sumarna statistika izabrane klase, a ne definicija same
klase.
3.4 Barijera ne-emergencije — skica dokaza T-1c
Skica dokaza T-1c (nema konačne univerzalne granice samo iz
\xi).
Solomonovljeva univerzalna semimera \xi
dodeljuje pozitivnu apriornu težinu svakoj izračunljivoj meri \nu\in\mathcal M. Klasa \mathcal M sadrži stacionarne ergodičke
binarne procese sa proizvoljno velikom suvišnom entropijom E_\nu (na primer, gore navedenu de Bruijnovu
familiju). Pošto važi
R_\nu(D_{\min})\ge E_\nu-D_{\min},
ne postoji konačna gornja granica na celokupnom nosaču za R_\nu(D_{\min}) koja bi se mogla izvesti samo
iz \xi. Prema tome, svaki konačni C_{\max} zahteva dodatni empirijski unos ili
ulaz koji ograničava klasu, povrh golog Solomonovljevog priora. \square
§4. Veza sa Solomonovljevim meta-priorom
Četvorka iz §1 i izvođenje R(D) iz §2 formulisani su po meri \nu. Solomonovljeva veza — način na koji meta-prior \xi dodeljuje težine sa posmatračem kompatibilnim tokovima — predstavlja strukturnu korespondenciju, a ne izvođenje.
Za svaku sa posmatračem kompatibilnu \nu \in O_{C_{\max},D_{\min}}, ravnoteža stope i distorzije obezbeđuje da je kompresovani tok z_{0:T} reprezentacija koju bira Filter stabilnosti. Solomonovljev prior \xi dodeljuje ovoj \nu težinu w_\nu \approx 2^{-K(\nu)}: jednostavniji (niži K) sa posmatračem kompatibilni procesi eksponencijalno su verovatniji pod \xi. To je formalni izraz argumenta parsimonije (Dodatak T-4): Filter stabilnosti, delujući nad \xi, bira najjednostavniji kodek koji se uklapa u propusni opseg.
Granica dominacije iz T-4b primenjuje se neposredno: za svaku izračunljivu fizikalnu meru \nu sa K(\nu) < \infty:
-\log \xi(y_{1:T}) \le -\log \nu(y_{1:T}) + K(\nu)
Time se obezbeđuje da OPT meta-prior \xi nikada ne dodeljuje manju verovatnoću sa posmatračem kompatibilnim tokovima nego bilo koji fiksni izračunljivi model fizike, do na sopstvenu dužinu opisa modela K(\nu).
§5. Iskustveni bit-kvant h^\ast (pregled E-1)
Za empirijski izbor C_{\max} i empirijski prozor svesnog ažuriranja \Delta t, definišimo h^*:=C_{\max}\Delta t. Za C_{\max}\approx 10 bita/s i \Delta t\in[50,80] ms, h^*\approx 0.5\text{–}0.8 bita po svesnom trenutku.
Svaki stacionarni ergodički proces \nu \in \mathcal{M} koji zadovoljava E_{T,h}(\nu) - D_{\min} > h^\ast zakonito će aktivirati Narativni raspad. Razlog je to što R_{T,h}(D_{\min}) \ge E_{T,h} - D_{\min} > h^\ast = C_{\max} \Delta t, čime se eksplicitno narušava kriterijum kompatibilnosti. Međutim, ovo je dovoljan uslov za kolaps, a ne strogo nužan: pošto je donja granica retko zategnuta (R_{T,h} > E_{T,h} - D_{\min} generički prema §2.4), procesi mogu ući u Narativni raspad čak i kada E_{T,h} - D_{\min} \le h^\ast. Ovo daje kvantitativno predviđanje za E-1; osetljivost na izbor \Delta t \in [40, 300] ms razmatra se u dodatku za E-1.
§6. Sažetak zatvaranja
T-1 isporuke — revidirani status
- Četvorka je specificirana u prediktivnom okruženju sa konačnim horizontom.
- Identitet prediktivnog KL-a izveden je korektno.
- Generička teorema R(D)=C_\mu-D zamenjena je ispravnom donjom granicom R_{T,h}(D)\ge E_{T,h}-D zajedno sa tačnim kriterijumom jednakosti I(X;Z\mid Y)=0.
- Kodiranje bez distorzije karakterisano je minimalnom dovoljnom statistikom S_h, a u punom limitu kauzalnog stanja važi R(0)=C_{\mu,\nu}.
- C_{\max} se tretira kao empirijski, a ne kao interno izveden.
- h^*=C_{\max}\Delta t je empirijska parametrizacija, a ne teorema iz §2.
Ovaj dodatak se održava kao deo OPT projektnog repozitorijuma, uporedo sa theoretical_roadmap.pdf.