Kenningin um raðaðan patch (OPT)
Viðauki T-1: Stöðugleikasía
3. apríl 2026 | DOI: 10.5281/zenodo.19300777
Upprunalegt verkefni T-1: Stöðugleikasía — full forskrift fyrir hraða-brenglunarfræði Vandamál: Hraða-brenglunarfræði Shannons krefst: uppsprettu X, endurgerðarstafrófs og brenglunarfalls d(x, \hat{x}). Forprentið vísar til R_{pred}(D) án þess að skilgreina þessa þrjá þætti fyrir hvarfefni OPT. Afhending: Fullkomin forskrift (\mathcal{X}, \hat{\mathcal{X}}, P_X, d) fyrir hraða-brenglunarverkefni OPT.
Í þessari endurskoðun er gerður skýr greinarmunur á umframóreiðu og tölfræðilegum margbreytileika, sannað er forspár-KL-samsemdin á endanlegum sjóndeildarhring, sönnuð er almenna neðri markið R_{T,h}(D)\ge E_{T,h}-D, og sett er fram nákvæmt jafngildisskilyrði fyrir því hvenær því neðra marki er náð. C_{\max} er áfram reynslubundin stika fremur en stærð sem leidd er af hraða-brenglunarformalismanum.
Lokunarstaða: LEYST AÐ HLUTA. Fjórundarskilgreiningin, forspár-KL-samsemdin og almenna neðri markið R_{T,h}(D) \geq E_{T,h}(\nu) - D hafa verið staðfest ásamt nákvæmu jafngildisskilyrði. Fyrri almenna fullyrðingin í lokuðu formi R(D) = C_\mu - D hefur verið dregin til baka; rétta niðurstaðan er neðra markið. C_{\max} er áfram reynslubundin stika fremur en stærð sem leidd er af hraða-brenglunarformalismanum.
§0. Framsetningarstig
Vinnuskilgreining. Festum T,h<\infty. Látum X:=X_{1:T} tákna liðna blokk og Y:=X_{T+1:T+h} framtíðarforspárblokk undir föstu reiknanlegu kyrrstæðu ergódísku máli \nu\in\mathcal M. Skilgreinum forspárupplýsingar á endanlegum sjóndeildarhring E_{T,h}(\nu):=I(X;Y). Þegar markgildi fyrir óendanlegan sjóndeildarhring er til, skilgreinum umframóreiðu E_\nu := I(\overleftarrow X;\overrightarrow X). Ef S táknar fullt orsakaástand \epsilon-vélarinnar, skilgreinum tölfræðilega flækjustigið C_{\mu,\nu}:=H(S). Þetta eru aðgreindar stærðir. Endanlega sjóndeildarhrings-vandamálið um hraða-brenglun í þessum viðauka er sett fram með tilliti til E_{T,h}, en ekki C_{\mu,\nu}. Algild hálfmæling Solomonoffs \xi kemur aðeins inn sem metavægi fordreifingar (forprentun, jafna 1): einstakar R(D)-ferlar eru reiknaðir fyrir hvert mál \nu. Niðurstöður sem krefjast fullrar blöndunnar \xi eru settar fram sérstaklega.
§1. Fullkomin skilgreining fjórundarinnar
1.1 Uppruni X og dreifingin P_X
Festum reiknanlega kyrrstæða ergódíska mælingu \nu \in \mathcal{M} á \{0,1\}^\infty. Uppruninn er ferlið (X_t)_{t \ge 1} sem dreifist samkvæmt \nu. Fyrir hlutverk metafordreifingar vegur \xi úr jöfnu (1) í preprinti hvert slíkt \nu með w_\nu \approx 2^{-K(\nu)}. Við skrifum P_X = \nu fyrir fastan þátt í \mathcal{M}. Allar niðurstöður hér að neðan gilda fyrir hverja mælingu \nu; tengingin við Solomonoff kemur inn í gegnum yfirráðamörkin í §4.
1.2 Endurmyndunarstafróf \hat{X}
Fyrir föst T,h skilgreinum við forspárjafngildisvensl með endanlegum sjóndeildarhring á fortíðarblokkum: x \sim_h x' \iff \nu(Y\in A\mid X=x)=\nu(Y\in A\mid X=x') \quad\text{fyrir öll mælanleg }A\subseteq\{0,1\}^h. Látum S_h tákna jafngildisflokk X undir \sim_h. Þá er S_h minnsta nægilega tölfræðistærðin til að spá fyrir um Y út frá X við sjóndeildarhring h.
Fulla orsakaástand \epsilon-vélarinnar, S, er óendanlegs sjóndeildarhrings hlutur sem fæst þegar farið er yfir í hálfóendanlega fortíð og alla framtíðina. Í þessum viðauka er S_h notað fyrir afleiðingar með endanlegum sjóndeildarhring, en S er frátekið fyrir fullt markgildi orsakaástandsins.
Reiknanleikastaða. Fyrir almennt reiknanlegt \nu er því ekki haldið fram í þessum viðauka að skiptingin í forspárástand sé nákvæmlega reiknanleg. Hún er meðhöndluð sem hugsjónuð mælanleg stærð. Nákvæmur reiknanleiki er aðeins staðhæfður fyrir skýrt afmarkaða undirflokka, svo sem ferli með endanlegt minni.
1.3 Brenglunarfall d_h(x, z)
Brenglunarfallið er KL-forspárfrávikið: d_h(x,z):=D_{\mathrm{KL}}\!\big(P_\nu(Y\mid X=x)\,\|\,P_\nu(Y\mid Z=z)\big). Hér er Z framsetningarbreyta sem verður til með kóðara p(z\mid x). Þegar Z=S_h er þetta nákvæm brenglun forspárástands; þegar Z er grófun eða slembikóði er P_\nu(Y\mid Z=z) afleidda forspárlögmálið.
Fullkomin fjórund
| Eining | Skilgreining |
|---|---|
| X | (X_t)_{t \ge 1} — stöðugt ergódískt ferli undir \nu \in \mathcal{M} |
| \hat{X} | S_h — forspárástand með endanlegum sjóndeildarhring |
| P_X | \nu — fastur reiknanlegur meðlimur í \mathcal{M}; Solomonoff \xi er meta-frumforsendan |
| d_h(x, z) | D_{\mathrm{KL}}( P_\nu(\cdot\|x) \| P_\nu(\cdot\|z) ) — KL-forspárfrávik yfir sjóndeildarhring h |
§2. Afleiðsla R_{T,h}(D) undir fjórundinni
Rate-distortion-fallið fyrir fjórundina í §1 er:
R_{T,h}(D) = \min_{p(z|x) : \mathbb{E}[d_h(X,Z)] \le D} I(X ; Z)
2.1 KL-brenglunarsamsemdin
Látum X:=X_{1:T}, Y:=X_{T+1:T+h}, og látum Z vera hvaða framsetningu sem er framleidda af kóðara p(z\mid x). Þar sem Z-X-Y er Markov-keðja, \mathbb E[d_h(X,Z)] = \mathbb E\!\left[D_{\mathrm{KL}}(P(Y\mid X)\|P(Y\mid Z))\right] = H(Y\mid Z)-H(Y\mid X) = I(X;Y\mid Z). Jafngilt, \mathbb E[d_h(X,Z)] = I(X;Y)-I(Z;Y)=E_{T,h}(\nu)-I(Z;Y). Því er brenglunarskilyrðið \mathbb E[d_h(X,Z)]\le D jafngilt I(Z;Y)\ge E_{T,h}(\nu)-D.
2.2 Endurframsetning upplýsingahálsins
Bjögunarskilyrðið takmarkar rúm leyfilegra kóðara við þá sem fullnægja \mathbb{E}[d_h(X,Z)] \le D. Þetta samsvarar nákvæmlega því að setja neðri mörk á I(Z;Y) og gefur þannig hið skorðaða verkefni upplýsingahálsins. Þar sem framkvæmanlega svæðið \{(I(Z;Y), I(X;Z))\} er kúpt samkvæmt stöðluðum rökum um tímaskiptingu, gildir sterk tvíund. Þetta gerir kleift nákvæma endurframsetningu með Lagrange-falli upplýsingahálsins (Tishby, Pereira & Bialek 1999 [28]): \mathcal{L}[p(z|x)] = I(X ; Z) - \beta \cdot I(Z ; Y) þar sem Lagrange-margfaldarinn \beta ræðst af D. IB-Lagrange-fallið rekur Pareto-jaðarinn milli þjöppunarhraða og forspártryggðar.
2.3 Meginsetning: Almenn neðri mörk og jafngildisskilyrði
Við setjum fram mörkin fyrir rate-distortion-fallið:
Setning (almenn neðri mörk og
jafngildisskilyrði).
Fyrir hvaða kóðara sem er p(z\mid x),
látum
D:=\mathbb E[d_h(X,Z)].
Þá gildir
I(X;Z)=E_{T,h}(\nu)-D+I(X;Z\mid Y).
Þar af leiðandi,
R_{T,h}(D)\ge E_{T,h}(\nu)-D.
Fyrir þéttar endurgerðarstafrófsgerðir með endanlegum fjölda
staka, þar sem samfelldni tryggir að infimum yfir kóðurum næst, gildir
jafngildi við gefna bjögun D þá og því
aðeins að til sé kóðari sem nær þeirri bjögun með
I(X;Z\mid Y)=0.
Fyrir ákvörðuð kóðunarkort Z=g(X) er þetta jafngilt
H(Z\mid Y)=0.
Við núllbjögun nær minnsta nægjanlega tölfræðistærðin S_h R_{T,h}(0)=I(X;S_h)=H(S_h). Athugið að þetta núllbjögunarhraðagildi H(S_h) liggur almennt strangt ofan við neðri mörkin E_{T,h}. Mismunurinn er hið óneikvæða bil H(S_h) - E_{T,h} = H(S_h|Y). Þetta bil táknar eðlisfræðilega formbundnar „geymdar upplýsingar“ í fortíðinni sem framtíðarglugginn einn og sér nær ekki að endurheimta. Að jafngildi haldist við núllbjögun (H(S_h|Y)=0) er mjög úrkynjað tilvik sem er almennt ósatt fyrir flókin ferli.
Í fullum orsakaástandamörkum, R(0)=C_{\mu,\nu}=H(S). Þetta er aðeins jafnt E_\nu í sérstökum tilvikum; almennt gildir E_\nu < C_{\mu,\nu}.
2.4 Hegðun fyrir grófari endurmyndunarstafróf
Fyrir sérhverja ákvarðaða grófun Z=g(S_h), I(X;Z)=I(Z;Y)+I(X;Z\mid Y)=E_{T,h}(\nu)-D+I(X;Z\mid Y)\ge E_{T,h}(\nu)-D. Óneikvæða slakaliðurinn I(X;Z\mid Y) hverfur einungis þegar hægt er að endurheimta grófuðu framsetninguna úr framtíðarglugganum Y. Því leiða grófari stafróf almennt til hraða-brenglunarferla sem liggja strangt ofan við línuna E_{T,h}-D. Línan er algilt neðra mark, en ekki almennt umslag sem næst í framkvæmd. Sérhver kóðari sem er reiknanlegur í reynd notar nálgun á orsakaástandi með endanlegu minni og hefur því feril sem liggur ofan við þessi mörk.
2.5 Jaðarmat
| Mörk | Gildi | Túlkun |
|---|---|---|
| D = 0 | R_{T,h}(0) = I(X; S_h) | Nákvæm þjöppun forspárástands; hámarksupplýsingar varðveittar |
| D = E_{T,h} | R_{T,h}(E_{T,h}) = 0 | Trivial framsetning; öllum forspárupplýsingum er hent |
| D = D_{\min} | R_{T,h}(D_{\min}) \ge E_{T,h}(\nu) - D_{\min} | Lágmarksneðri mörk fyrir lífvænlegan athuganda; þröskuldur Stöðugleikasíu |
(Athugið: Í markgildinu fyrir óendanlegan sjóndeildarhring er núllhraðapunkturinn við bjögunina E_\nu, ekki við C_{\mu,\nu})
§3. C_{\max} — Eðlisgreining og þröskuldar
3.1 Samleitnilemma fyrir óendanlegan sjóndeildarhring
Meginsetningin (§2.3) setur fram neðri mörkin R_{T,h}(D) \ge E_{T,h}(\nu) - D fyrir endanleg (T, h). Nú sýnum við að þetta nær einnig til tilviks með óendanlegum sjóndeildarhring.
Lemma (útvíkkun á óendanlegan sjóndeildarhring). Látum \nu vera stöðuga ergódíska mælingu á \{0,1\}^\infty. Þá gildir:
- E_{T,h}(\nu) = I(X_{1:T}\,;\,X_{T+1:T+h}) er ekki minnkandi í bæði T og h (samkvæmt gagnavinnslujöfnunni: skilyrðing á lengri blokkum getur ekki minnkað gagnkvæmar upplýsingar milli fortíðar og framtíðar undir stöðugleika).
- Markgildið E_\nu := \lim_{T,h \to \infty} E_{T,h}(\nu) er til (hugsanlega +\infty) samkvæmt einhæfri samleitni.
- Fyrir sérhvert fast D \ge 0 er runan R_{T,h}(D) ekki minnkandi í T (lengri fortíð getur ekki lækkað besta mögulega þjöppunarhraða) og ekki minnkandi í h. Sönnunardrög fyrir einhæfni í h: Bjögunarfallið sundrast sem d_{h+1}(x, z) = D_{\mathrm{KL}}\!\left(P_\nu(\cdot \mid x) \,\|\, P_z(\cdot \mid z)\right) yfir h+1 framtíðarskref, og má skrifa það með keðjureglunni sem d_h(x,z) + D_{\mathrm{KL}}\!\left(P_\nu(X_{T+h+1} \mid x, X_{T+1:T+h}) \,\|\, P_z(X_{T+h+1} \mid z, X_{T+1:T+h})\right). Þar sem seinni liðurinn er ekki neikvæður, gildir punktvíst að d_{h+1} \geq d_h. Því er skorðusafnið \{P(z|x) : E[d_{h+1}] \leq D\} \subseteq \{P(z|x) : E[d_h] \leq D\}, og lágmörkun yfir minna framkvæmanlegu mengi getur ekki lækkað hraðann: R_{T,h+1}(D) \geq R_{T,h}(D).
- Því er R_\nu(D) := \lim_{T,h \to \infty} R_{T,h}(D) til.
Þar sem R_{T,h}(D) \ge E_{T,h}(\nu) - D gildir á hverju endanlegu stigi, og báðar hliðar stefna einhæft að markgildi, flyst skorðan yfir á markgildið:
R_\nu(D) \ge E_\nu - D
Þetta eru neðri mörkin fyrir óendanlegan sjóndeildarhring sem vísað er til í setningum T-1a og T-1c hér að neðan. Athugið: Fyrir ferli með E_\nu = +\infty (t.d. de Bruijn-hringi af hárri gráðu þegar k \to \infty), er skorðan sjálfkrafa uppfyllt; slík ferli eru útilokuð úr mengi athuganda-samhæfra plástra O_{C_{\max},D_{\min}} fyrir sérhvert endanlegt C_{\max}.
3.2 Skipting M með Stöðugleikasíu — Setning T-1a
Setning T-1a (óþýðingarmikil skipting).
Festum reynslubundið C_{\max}>0,
\Delta t>0 og D_{\min}\ge0. Skilgreinum
O_{C_{\max},D_{\min}}
:=
\{\nu\in\mathcal M: R_\nu(D_{\min})\le C_{\max}\Delta t\}.
Þá eru bæði O_{C_{\max},D_{\min}} og fyllimengi þess ekki
tóm.
Sönnun. Fasti ferillinn liggur í O_{C_{\max},D_{\min}} vegna þess að hann
hefur E_\nu=0 og R_\nu(D)=0.
Fyrir fyllimengið veljum við tvígildan de Bruijn-hringferilsferil af
stigi k: stöðugt ergódískt tvígilt
ferli með lotu 2^k og jafndreifðum
fasa, þar sem hvert orð af lengd k
kemur fyrir nákvæmlega einu sinni í hverri lotu. Fyrir þetta ferli
gildir
E_\nu=C_{\mu,\nu}=k.
Því fæst
R_\nu(D_{\min})\ge k-D_{\min}.
Með því að velja k>C_{\max}\Delta t
+ D_{\min} fæst R_\nu(D_{\min})>C_{\max}\Delta t, svo
\nu\notin O_{C_{\max},D_{\min}}. \square
3.3 Skilgreining/einkenning á C_{\max} — T-1b
Skilgreining T-1b (reynslubundin
bandbreiddarbreyta).
C_{\max} er tekið sem reynslubundin
bandbreiddarbreyta fyrir meðvitaðan aðgang sem er ytri gagnvart
rate-distortion-formalíseringunni. Gefið C_{\max}, skilgreinum við flokkinn sem er
samrýmanlegur athuganda
O_{C_{\max},D_{\min}}
:=
\{\nu\in\mathcal M: R_\nu(D_{\min})\le C_{\max}\Delta t\}.
Ef ætlunin er að draga saman sérstaklega skilgreindan
viðmiðunarflokk \mathcal{O}_{ref},
skilgreinum við
C^{ref}_{max}:=\frac{1}{\Delta
t}\sup_{\nu\in\mathcal{O}_{ref}}R_\nu(D_{\min}).
Þetta er samantektarstærð fyrir valinn flokk, en ekki
skilgreining á flokknum sjálfum.
3.4 Hindrunin gegn ekki-tilkomu — Sönnunardrög T-1c
Sönnunardrög T-1c (engin endanleg algild efri mörk frá \xi einu saman).
Algild hálfmæling Solomonoffs \xi
úthlutar jákvæðu forvægisgildi til sérhvers reiknanlegs mælis \nu\in\mathcal M. Flokkurinn \mathcal M inniheldur stöðug kyrrstæð tvígild
ferli með handahófskennt mikla umframóreiðu E_\nu (til dæmis de Bruijn-fjölskylduna hér
að ofan). Þar sem
R_\nu(D_{\min})\ge E_\nu-D_{\min},
eru engin endanleg efri mörk sem gilda yfir allan stuðninginn á
R_\nu(D_{\min}) afleiðanleg af \xi einu saman. Sérhver endanleg C_{\max} krefst því viðbótar að reynslugögnum
eða inntaki sem þrengir flokkinn umfram hinn bera Solomonoff-forvigta.
\square
§4. Tengsl við Solomonoff-meta-forgengið
Fjórundin í §1 og R(D)-afleiðslan í §2 eru sett fram fyrir hvert mæli \nu. Tengingin við Solomonoff — hvernig meta-forgengið \xi vegur strauma sem eru samrýmanlegir athuganda — er formgerðarsamsvörun fremur en afleiðsla.
Fyrir sérhvert \nu \in O_{C_{\max},D_{\min}} sem er samrýmanlegt athuganda tryggir jafnvægi hraða og bjögunar að þjappaði straumurinn z_{0:T} sé það framsetningarform sem Stöðugleikasían velur. Solomonoff-forgengið \xi úthlutar þessu \nu væginu w_\nu \approx 2^{-K(\nu)}: einfaldari (lægra K) ferli sem eru samrýmanleg athuganda eru veldisvísislega líklegri undir \xi. Þetta er formleg framsetning á röksemdinni um sparneytni (Viðauki T-4): Stöðugleikasían, sem verkar á \xi, velur einfaldasta kóðarann sem fellur innan bandbreiddarinnar.
Yfirráðamörkin úr T-4b eiga hér beint við: fyrir sérhvern reiknanlegan eðlisfræðilegan mæli \nu með K(\nu) < \infty:
-\log \xi(y_{1:T}) \le -\log \nu(y_{1:T}) + K(\nu)
Þetta tryggir að OPT-meta-forgengið \xi úthluti aldrei lægri líkum til strauma sem eru samrýmanlegir athuganda en nokkurt fast reiknanlegt líkan af eðlisfræði, að viðbættri eigin lýsingarlengd líkansins K(\nu).
§5. Upplifunarbitaskammturinn h^\ast (forsmekkur að E-1)
Gefið reynslubundið val á C_{\max} og reynslubundinn meðvitaðan uppfærsluglugga \Delta t, skilgreinum h^*:=C_{\max}\Delta t. Fyrir C_{\max}\approx 10 bita/s og \Delta t\in[50,80] ms, h^*\approx 0.5\text{–}0.8 bita á hvert meðvitað augnablik.
Sérhvert stöðugt ergódískt ferli \nu \in \mathcal{M} sem uppfyllir E_{T,h}(\nu) - D_{\min} > h^\ast mun með réttmætum hætti kalla fram Frásagnarhrun. Ástæðan er sú að R_{T,h}(D_{\min}) \ge E_{T,h} - D_{\min} > h^\ast = C_{\max} \Delta t, sem brýtur með skýrum hætti gegn samhæfniviðmiðinu. Þetta er þó nægjanlegt skilyrði fyrir hruni, en ekki stranglega nauðsynlegt: þar sem neðri mörkin eru sjaldan þröng (R_{T,h} > E_{T,h} - D_{\min} almennt samkvæmt §2.4), geta ferli farið í Frásagnarhrun jafnvel þegar E_{T,h} - D_{\min} \le h^\ast. Þetta veitir megindlega spá fyrir E-1; næmnin gagnvart vali á \Delta t \in [40, 300] ms er rædd í viðauka E-1.
§6. Samantekt um lokun
Afhendingaratriði T-1 — endurskoðuð staða
- Fjórundin er skilgreind innan forspárumhverfis með endanlegum sjóndeildarhring.
- Forspár-KL-samsemdin er leidd rétt af.
- Almenna setningin R(D)=C_\mu-D er skipt út fyrir rétt neðra mark R_{T,h}(D)\ge E_{T,h}-D ásamt nákvæmu jafngildisskilyrði I(X;Z\mid Y)=0.
- Núllbjögunarkóðun er lýst með lágmarks nægilegri tölfræði S_h, og í fullum markatilviksmarka orsakaástands gildir R(0)=C_{\mu,\nu}.
- C_{\max} er meðhöndlað sem reynslubundið, ekki sem eitthvað sem er leitt af innan kerfisins.
- h^*=C_{\max}\Delta t er reynslubundin stikun, ekki setning úr §2.
Þessum viðauka er viðhaldið sem hluta af OPT-verkefnageymslunni samhliða theoretical_roadmap.pdf.