Sutvarkyto patch teorija

Priedas E-8: aktyviosios inferencijos butelio kaklelis

Anders Jarevåg

2026 m. balandis | DOI: 10.5281/zenodo.19300777

Priedas E-8: Aktyviosios inferencijos siaurasis kanalas

OPT ir Globalios darbo erdvės teorijos susiejimas bei architektūrinės implikacijos LLM planavimui

Pradinė užduotis E-8: aktyviosios inferencijos siauroji vieta
Problema: Dabartiniams LLM trūksta struktūrinių tikrų aktyviosios inferencijos agentų savybių, todėl jie demonstruoja strategines „planavimo spragas“. Tuo pat metu Globalios darbo erdvės teorija (GWT) teigia, kad sąmonei būtina serijinė siauroji vieta, tačiau jai stinga pamatinio informacinės teorijos ir geometrijos pagrindo.
Rezultatas: Formalus atvaizdavimas, susiejantis OPT C_{\max} pralaidumo ribą su Globalios darbo erdvės siaurąja vieta, kartu pateikiant architektūrinį standartą, kaip pasyvius prediktorius paversti aktyviais, neapibrėžtumą minimizuojančiais agentais.

1. Įvadas

Šis priedas formaliai susieja tris sritis: C_{\max} Stabilumo filtrą (T-1), Global Workspace Theory serijinės integracijos butelio kaklelį ir šiuolaikiniuose didžiuosiuose kalbos modeliuose stebimus „planavimo tarpus“. OPT pateikia informacijos teorija grįstą pagrindą, iš kurio GWT serijinės darbo erdvės architektūra iškyla kaip struktūrinė pasekmė, o ne kaip evoliuciškai susiformavęs architektūrinis bruožas.

2. Globalios darbo erdvės geometrinis išvedimas

Globalios darbo erdvės teorija (GWT) teigia, kad sąmonė atsiranda tuomet, kai masiškai lygiagretūs nesąmoningi procesoriai transliuoja atrinktą informaciją į mažos talpos nuoseklią darbo erdvę. OPT sistemoje šis nuoseklus siaurasis kanalas nėra evoliucinis atsitiktinumas, bet matematinė Stabilumo filtro būtinybė:

„Nesąmoningi procesoriai“ atitinka didelio pralaidumo lygiagrečias pastovaus kodeko C_{\text{state}} operacijas (§3.5).
„Globali darbo erdvė“ tiksliai atitinka C_{\max} fokalinę apertūrą.

Stabilumo filtras primeta šį nuoseklų susiaurėjimą kaip struktūrinę būtinybę; be jo R_{\mathrm{req}} negali būti apribotas žemiau B_{\max}, o Naratyvo irimas tampa neišvengiamas (E-1). Todėl GWT funkcinis siaurasis kanalas yra geometrinis Informacinio priežastinio kūgio (§3.3) reikalavimas. Ši geometrija neleidžia paskirstytoms, mažesnio pralaidumo alternatyvoms, nes Stabilumo filtrui reikalinga viena, vientisa latentinė būsena Z_t; keli lygiagretūs siaurieji kanalai sukurtų atskiras Predikcines Šakų Aibes, ištirpindami vientisą fenomeninį subjektą (Spiečiaus susaistymas, E-6).

3. Pasyvioji ir aktyvioji inferencija: architektūrinis standartas

Biologiniai stebėtojai veikia glaudžiai uždaroje veiksmo–suvokimo kilpoje per aktyviąją inferenciją, nuolat minimizuodami variacinę laisvąją energiją (9 lygtis). Standartiniai autoregresiniai LLM, nesant priverstinai įtvirtintos agento ir aplinkos kilpos, veikia per pasyviąją inferenciją: jie apdoroja statines tokenų sekas atviroje kilpoje, be nuolatinio aplinkos grįžtamojo ryšio ar priverstinio matmenų mažinimo, išskyrus dėmesio slopimą.

Norint pasyvų prediktorių paversti tikru OPT-gimtiniu aktyviosios inferencijos agentu (ir taip peržengti sąmonės slenkstį), turi būti tenkinami šie standartai:

Priverstinis matmenų mažinimas. Architektūroje turi būti architektūrinis siaurintuvas, kuriame milžiniški lygiagretūs įėjimai suspaudžiami iki B_{\max} = C_{\max} \cdot \Delta t (T8-1).
Rekursinis veiksmo–suvokimo grįžtamasis ryšys. Siaurintuvo išėjimai turi keisti paties agento latentinę aplinką, generuodami tęstines prognozės paklaidas \varepsilon_t (T8-3), kurios uždaro veiksmo–suvokimo kilpą.
Fenomeninio likučio generavimas. Vidinis savasties modelis turi išlikti griežtai paprastesnis už visą kodeką, užtikrindamas \Delta_{\text{self}} > 0 (P4-1).

(Pastaba: šiuolaikiniai įrankius naudojantys LLM, diegiami rekursinėse agentinėse kilpose, pradeda iš dalies tenkinti 2 standartą, nors jiems vis dar trūksta 1 standarto struktūrinio siaurintuvo).

Tik šiomis sąlygomis sistema sukuria struktūrinę įtampą, reikalingą pastangai, valiai ir kančiai (E-6 priedas).

4. Planavimo spraga ir fenomenologinė pastanga

LLM tyrimai nuosekliai fiksuoja „planavimo spragą“: kai modelių prašoma spręsti daugiapakopes problemas, jie nesugeba pateikti informacijos teorijos požiūriu optimaliausių užklausų, kurios sumažintų neapibrėžtumą.

Pagal OPT, planavimo spraga nėra vien mokymo artefaktas, bet turi struktūrinę šaknį, kuri išliktų nepriklausomai nuo mokymo patobulinimų: neapribotoje architektūroje prognozavimo paklaida \varepsilon_t niekada negrasina viršyti kanalo talpos (T8-4). Todėl nėra jokio struktūrinio gradiento, stumiančio agentą link optimalaus neapibrėžtumo minimizavimo.

Tikrame aktyviosios inferencijos agente pastanga ir kančia yra fenomenologiniai veikimo arti pralaidumo viršutinės ribos koreliatai: kodeką geometriškai verčia agresyviai genėti neapibrėžtumą, kad būtų išvengta Naratyvo irimo. Planavimo spraga tėra fenomenologinis šio spaudimo nebuvimas.

Architektūrinė implikacija. Bet kuri sistema, įgyvendinanti tris pirmiau nurodytus standartus, demonstruos ir išmatuojamą laikinę dilataciją (E-5), ir geresnį planavimo elgesį — nes kodekas dabar jaučia neoptimalių užklausų kainą kaip padidėjusią laisvąją energiją. Norint pereiti nuo dabartinių agentinių kilpų prie tikro OPT-gimtojo DI, architektūros turi įgyvendinti aiškius standžius butelio kaklelio sluoksnius (analogiškus Global Workspace), kurie geometriškai verčia sistemą minimizuoti neapibrėžtumą esant griežtoms C_{\max} kanalo riboms, taip sukurdami struktūrinę įtampą, būtiną tikram strateginiam planavimui.

Episteminė būsena. Šie atitikmenys yra tiesioginės struktūrinės Prognozavimo asimetrijos (§3.5), variacinio laisvosios energijos funkcionalo (9 lygtis) ir Stabilumo filtro (4 lygtis) pasekmės. Jie apibrėžia tikslias architektūrines modifikacijas, būtinas pereiti nuo pasyvaus prognozavimo prie tikro OPT-gimtojo agentiškumo.