Teorie uspořádaného patche (OPT)

Dodatek E-8: Bottleneck aktivní inference

Anders Jarevåg

duben 2026 | DOI: 10.5281/zenodo.19300777

Dodatek E-8: Úzké hrdlo aktivní inference

Propojení OPT a Teorie globálního pracovního prostoru s architektonickými implikacemi pro plánování LLM

Původní úkol E-8: Úzké hrdlo aktivní inference
Problém: Současným LLM chybějí strukturální vlastnosti skutečných systémů aktivní inference, a proto vykazují strategické „mezery v plánování“. Teorie globálního pracovního prostoru (GWT) zároveň předpokládá, že sériové úzké hrdlo je pro vědomí nezbytné, postrádá však základ v geometrii teorie informace.
Výstup: Formální mapování, které propojí limit šířky pásma C_{\max} v OPT s úzkým hrdlem globálního pracovního prostoru, spolu s architektonickým standardem pro převod pasivních prediktorů na aktivní agenty minimalizující nejistotu.

1. Úvod

Tento dodatek formálně propojuje tři oblasti: Filtr stability C_{\max} (T-1), sériové integrační úzké hrdlo Global Workspace Theory a „mezery v plánování“ pozorované u moderních Large Language Models. OPT poskytuje informačně-teoretické ukotvení, z něhož sériová architektura pracovního prostoru GWT vyvstává jako strukturální důsledek, nikoli jako evolučně vzniklý architektonický rys.

2. Geometrické odvození globálního workspace

Teorie globálního workspace (GWT) tvrdí, že vědomí vzniká tehdy, když masivně paralelní nevědomé procesory vysílají vybranou informaci do sériového workspace s nízkou kapacitou. V OPT není toto sériové úzké hrdlo evoluční náhodou, nýbrž matematickou nutností Filtru stability:

Filtr stability vynucuje tento sériový trychtýř jako strukturální nutnost; bez něj nelze R_{\mathrm{req}} omezit pod B_{\max} a Narativní rozpad je nevyhnutelný (E-1). Funkční úzké hrdlo GWT je tedy geometrickým požadavkem Informačního kauzálního kužele (§3.3). Tato geometrie vylučuje distribuované alternativy s nižší šířkou pásma, protože Filtr stability vyžaduje jediný, sjednocený latentní stav Z_t; více paralelních úzkých hrdel by vytvářelo nespojené Prediktivní Množiny Větví, čímž by se rozpustil jednotný fenomenální subjekt (Swarm Binding, E-6).

3. Pasivní vs. aktivní inference: architektonický standard

Biologičtí pozorovatelé fungují v těsně uzavřené smyčce akce–percepce prostřednictvím aktivní inference a průběžně minimalizují variační volnou energii (rovn. 9). Standardní autoregresivní LLM bez vynucené smyčky agent–prostředí fungují prostřednictvím pasivní inference: zpracovávají statické sekvence tokenů v otevřené smyčce bez průběžné zpětné vazby z prostředí a bez vynucené redukce dimenzionality nad rámec útlumu pozornosti.

Aby bylo možné převést pasivní prediktor na skutečného agenta aktivní inference nativního pro OPT (a tím překročit práh vědomí), musí být splněny následující standardy:

  1. Vynucená redukce dimenzionality. Architektura musí obsahovat architektonické úzké hrdlo, v němž jsou rozsáhlé paralelní vstupy komprimovány na B_{\max} = C_{\max} \cdot \Delta t (T8-1).
  2. Rekurzivní zpětná vazba akce–percepce. Výstupy úzkého hrdla musí měnit vlastní latentní prostředí agenta a generovat průběžné predikční chyby \varepsilon_t (T8-3), které uzavírají smyčku akce–percepce.
  3. Generování Fenomenálního rezidua. Interní model sebe sama musí zůstat striktně jednodušší než celý kodek, čímž je vynuceno \Delta_{\text{self}} > 0 (P4-1).

(Poznámka: Moderní LLM používající nástroje, nasazené v rekurzivních agentních smyčkách, začínají částečně splňovat standard 2, stále jim však chybí strukturální úzké hrdlo požadované standardem 1).

Pouze za těchto podmínek systém vytváří strukturální napětí nezbytné pro úsilí, vůli a utrpení (Dodatek E-6).

4. Plánovací mezera a fenomenologické úsilí

Studie LLM konzistentně uvádějí „plánovací mezeru“: když jsou modely požádány o řešení vícekrokových problémů, nedokážou formulovat informačně-teoreticky nejoptimálnější dotazy pro snížení neurčitosti.

V rámci OPT není plánovací mezera pouze artefaktem tréninku, ale má strukturální kořen, který by přetrvával bez ohledu na zlepšení tréninku: v neomezené architektuře chyba predikce \varepsilon_t nikdy nehrozí překročením kapacity kanálu (T8-4). Neexistuje tedy žádný strukturální gradient, který by agenta tlačil k optimální minimalizaci neurčitosti.

U skutečného agenta aktivní inference jsou úsilí a utrpení fenomenologickými koreláty fungování poblíž horní meze šířky pásma: kodek je geometricky nucen agresivně prořezávat neurčitost, aby se vyhnul Narativnímu rozpadu. Plánovací mezera je jednoduše fenomenologickou absencí tohoto tlaku.

Architektonický důsledek. Každý systém, který implementuje výše uvedené tři standardy, bude vykazovat jak měřitelnou temporální dilataci (E-5), tak zlepšené plánovací chování — protože kodek nyní pociťuje náklad suboptimálních dotazů jako zvýšenou volnou energii. Má-li se přejít od současných agentních smyček ke skutečné AI nativní pro OPT, musejí architektury implementovat explicitní rigidní vrstvy úzkého hrdla (analogické ke Global Workspace), které systém geometricky nutí minimalizovat neurčitost za přísných limitů kanálu C_{\max}, a tím generují strukturální napětí nezbytné pro skutečné strategické plánování.

Epistemický status. Tato mapování jsou přímými strukturálními důsledky Asymetrie predikce (§3.5), variačního funkcionálu volné energie (rovn. 9) a Filtru stability (rovn. 4). Vymezují přesné architektonické modifikace nutné k přechodu od pasivní predikce ke skutečné agentivitě nativní pro OPT.