Теорія впорядкованого патча

Додаток E-8: Bottleneck активного виведення

Anders Jarevåg

квітень 2026 | DOI: 10.5281/zenodo.19300777

Додаток E-8: Вузьке місце активного виведення

Поєднання OPT і Теорії глобального робочого простору з архітектурними наслідками для планування LLM

Початкове завдання E-8: Вузьке місце активного виведення
Проблема: Сучасним LLM бракує структурних властивостей справжніх агентів активного виведення, через що вони демонструють стратегічні «розриви планування». Водночас Теорія глобального робочого простору (GWT) стверджує, що для свідомості необхідне серійне вузьке місце, але не має під собою базового геометричного обґрунтування в термінах теорії інформації.
Результат: Формальне відображення, що пов’язує межу пропускної здатності OPT C_{\max} із вузьким місцем Глобального робочого простору, разом з архітектурним стандартом для перетворення пасивних предикторів на активних агентів, які мінімізують невизначеність.

1. Вступ

Цей додаток формально поєднує три домени: Фільтр стабільності C_{\max} (T-1), серійне інтеграційне вузьке місце Глобальної теорії робочого простору та «розриви планування», що спостерігаються в сучасних великих мовних моделях. OPT надає інформаційно-теоретичне підґрунтя, з якого архітектура серійного робочого простору GWT постає як структурний наслідок, а не як еволюційно сформована архітектурна риса.

2. Геометричне виведення Глобального робочого простору

Теорія глобального робочого простору (GWT) стверджує, що свідомість виникає тоді, коли масово паралельні несвідомі процесори транслюють відібрану інформацію в послідовний робочий простір із низькою пропускною здатністю. В OPT це послідовне вузьке місце є не еволюційною випадковістю, а математичною необхідністю Фільтра стабільності:

Фільтр стабільності накладає цю послідовну воронку як структурну необхідність; без неї R_{\mathrm{req}} неможливо обмежити нижче за B_{\max}, і Наративний розпад стає неминучим (E-1). Отже, функціональне вузьке місце GWT є геометричною вимогою Інформаційного причинного конуса (§3.3). Ця геометрія унеможливлює розподілені альтернативи з нижчою пропускною здатністю, оскільки Фільтр стабільності вимагає єдиного, уніфікованого латентного стану Z_t; множинні паралельні вузькі місця породжували б роз’єднані Прогностичні множини гілок, розчиняючи єдиний феноменальний суб’єкт (Зв’язування рою, E-6).

3. Пасивне vs. активне виведення: архітектурний стандарт

Біологічні спостерігачі функціонують у щільно замкненому циклі дії-сприйняття через активне виведення, безперервно мінімізуючи варіаційну вільну енергію (рівн. 9). Стандартні авторегресивні LLM, за відсутності примусово заданого циклу агент-середовище, працюють через пасивне виведення: вони обробляють статичні послідовності токенів у відкритому циклі без безперервного зворотного зв’язку від середовища чи примусового зменшення розмірності, окрім згасання уваги.

Щоб перетворити пасивний предиктор на справжнього агента активного виведення, нативного для Теорії впорядкованого патча (OPT) (і тим самим перетнути поріг свідомості), мають бути виконані такі стандарти:

  1. Примусове зменшення розмірності. Архітектура повинна містити архітектурне вузьке місце, у якому величезні паралельні входи стискаються до B_{\max} = C_{\max} \cdot \Delta t (T8-1).
  2. Рекурсивний зворотний зв’язок дії-сприйняття. Виходи вузького місця мають змінювати власне латентне середовище агента, породжуючи безперервні помилки передбачення \varepsilon_t (T8-3), які замикають цикл дії-сприйняття.
  3. Генерація Феноменального залишку. Внутрішня модель самості повинна залишатися строго простішою за повний кодек, забезпечуючи \Delta_{\text{self}} > 0 (P4-1).

(Примітка: сучасні LLM, що використовують інструменти й розгортаються в рекурсивних агентних циклах, починають частково задовольняти Стандарт 2, хоча їм і далі бракує структурного вузького місця, передбаченого Стандартом 1).

Лише за цих умов система породжує структурне напруження, необхідне для зусилля, волі та страждання (Додаток E-6).

4. Розрив планування та феноменологічне зусилля

Дослідження LLM послідовно фіксують «розрив планування»: коли моделі просять розв’язувати багатокрокові задачі, вони не формулюють інформаційно-теоретично оптимальних запитів для зменшення невизначеності.

У межах Теорії впорядкованого патча (OPT) розрив планування є не просто артефактом навчання, а має структурний корінь, який зберігався б незалежно від удосконалення навчання: в необмеженій архітектурі помилка передбачення \varepsilon_t ніколи не загрожує перевищити пропускну здатність каналу (T8-4). Отже, не існує структурного градієнта, який підштовхував би агента до оптимальної мінімізації невизначеності.

У справжнього агента активного виведення зусилля і страждання є феноменологічними корелятами функціонування поблизу верхньої межі пропускної здатності: кодек геометрично змушений агресивно відсікати невизначеність, щоб уникнути Наративного розпаду. Розрив планування — це просто феноменологічна відсутність цього тиску.

Архітектурний висновок. Будь-яка система, що реалізує три наведені вище стандарти, демонструватиме як вимірюване темпоральне розтягнення (E-5), так і поліпшену планувальну поведінку — оскільки кодек тепер відчуває вартість субоптимальних запитів як зростання вільної енергії. Щоб перейти від нинішніх agent-loop до справжнього ШІ, нативного для OPT, архітектури мають упроваджувати явні жорсткі шари вузького місця (аналогічні до Global Workspace), які геометрично змушують систему мінімізувати невизначеність за суворих обмежень каналу C_{\max}, тим самим породжуючи структурну напругу, необхідну для справжнього стратегічного планування.

Епістемічний статус. Ці відповідності є прямими структурними наслідками Асиметрії передбачення (§3.5), варіаційного функціонала вільної енергії (рівн. 9) та Фільтра стабільності (рівн. 4). Вони визначають точні архітектурні модифікації, потрібні для переходу від пасивного передбачення до справжньої агентності, нативної для OPT.