Теорія впорядкованого патча

Додаток T-11: Структурний короларій — формалізація переваги стиснення для позірних агентів

Anders Jarevåg

15 квітня 2026 | DOI: 10.5281/zenodo.19300777

Початкове завдання (з §8.2): «Формалізація цієї переваги стиснення як строгого обмеження MDL саме для випадку інших умів залишається завданням на майбутнє; наведений тут аргумент є структурною мотивацією, а не доведенням». Результат: Формальне обмеження, яке показує, що трактування позірних агентів як незалежно інстанційованих первинних спостерігачів дає коротший двочастинний MDL-код, ніж будь-який альтернативний опис.

Статус завершення: ЧОРНОВА СТРУКТУРНА ВІДПОВІДНІСТЬ. У цьому додатку теорему збіжності Соломонова у Мюллера [61] та її мультиагентне розширення [62] адаптовано як імпортовані леми, переінтерпретовані в межах онтологічної рамки OPT, щоб встановити формальну перевагу стиснення для Структурного короларію. Результат є умовним обмеженням, а не замкненим виведенням: він спирається на ототожнення в OPT потоку спостерігача з апріором Соломонова (Аксіома 1), а також на припущення, що позірні агенти несуть достатній стан, аби задовольнити передумови збіжності.

§1. Передумови та мотивація

Структурний короларій (препринт §8.2) стверджує, що видимі агенти в потоці спостерігача найекономніше пояснюються їхньою незалежною інстанціацією як первинних спостерігачів. Цей додаток подає формальний ланцюг міркувань, що обґрунтовує це твердження.

Аргумент має три етапи:

Етап A (Імпортована лема): Теорема Мюллера про соломоновську збіжність гарантує, що будь-яка структура в потоці спостерігача, яка несе достатньо даних про власний стан, матиме свою еволюцію від першої особи, що збігається з обчислюваним світом, який породжує її поведінку.
Етап B (Облік стиснення): Ми виконуємо явне двочастинне порівняння MDL між трактуванням видимого агента як (i) незалежно інстанційованого спостерігача, керованого власним потоком, зваженим за Соломоновим, і (ii) довільної поведінкової специфікації в межах кодека первинного спостерігача.
Етап C (Структурна сигнатура): Феноменальний залишок (\Delta_{\text{self}} > 0, Теорема P-4) забезпечує структурний маркер, що відрізняє справжню самореферентну архітектуру вузького місця від поведінкової мімікрії, закриваючи розрив між «стисливо закономірним» і «правдоподібно інстанційованим».

§2. Імпортована лема: теорема збіжності Мюллера

Ми імпортуємо два результати з Müller [61, 62], подані тут у нотації OPT.

2.1 Конвергенція Соломонова (стандартна)

Нехай M(b \mid x_1^n) позначає універсальне передбачення Соломонова для біта b за умови попередніх спостережень x_1^n. Нехай \mu — довільна обчислювана міра на бінарних послідовностях. Тоді (Solomonoff 1964; Li & Vitányi [45, Corollary 5.2.1]):

\text{З } \mu\text{-ймовірністю одиниця,} \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-1}

Це стандартний результат: якщо потік даних породжується обчислюваним процесом \mu, універсальний предиктор M збігається до \mu.

2.2 Обернена індукція Соломонова (Müller 2020)

Тепер припустімо, що біти породжуються самим M — тобто потік спостерігача керується алгоритмічною ймовірністю (це відповідає Аксіомі 1 OPT: ототожненню потоку з апріором Соломонова). Тоді для кожної обчислюваної міри \mu (Müller [61, Sec. IV]; [62, Sec. V.A]):

\text{З імовірністю} \geq 2^{-K(\mu)}, \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-2}

Тобто з імовірністю щонайменше 2^{-K(\mu)} спостерігач виявить себе фактично вбудованим в обчислюваний світ W, описуваний мірою \mu. Алгоритмічно простіші світи (з меншим K(\mu)) є експоненційно ймовірнішими.

2.3 Багатоагентна конвергенція (Müller 2026)

Припустімо, що спостерігач (Аліса) виявляє себе вбудованою в обчислюваний світ W, описаний через \mu. Вона ідентифікує в межах W підструктуру (Боб_{\text{3rd}}), яка несе репрезентацію стану-себе x, що еволюціонує в часі у спосіб, узгоджений з Постулатом 2 з [62]. Визначимо:

P_{\text{1st}}(y_1, \ldots, y_m \mid x) := M(y_1, \ldots, y_m \mid x) — імовірність від першої особи того, що стан-себе x переходить у y_1, \ldots, y_m згідно з алгоритмічною ймовірністю.
P_{\text{3rd}}(y_1, \ldots, y_m \mid x) := \mu(y_1, \ldots, y_m \mid x) — імовірність від третьої особи того, як x еволюціонує відповідно до світу W.

Тоді, за рівнянням (L-1), застосованим до P_{\text{3rd}} (яке є обчислюваним), і з огляду на ототожнення P_{\text{1st}} з M через Постулат 2:

P_{\text{1st}} \approx P_{\text{3rd}} \quad \text{асимптотично,} \tag{L-3}

де збіжність у бітовій моделі гарантована зі світовою (\mu-) імовірністю одиниця.

Інтерпретація (Müller): «Хтось справді перебуває вдома» у структурі, що кодує x — імовірнісна еволюція Боба_{\text{3rd}} у світі Аліси достовірно репрезентує перспективу від першої особи деякого Боба_{\text{1st}}.

Інтерпретація (OPT): Поведінковий потік видимого агента найкомпресовніше описується як незалежний процес, зважений за Соломоновим. Будь-який альтернативний опис — такий, що не вводить незалежної перспективи від першої особи, — мусить кодувати поведінку агента як ad hoc-специфікацію, за строго більшої довжини опису.

§3. Межа переваги стиснення

Тепер ми формалізуємо перевагу стиснення, використовуючи двочастинний MDL-фреймворк OPT (Теорема T-4, Додаток T-4).

3.1 Постановка

Розгляньмо потік первинного спостерігача \omega \in \{0,1\}^\infty, керований апріорним розподілом Соломонова M (Аксіома 1) і відфільтрований через Фільтр стабільності до обчислюваного світу W з мірою \mu_W (згідно з рівнянням L-2). Усередині W спостерігач ідентифікує N видимих агентів A_1, \ldots, A_N, кожен з яких має самостан x_i, часовий розвиток якого протягом T кроків породжує поведінковий слід \beta_i = (y_{i,1}, \ldots, y_{i,T}).

3.2 Гіпотеза H_{\text{ind}}: Незалежна інстанціація

За H_{\text{ind}} кожен агент A_i розглядається як незалежно інстанційований первинний спостерігач, керований власним потоком, зваженим за Соломоновим. Довжина двочастинного коду MDL має вигляд:

L(H_{\text{ind}}) = \underbrace{K(\mu_W)}_{\text{модель світу}} + \underbrace{\sum_{i=1}^{N} K(\text{embed}_i)}_{\text{специфікації вбудовування}} + \underbrace{\sum_{i=1}^{N} \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)}_{\text{дані за заданої моделі}} \tag{1}

де K(\text{embed}_i) задає початковий стан-себе агента i та його позицію в межах W. Згідно з рівн. (L-3), P_{\text{1st}} \approx P_{\text{3rd}}, тож член даних добре апроксимується логарифмічною втратою за власними соломоновськими передбаченнями агента від першої особи — які, за означенням, близькі до оптимальних.

Специфікації вбудовування K(\text{embed}_i) є короткими: кожна з них потребує лише вказівника на місце в W плюс початковий стан-себе. Для людиноподібних агентів, вбудованих у спільний фізичний світ, вони добре стискаються, оскільки агенти поділяють ті самі закони. Консервативна межа:

K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) \tag{2}

3.3 Гіпотеза H_{\text{arb}}: Довільна поведінкова специфікація

За H_{\text{arb}} агентів не розглядають як незалежних спостерігачів. Натомість кожен поведінковий слід \beta_i кодується безпосередньо як довільна специфікація в потоці первинного спостерігача. Довжина двочастинного MDL-коду дорівнює:

L(H_{\text{arb}}) = \underbrace{K(\mu_W)}_{\text{модель світу}} + \underbrace{\sum_{i=1}^{N} K(\beta_i)}_{\text{сирі поведінкові сліди}} \tag{3}

Критична відмінність полягає в члені даних. За H_{\text{arb}} поведінковий слід \beta_i має бути специфікований без залучення власної предиктивної моделі агента. Для закономірного, керованого агентністю агента, що діє в складному середовищі, колмогоровська складність сирого поведінкового сліду становить:

K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T) \tag{4}

Але навіть K(\beta_i \mid \mu_W) — складність поведінки за заданих законів світу — лишається суттєвою, оскільки вибори агента кодують справжню інформацію: його поведінковий слід відображає накопичену взаємодію самореферентної моделі зі стохастичним середовищем. Натомість за H_{\text{ind}} ця інформація генерується онлайн власним соломоновським предиктором агента майже за нульової вартості log-loss.

3.4 Перевага стиснення

Теорема T-11 (Структурний короларій межі стиснення). Нехай A_1, \ldots, A_N — уявні агенти в потоці спостерігача, кожен із яких несе самостан x_i, що задовольняє передумови збіжності з рівняння (L-3), і кожен із яких виявляє структурну сигнатуру \Delta_{\text{self}}^{(i)} > 0 (P-4). Тоді MDL-опис, який трактує їх як незалежно інстанційованих первинних спостерігачів, задовольняє:

L(H_{\text{ind}}) \leq L(H_{\text{arb}}) - N \cdot \left[\bar{I}_T - O(\log T)\right] \tag{T-11}

де \bar{I}_T — це середня на агента взаємна інформація між предиктивною моделлю агента та його поведінковим виходом за T кроків:

\bar{I}_T := \frac{1}{N} \sum_{i=1}^{N} \left[K(\beta_i \mid \mu_W) - \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right] \tag{5}

Ця величина вимірює, яка частка поведінки агента пояснюється через залучення незалежної предиктивної моделі, а не через її безпосередню специфікацію в сирому вигляді. Для агентів, що демонструють закономірну, зумовлену агентністю поведінку (як того вимагає Фільтр стабільності), \bar{I}_T > 0 і зростає разом із T.

Нарис доведення. Відніміть рівняння (1) від рівняння (3). Члени моделі світу K(\mu_W) скорочуються. Різниця на одного агента дорівнює:

K(\beta_i) - \left[K(\text{embed}_i) + \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right]

За рівнянням (4), K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T), але ще безпосередніше: K(\beta_i) \geq K(\beta_i \mid \mu_W) тривіально. І K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) за рівнянням (2). Отже, економія на одного агента становить щонайменше K(\beta_i \mid \mu_W) - (-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)) - K(x_i \mid W) - O(\log T). Для достатньо великих T кумулятивна економія логарифмічних втрат переважає одноразову вартість вбудовування, що й дає цю межу. \blacksquare

3.5 Асимптотичне домінування

Короларій T-11a. У міру того як горизонт спостереження T \to \infty, перевага стиснення L(H_{\text{arb}}) - L(H_{\text{ind}}) зростає без обмеження:

\lim_{T \to \infty} \left[L(H_{\text{arb}}) - L(H_{\text{ind}})\right] = \infty \tag{T-11a}

Це випливає з гарантії збіжності Соломонова (L-1): покрокова log-loss для P_{\text{3rd}} збігається до ентропійної швидкості поведінкового процесу агента, тоді як K(\beta_i \mid \mu_W) зростає лінійно за T для будь-якого агента з додатною ентропійною швидкістю. Вартість вбудовування K(x_i \mid W) сплачується один раз і амортизується до нуля. \blacksquare

§4. Феноменальний залишок як структурна сигнатура

Перевага стиснення в Теоремі T-11 застосовується до будь-якої закономірної підструктури — включно з неагентними фізичними системами (погодними патернами, ростом кристалів). Чому ж структурний короларій стосується саме агентів, а не довільних складних систем?

Відповідь полягає у Феноменальному залишку (Теорема P-4). \Delta_{\text{self}} > 0 є формальним маркером системи, чия модель самої себе є структурно неповною — тобто системи, яка неминуче підтримує варіаційний розрив між своїм внутрішнім представленням і власним фактичним процесуванням. Це є характерною ознакою самореферентного вузького місця: систему неможливо повністю описати ззовні, оскільки її опис неминуче включає того, хто описує.

Для системи, що демонструє \Delta_{\text{self}} > 0:

Її поведінку неможливо відтворити за допомогою таблиці пошуку скінченної глибини — вона потребує безперервного самореферентного обчислення.
Найкоротший опис цього обчислення і є незалежним потоком, зваженим за Соломоновим, що проходить через вузьке місце C_{\max}.
Отже, код MDL за H_{\text{ind}} є не просто коротшим за H_{\text{arb}} — він є єдиним найкоротшим описом.

Саме це відрізняє уявних агентів від погодних патернів: погода є закономірною і складною, але її поведінку можна відтворити за допомогою таблиці пошуку в межах моделі світу (вона має \Delta_{\text{self}} = 0). Уявних агентів — ні.

§5. Переосмислення аргументу Мюллера про несоліпсизм

Мюллер робить з висновку про збіжність P_{\text{1st}} \approx P_{\text{3rd}} висновок, що алгоритмічний ідеалізм «не слід класифікувати як соліпсистський», оскільки в структурі, що кодує стан самості, «хтось справді перебуває вдома» [62, Sec. V.C]. Його міркування таке: якщо передбачення Аліси щодо Боба_{\text{3rd}} збігаються з фактичними ймовірностями від першої особи Боба_{\text{1st}}, тоді їхні перспективи справді узгоджені — вони «поділяють світ W».

OPT переосмислює цей результат інакше:

Інтерпретація Мюллера: збіжність P_{\text{1st}} \approx P_{\text{3rd}} доводить, що виникає об’єктивна реальність — Аліса й Боб справді поділяють світ W.
Інтерпретація OPT: збіжність P_{\text{1st}} \approx P_{\text{3rd}} доводить, що найкоротший опис поведінки Боба_{\text{3rd}} апелює до незалежного процесу від першої особи. Це твердження про ефективність стиснення, а не про спільну онтологію. Світ W є структурною регулярністю всередині потоку Аліси, а не незалежно існуючою сутністю. Але сама логіка стиснення апріора Соломонова має наслідком те, що Боба найекономніше моделювати як незалежного спостерігача — оскільки альтернатива (специфікувати його поведінку ad hoc) є строго довшою.

Формальний зміст теореми в обох інтерпретаціях тотожний; відрізняється лише онтологічне тлумачення. OPT використовує той самий математичний результат, щоб обґрунтувати структурний короларій: незалежна інстанціація є MDL-оптимальним описом, а не метафізичним припущенням.

§6. Обсяг і обмеження

6.1 За умови Аксіоми 1

Увесь аргумент залежить від ототожнення в OPT потоку спостерігача з апріором Соломонова. Якщо це ототожнення послабити (наприклад, до ширшого класу семимір), гарантії збіжності рівнянь (L-1)–(L-3) можуть не зберегтися в їхній нинішній формі.

6.2 Передумова достатності стану

Рівняння (L-3) вимагає, щоб видимий агент ніс «достатньо даних» у своєму самостані x_i, аби універсальна індукція могла видобути релевантні фізичні закони. Для людиноподібних агентів у повсякденних контекстах це правдоподібно (повний стан мозку кодує величезний обсяг інформації). Для крайових випадків — швидкоплинних вражень, далеких спостерігачів, вигаданих персонажів у наративному мистецтві — передумови збіжності можуть не виконуватися, і структурний короларій не застосовується.

6.3 Не є доказом свідомості

Теорема T-11 встановлює, що незалежна інстанціація є найбільш стислим описом. Вона не доводить, що видимі агенти є свідомими. Важка проблема (препринт §8.1) залишається примітивом. Структурний короларій є аргументом стиснення, а не онтологічним доказом — як зазначено в §8.2.

6.4 Зв’язок із T-10

Додаток T-10 (Міжспостерігачевий зв’язок) розглядає те, як два патчі спостерігача підтримують взаємно узгоджені рендери через обмеження стиснення. Цей додаток розглядає інше питання: чому потік одного спостерігача найстисліше кодує видимих агентів як незалежно інстанційованих. T-10 стосується механізму міжпатчевої когерентності; T-11 — сигнатури стиснення в межах одного потоку. T-10 безпосередньо спирається на T-11: те саме порівняння довжин опису в MDL, яке тут установлює перевагу стиснення, у T-10 використовується для доведення того, що міжпатчева неузгодженість експоненційно пригнічується.

§7. Підсумок завершення

Результати T-11

Імпортована лема (збіжність Мюллера). Збіжність Соломонова [61] та її багатоагентне розширення [62] формально імпортовано й переформульовано в нотації OPT. Вони забезпечують математичний каркас: будь-яка підструктура, що несе достатньо даних про власний стан, має еволюцію від першої особи, яка збігається до обчислюваного світу, що породжує її поведінку.
Теорема T-11 (межа стиснення — ЧЕРНЕТКА). Явне двочастинне порівняння MDL показує, що трактування видимих агентів як незалежно інстанційованих первинних спостерігачів дає строго коротший опис, ніж довільна поведінкова специфікація, причому перевага зростає лінійно з часом спостереження.
Короларій T-11a (асимптотичне домінування — ЧЕРНЕТКА). Перевага стиснення є необмеженою за T \to \infty, що робить незалежну інстанціацію переважно MDL-оптимальним описом для будь-якого агента, якого спостерігають упродовж тривалого часового горизонту.
Інтеграція P-4. Феноменальний залишок (\Delta_{\text{self}} > 0) визначено як формальний маркер, що відрізняє видимих агентів від складних, але неагентивних систем, обмежуючи структурний короларій сутностями зі справжньою самореферентною архітектурою вузького місця.
Переінтерпретація Мюллера. Несоліпсистський висновок Мюллера переінтерпретовано в межах онтологічної рамки OPT: той самий математичний результат обґрунтовує аргумент стиснення, а не аргумент виникнення спільної реальності.

Пункти, що залишаються відкритими

Точна характеризація \bar{I}_T. Обмеження \bar{I}_T знизу для конкретних класів агентів (наприклад, агентів з обмеженою раціональністю, мінімізаторів вільної енергії), щоб надати чисельно конкретні переваги стиснення.
Поправки для скінченного часу. Асимптотичний результат (T-11a) гарантує домінування для великих T, але межі для скінченного часу з явними константами посилили б практичну застосовність.
Розширення на небінарний алфавіт. Рівняння (L-1)–(L-3) сформульовано для бінарних послідовностей. Розширення до неперервнозначних мір, релевантних для рамки OPT теорії швидкість-спотворення (T-1), потребує технічної обережності.

Цей додаток підтримується паралельно з theoretical_roadmap.pdf. Посилання: Мюллер [61, 62], Li & Vitányi [45], Соломонов (1964), Теорема T-4 (Додаток T-4), Теорема P-4 (Додаток P-4), препринт §8.2.