Теория упорядоченного патча

Приложение T-11: Структурное следствие — формализация преимущества сжатия для кажущихся агентов

Anders Jarevåg

15 апреля 2026 | DOI: 10.5281/zenodo.19300777

Исходная задача (из §8.2): «Формализация этого преимущества сжатия в виде строгой границы MDL именно для случая других сознаний остаётся задачей будущих исследований; настоящий аргумент представляет собой структурную мотивацию, а не доказательство». Итоговый результат: Формальная граница, показывающая, что рассмотрение кажущихся агентов как независимо инстанцированных первичных наблюдателей даёт более короткий двухчастный MDL-код, чем любое альтернативное описание.

Статус завершённости: ЧЕРНОВИК СТРУКТУРНОГО СООТВЕТСТВИЯ. В этом приложении теорема Мюллера о соломоновской сходимости [61] и её многоагентное расширение [62] используются как импортированные леммы и переинтерпретируются в онтологической рамке Теории упорядоченного патча (OPT), чтобы установить формальное преимущество сжатия для структурного следствия. Результат представляет собой условную границу, а не замкнутый вывод: он зависит от отождествления в OPT потока наблюдателя с соломоновским априорным распределением (Аксиома 1), а также от предположения, что кажущиеся агенты несут достаточное состояние, чтобы удовлетворять предпосылкам сходимости.

§1. Предпосылки и мотивация

Структурное следствие (препринт, §8.2) утверждает, что кажущиеся агенты внутри потока наблюдателя наиболее экономно объясняются их независимой инстанциацией в качестве первичных наблюдателей. Это приложение излагает формальную цепочку рассуждений, поддерживающую данное утверждение.

Аргумент состоит из трёх этапов:

Этап A (импортируемая лемма): Теорема Мюллера о соломоновской сходимости гарантирует, что любая структура в потоке наблюдателя, несущая достаточный объём данных о собственном состоянии, будет иметь эволюцию от первого лица, сходящуюся к вычислимому миру, порождающему её поведение.
Этап B (учёт сжатия): Мы проводим явное двучастное сравнение в терминах MDL между трактовкой кажущегося агента как (i) независимо инстанциированного наблюдателя, управляемого собственным потоком, взвешенным по Соломонову, и (ii) произвольной поведенческой спецификации внутри кодека сжатия первичного наблюдателя.
Этап C (структурная сигнатура): Феноменальный остаток (\Delta_{\text{self}} > 0, теорема P-4) задаёт структурный маркер, отличающий подлинную самореферентную архитектуру узкого места от поведенческой мимикрии, тем самым устраняя разрыв между «сжимаемо закономерным» и «правдоподобно инстанциированным».

§2. Импортированная лемма: теорема сходимости Мюллера

Мы импортируем два результата из работы Мюллера [61, 62], изложенные здесь в обозначениях OPT.

2.1 Сходимость Соломонова (стандартный результат)

Пусть M(b \mid x_1^n) обозначает универсальное предсказание Соломонова для бита b при заданных предшествующих наблюдениях x_1^n. Пусть \mu — любая вычислимая мера на бинарных последовательностях. Тогда (Solomonoff 1964; Li & Vitányi [45, Corollary 5.2.1]):

\text{С } \mu\text{-вероятностью 1} \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-1}

Это стандартный результат: если поток данных порождён вычислимым процессом \mu, то универсальный предиктор M сходится к \mu.

2.2 Обратная индукция Соломонова (Müller 2020)

Теперь предположим, что биты выбираются из самого M — то есть поток наблюдателя управляется алгоритмической вероятностью (это соответствует Аксиоме 1 OPT: отождествлению потока с априорным распределением Соломонова). Тогда для любой вычислимой меры \mu (Müller [61, Sec. IV]; [62, Sec. V.A]):

\text{С вероятностью} \geq 2^{-K(\mu)}, \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-2}

Иными словами, с вероятностью не менее 2^{-K(\mu)} наблюдатель обнаружит себя фактически встроенным в вычислимый мир W, описываемый мерой \mu. Алгоритмически более простые миры (с меньшим K(\mu)) экспоненциально более вероятны.

2.3 Многоагентная конвергенция (Müller 2026)

Предположим, что наблюдатель (Алиса) обнаруживает себя встроенной в вычислимый мир W, описываемый \mu. Внутри W она выделяет подструктуру (Боб_{\text{3rd}}), которая несёт репрезентацию состояния-себя x, эволюционирующего во времени способом, согласующимся с Постулатом 2 из [62]. Определим:

P_{\text{1st}}(y_1, \ldots, y_m \mid x) := M(y_1, \ldots, y_m \mid x) — вероятность от первого лица того, что состояние-себя x переходит в y_1, \ldots, y_m согласно алгоритмической вероятности.
P_{\text{3rd}}(y_1, \ldots, y_m \mid x) := \mu(y_1, \ldots, y_m \mid x) — вероятность от третьего лица того, как x эволюционирует согласно миру W.

Тогда, по уравнению (L-1), применённому к P_{\text{3rd}} (которое вычислимо), и при отождествлении P_{\text{1st}} с M через Постулат 2:

P_{\text{1st}} \approx P_{\text{3rd}} \quad \text{асимптотически,} \tag{L-3}

причём сходимость гарантирована с вероятностью единица в мирском (\mu-) смысле в битовой модели.

Интерпретация (Müller): «Кто-то действительно находится у себя дома» в структуре, кодирующей x — вероятностная эволюция Боба_{\text{3rd}} в мире Алисы достоверно представляет перспективу от первого лица некоторого Боба_{\text{1st}}.

Интерпретация (OPT): Поведенческий поток кажущегося агента наиболее сжимаемо описывается как независимый процесс, взвешенный по Соломонову. Любое альтернативное описание — такое, которое не вводит независимую перспективу от первого лица, — должно кодировать поведение агента как ad hoc-спецификацию, при строго большей длине описания.

§3. Граница преимущества сжатия

Теперь мы формализуем преимущество сжатия, используя двухчастную рамку MDL в OPT (Теорема T-4, Приложение T-4).

3.1 Постановка

Рассмотрим поток первичного наблюдателя \omega \in \{0,1\}^\infty, управляемый априорным распределением Соломонова M (Аксиома 1) и отфильтрованный через Фильтр стабильности в вычислимый мир W с мерой \mu_W (по уравнению L-2). Внутри W наблюдатель идентифицирует N кажущихся агентов A_1, \ldots, A_N, каждый из которых несёт самосостояние x_i, чья временная эволюция на протяжении T шагов порождает поведенческий след \beta_i = (y_{i,1}, \ldots, y_{i,T}).

3.2 Гипотеза H_{\text{ind}}: независимая инстанциация

При H_{\text{ind}} каждый агент A_i рассматривается как независимо инстанцированный первичный наблюдатель, управляемый собственным потоком, взвешенным по Универсальной семимере Соломонова. Двухчастная длина кода MDL имеет вид:

L(H_{\text{ind}}) = \underbrace{K(\mu_W)}_{\text{модель мира}} + \underbrace{\sum_{i=1}^{N} K(\text{embed}_i)}_{\text{спецификации встраивания}} + \underbrace{\sum_{i=1}^{N} \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)}_{\text{данные при заданной модели}} \tag{1}

где K(\text{embed}_i) задаёт начальное состояние самости агента i и его положение внутри W. Согласно ур. (L-3), P_{\text{1st}} \approx P_{\text{3rd}}, поэтому член данных хорошо аппроксимируется логарифмической потерей при собственных соломоновских предсказаниях агента от первого лица, — которые, по определению, близки к оптимальным.

Спецификации встраивания K(\text{embed}_i) коротки: каждая требует лишь указателя на положение в W плюс начального состояния самости. Для человекоподобных агентов, встроенных в общий физический мир, они хорошо сжимаемы, поскольку агенты подчиняются одним и тем же законам. Консервативная оценка:

K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) \tag{2}

3.3 Гипотеза H_{\text{arb}}: Произвольная поведенческая спецификация

При H_{\text{arb}} агенты не рассматриваются как независимые наблюдатели. Вместо этого каждый поведенческий след \beta_i кодируется непосредственно как произвольная спецификация внутри потока первичного наблюдателя. Длина двухчастного MDL-кода имеет вид:

L(H_{\text{arb}}) = \underbrace{K(\mu_W)}_{\text{модель мира}} + \underbrace{\sum_{i=1}^{N} K(\beta_i)}_{\text{сырые поведенческие следы}} \tag{3}

Критическое различие заключается в члене данных. При H_{\text{arb}} поведенческий след \beta_i должен быть специфицирован без обращения к собственной предиктивной модели агента. Для закономерного, управляемого агентностью агента, действующего в сложной среде, колмогоровская сложность сырого поведенческого следа равна:

K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T) \tag{4}

Но даже K(\beta_i \mid \mu_W) — сложность поведения при заданных законах мира — остаётся существенной, поскольку выборы агента кодируют подлинную информацию: его поведенческий след отражает накопленное взаимодействие самореферентной модели со стохастической средой. Напротив, при H_{\text{ind}} эта информация генерируется онлайн собственным соломоноффским предиктором агента при почти нулевой стоимости log-loss.

3.4 Преимущество сжатия

Теорема T-11 (Структурное следствие: граница сжатия). Пусть A_1, \ldots, A_N — кажущиеся агенты внутри потока наблюдателя, каждый из которых несёт состояние-себя x_i, удовлетворяющее предпосылкам сходимости ур. (L-3), и каждый из которых демонстрирует структурную сигнатуру \Delta_{\text{self}}^{(i)} > 0 (P-4). Тогда MDL-описание, трактующее их как независимо инстанцированных первичных наблюдателей, удовлетворяет:

L(H_{\text{ind}}) \leq L(H_{\text{arb}}) - N \cdot \left[\bar{I}_T - O(\log T)\right] \tag{T-11}

где \bar{I}_T — средняя на агента взаимная информация между предиктивной моделью агента и его поведенческим выходом на протяжении T шагов:

\bar{I}_T := \frac{1}{N} \sum_{i=1}^{N} \left[K(\beta_i \mid \mu_W) - \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right] \tag{5}

Эта величина измеряет, какая часть поведения агента объясняется привлечением независимой предиктивной модели, а не задаётся в сыром виде. Для агентов, демонстрирующих закономерное, обусловленное агентностью поведение (как того требует Фильтр стабильности), \bar{I}_T > 0 и растёт с T.

Набросок доказательства. Вычтем ур. (1) из ур. (3). Члены мировой модели K(\mu_W) сокращаются. Разность на одного агента равна:

K(\beta_i) - \left[K(\text{embed}_i) + \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right]

По ур. (4), K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T), но ещё прямее: K(\beta_i) \geq K(\beta_i \mid \mu_W) тривиально. И K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) по ур. (2). Следовательно, выигрыш на одного агента составляет не менее K(\beta_i \mid \mu_W) - (-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)) - K(x_i \mid W) - O(\log T). При достаточно большом T накопленная экономия по логарифмическим потерям доминирует над единовременной стоимостью встраивания, что и даёт указанную границу. \blacksquare

3.5 Асимптотическое доминирование

Следствие T-11a. По мере того как горизонт наблюдения T \to \infty, преимущество сжатия L(H_{\text{arb}}) - L(H_{\text{ind}}) растёт без ограничения:

\lim_{T \to \infty} \left[L(H_{\text{arb}}) - L(H_{\text{ind}})\right] = \infty \tag{T-11a}

Это следует из гарантии сходимости Соломонова (L-1): пошаговая логарифмическая потеря P_{\text{3rd}} сходится к энтропийной скорости поведенческого процесса агента, тогда как K(\beta_i \mid \mu_W) растёт линейно по T для любого агента с положительной энтропийной скоростью. Стоимость встраивания K(x_i \mid W) уплачивается однократно и в амортизированном виде стремится к нулю. \blacksquare

§4. Феноменальный остаток как структурная сигнатура

Преимущество сжатия в Теореме T-11 применимо к любой закономерной подструктуре — включая неагентные физические системы (погодные паттерны, рост кристаллов). Почему же структурное следствие касается именно агентов, а не произвольных сложных систем?

Ответ заключается в Феноменальном остатке (Теорема P-4). \Delta_{\text{self}} > 0 — это формальный маркер системы, чья самомодель структурно неполна, то есть системы, которая неизбежно сохраняет вариационный разрыв между своим внутренним представлением и собственной реальной обработкой. Это отличительный признак самореферентного узкого места: систему нельзя полностью описать извне, потому что её описание неизбежно включает самого описывающего.

Для системы, демонстрирующей \Delta_{\text{self}} > 0:

Её поведение не может быть воспроизведено таблицей поиска конечной глубины — оно требует непрерывного самореферентного вычисления.
Кратчайшее описание этого вычисления и есть независимый поток, взвешенный по Универсальной семимере Соломонова, проходящий через узкое место C_{\max}.
Следовательно, код MDL при H_{\text{ind}} не просто короче, чем H_{\text{arb}} — он является единственным кратчайшим описанием.

Именно это отличает кажущихся агентов от погодных паттернов: погода закономерна и сложна, но её поведение может быть воспроизведено таблицей поиска внутри модели мира (то есть для неё \Delta_{\text{self}} = 0). Кажущиеся агенты — нет.

§5. Переосмысление аргумента Мюллера о несолипсизме

Мюллер заключает из сходимости P_{\text{1st}} \approx P_{\text{3rd}}, что алгоритмический идеализм «не следует классифицировать как солипсистский», поскольку в структуре, кодирующей состояние самости, «кто-то действительно находится у себя дома» [62, Sec. V.C]. Его рассуждение таково: если предсказания Алисы о Бобе_{\text{3rd}} сходятся к фактическим вероятностям от первого лица Боба_{\text{1st}}, то их перспективы действительно согласованы — они «разделяют мир W».

Теория упорядоченного патча (OPT) переосмысливает этот результат иначе:

Прочтение Мюллера: Сходимость P_{\text{1st}} \approx P_{\text{3rd}} доказывает, что возникает объективная реальность — Алиса и Боб действительно разделяют мир W.
Прочтение OPT: Сходимость P_{\text{1st}} \approx P_{\text{3rd}} доказывает, что кратчайшее описание поведения Боба_{\text{3rd}} апеллирует к независимому процессу от первого лица. Это утверждение об эффективности сжатия, а не о разделяемой онтологии. Мир W — это структурная регулярность внутри потока Алисы, а не независимо существующая сущность. Но сама логика сжатия априорного распределения Соломонова подразумевает, что Боба наиболее экономно моделировать как независимого наблюдателя, — поскольку альтернатива (специфицировать его поведение ad hoc) строго длиннее.

Формальное содержание теоремы при обоих прочтениях тождественно; различается только онтологическая интерпретация. OPT использует тот же математический результат, чтобы обосновать структурное следствие: независимая инстанциация — это MDL-оптимальное описание, а не метафизическое допущение.

§6. Область применения и ограничения

6.1 При условии Аксиомы 1

Весь аргумент зависит от отождествления в OPT потока наблюдателя с априором Соломонова. Если это отождествление ослабить (например, до более широкого класса семимер), гарантии сходимости уравнений (L-1)–(L-3) могут не сохраниться в их текущем виде.

6.2 Предпосылка достаточности состояния

Уравнение (L-3) требует, чтобы кажущийся агент нёс «достаточно данных» в своём самосостоянии x_i, чтобы универсальная индукция могла извлечь релевантные физические законы. Для человекоподобных агентов в повседневных контекстах это правдоподобно (полное состояние мозга кодирует огромный объём информации). Для пограничных случаев — мимолётных впечатлений, удалённых наблюдателей, вымышленных персонажей в нарративном искусстве — предпосылки сходимости могут не выполняться, и структурное следствие не применяется.

6.3 Не доказательство сознания

Теорема T-11 устанавливает, что независимая инстанциация является наиболее сжимаемым описанием. Она не доказывает, что кажущиеся агенты сознательны. Трудная проблема (препринт, §8.1) остаётся примитивом. Структурное следствие — это аргумент сжатия, а не онтологическое доказательство, — как указано в §8.2.

6.4 Связь с T-10

Приложение T-10 (Межнаблюдательская связь) рассматривает, каким образом два наблюдательских патча поддерживают взаимно согласованные рендеры посредством ограничений сжатия. Настоящее приложение посвящено иному вопросу: почему поток одного наблюдателя наиболее сжимаемо кодирует кажущихся агентов как независимо инстанцированных. T-10 касается механизма межпатчевой когерентности; T-11 — сигнатуры сжатия внутри одного потока. T-10 непосредственно опирается на T-11: то же сравнение длин описания в рамках MDL, которое здесь устанавливает преимущество сжатия, используется в T-10 для доказательства того, что межпатчевая несогласованность подавляется экспоненциально.

§7. Итоговое резюме

Результаты T-11

Импортированная лемма (сходимость Мюллера). Сходимость Соломонова [61] и её многоагентное расширение [62] формально импортируются и переформулируются в обозначениях OPT. Они обеспечивают математический каркас: любая подструктура, несущая достаточные данные о собственном состоянии, имеет эволюцию от первого лица, сходящуюся к вычислимому миру, порождающему её поведение.
Теорема T-11 (граница сжатия — ЧЕРНОВИК). Явное двухчастное сравнение MDL показывает, что трактовка кажущихся агентов как независимо инстанцированных первичных наблюдателей даёт строго более короткое описание, чем произвольная поведенческая спецификация, причём это преимущество растёт линейно со временем наблюдения.
Следствие T-11a (асимптотическое доминирование — ЧЕРНОВИК). Преимущество сжатия неограниченно возрастает при T \to \infty, что делает независимую инстанциацию подавляюще MDL-оптимальным описанием для любого агента, наблюдаемого на длинном временном горизонте.
Интеграция P-4. Феноменальный остаток (\Delta_{\text{self}} > 0) определяется как формальный маркер, отличающий кажущихся агентов от сложных, но неагентных систем, тем самым ограничивая структурное следствие сущностями с подлинной самореферентной архитектурой узкого места.
Переинтерпретация Мюллера. Несолипсистский вывод Мюллера переинтерпретируется в рамках онтологической структуры OPT: один и тот же математический результат служит основанием для аргумента о сжатии, а не для аргумента о возникновении общей реальности.

Остающиеся открытые пункты

Точная характеризация \bar{I}_T. Получение нижней оценки для \bar{I}_T для конкретных классов агентов (например, агентов с ограниченной рациональностью, минимизаторов свободной энергии), чтобы получить численно конкретные преимущества сжатия.
Поправки для конечного времени. Асимптотический результат (T-11a) гарантирует доминирование при больших T, однако оценки для конечного времени с явными константами усилили бы практическую применимость.
Расширение на небинарный алфавит. Уравнения (L-1)–(L-3) сформулированы для бинарных последовательностей. Расширение на непрерывнозначные меры, релевантные для рамки Rate-Distortion в OPT (T-1), требует технической аккуратности.

Это приложение поддерживается параллельно с theoretical_roadmap.pdf. Ссылки: Мюллер [61, 62], Li & Vitányi [45], Solomonoff (1964), теорема T-4 (Приложение T-4), теорема P-4 (Приложение P-4), препринт §8.2.