Теория упорядоченного патча

Приложение T-4: MDL / сравнение по экономности

Anders Jarevåg

v2.0.0 — 2 апреля 2026 | DOI: 10.5281/zenodo.19300777

Исходная задача T-4: Сравнение MDL / экономии описания Проблема: В актуальном препринте заявляется преимущество по экономии описания над стандартной физикой за счёт трактовки физических законов как макроскопических алгоритмов сжатия, однако формальное сравнение в терминах MDL не приводится. Результат: Сравнительный MDL-анализ Теории упорядоченного патча (OPT) и эталонных классов физических моделей при явно заданных соглашениях о кодировании.

Статус закрытия: ЗАКРЫТО (при условии типичности и нормализации IC). В этом приложении приводится формальная MDL-оценка, требуемая задачей T-4. Зафиксированы три эталонных класса моделей с явными соглашениями о кодировании. Установлены четыре теоремы и одна гипотеза: (T-4a) правило селектора OPT имеет длину описания \mathcal{O}(1); (T-4b) доминирование Соломонова ограничивает сверху log-loss OPT; (Гипотеза T-4c) предполагаемым источником структурного преимущества OPT является сжатие начальных условий; (T-4d) OPT достигает постоянного преимущества в сложности модели на уровне константного числа битов по сравнению с любым вычислимым эталоном; (T-4e) преимущество при конечном T условно квантифицировано. Закрытие опирается на три несущих условия: типичность потока наблюдателя, поглощение штрафа нормализации Соломонова \log(1/\xi(\mathcal{O})) и выполнение условия K(\text{IC} \mid \text{SP}) > K_0.


§1. Фиксация соглашений кодирования MDL

Сравнения MDL бессмысленны без явных, фиксированных соглашений кодирования. В §5.1 препринта это требование отмечено, но отложено. Здесь мы фиксируем соглашения, следуя Rissanen (1978) [12] и двухчастной рамке MDL у Li & Vitányi (2008) [27].

1.1 Двухчастная длина кода

Для класса гипотез \mathcal{M} и последовательности наблюдений y_{1:T} \in \{0,1\}^* двухчастная длина кода MDL имеет вид:

L_T(\mathcal{M}) = K(\mathcal{M}) + L(y_{1:T} \mid \mathcal{M}) \tag{preprint §5.1, Eq. 13}

где K(\mathcal{M}) — это префиксная колмогоровская сложность гипотезы, то есть длина кратчайшей самоделимитирующейся программы на фиксированной универсальной машине Тьюринга (UTM), которая выводит полное описание \mathcal{M}, — а L(y_{1:T} \mid \mathcal{M}) есть отрицательное логарифмическое правдоподобие данных при наилучшей предиктивной модели в рамках \mathcal{M}:

L(y_{1:T} \mid \mathcal{M}) = -\log_2 P_\mathcal{M}(y_{1:T})

Для детерминистических теорий (законы + IC однозначно определяют наблюдения) L(y_{1:T} \mid \mathcal{M}) = 0, когда y согласуется с теорией, и L = \infty в противном случае. Все логарифмы берутся по основанию 2; все длины кода — в битах.

1.2 Универсальная машина

Мы фиксируем одну оптимальную UTM \mathcal{U} на всём протяжении изложения. Все сложности Колмогорова задаются относительно \mathcal{U}; при ином выборе UTM результаты меняются не более чем на \mathcal{O}(1) бит. Мера Соломонова \xi определяется относительно \mathcal{U} (препринт, ур. 1). Это фиксирует соглашение для всех последующих сравнений.

1.3 Область действия y_{1:T}

Мы сравниваем модели на той области, для предсказания которой каждая из них была разработана: на сознательном потоке наблюдателя y_{1:T} = z_{0:T} (последовательности сжатых латентных состояний, по C_{\max} бит в секунду на протяжении T секунд). Стандартная физика оценивается на той же области путём сведения её предсказаний к совместимому с наблюдателем потоку через огрубление. От обеих теорий требуется объяснить в точности одни и те же наблюдения.


§2. Эталонные классы моделей

Фиксируются три эталонных класса. Каждому присваивается явная оценка K(\mathcal{M}) в рамках нашей UTM-конвенции. Точные численные значения являются оценками по порядку величины; структурные результаты в §§3–7 зависят только от упорядочения, а не от точных значений.

2.1 \mathcal{M}_1 — Стандартная модель + общая теория относительности

Наиболее предсказательно точная физическая теория, доступная в настоящее время. Её описание требует трёх компонентов:

K(\mathcal{M}_1) = K_{\text{struct}} + K_{\text{param}} \approx 1750 \text{ bits}

K(\text{IC} \mid \mathcal{M}_1) \approx 300 \text{ bits (inflationary)}

2.2 \mathcal{M}_2 — Общая перенормируемая КТП

Класс всех перенормируемых квантовых теорий поля в \leq 4 пространственно-временных измерениях. Этот класс содержит \mathcal{M}_1 как один из своих элементов. Поскольку необходимо также задать калибровочную группу и состав частиц:

K(\mathcal{M}_2) \gg K(\mathcal{M}_1) \gg 1750 \text{ bits}

\mathcal{M}_2 включена как контрастный фон для утверждения OPT о том, что законы выбираются, а не перечисляются. Хотя сравнение по MDL с \mathcal{M}_2 тривиально выигрывается любым конечным подклассом (включая \mathcal{M}_1), поскольку K(\mathcal{M}_2) не ограничена, её включение формально служит демонстрацией бесконечного масштаба проблемы выбора параметров, которую Фильтр стабильности естественным образом схлопывает.

2.3 \mathcal{M}_3 — Мозг Больцмана / тепловая флуктуация

Стандартная физика с максимально простыми начальными условиями: тепловое состояние (состояние максимальной энтропии) на планковском масштабе. Законы идентичны \mathcal{M}_1; начальные условия тривиально просты:

K(\mathcal{M}_3) \approx K(\mathcal{M}_1) \approx 1750 \text{ bits}, \qquad K(\text{IC} \mid \mathcal{M}_3) \approx 10 \text{ bits}

Однако логарифм правдоподобия наблюдения упорядоченного потока сознания y_{1:T} при \mathcal{M}_3 астрономически мал: L(y_{1:T} \mid \mathcal{M}_3) \approx K(y_{1:T}) \gg T \cdot C_{\max}. Следовательно, у \mathcal{M}_3 пренебрежимо малая стоимость IC, но катастрофическая стоимость по правдоподобию; эта модель включена, чтобы показать, что преимущество OPT по MDL достигается не за счёт того же самого приёма.


§3. Длина кода OPT — Теорема T-4a

MDL-длина кода для OPT разлагается следующим образом:

L_T(\text{OPT}) = K(\xi, \text{Filter}) + L(y_{1:T} \mid \xi, \text{Filter}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

где \xi^{\text{Filter}} — это мера Соломонова \xi, обусловленная на классе \mathcal{O}, совместимом с наблюдателем (потоки, удовлетворяющие R_{\text{req}} \leq B_{\max}), а K_0 = K(\xi, \text{Filter}) — это длина описания правила селекции.

Теорема T-4a (Ограничение сложности метаправила). K(\xi, \text{Filter}) = K_0 = \mathcal{O}(1) бит. В частности:

K_0 \leq K(\mathcal{U}) + K(C_{\max}) + K(\Delta t) + c

где K(\mathcal{U}) — сложность UTM, K(C_{\max}) = \mathcal{O}(\log C_{\max}) бит кодирует порог пропускной способности с экспериментальной точностью, K(\Delta t) = \mathcal{O}(\log \Delta t) кодирует окно обновления, а c — малая универсальная константа.

Доказательство. Мера Соломонова \xi однозначно определяется фиксированной UTM \mathcal{U}, поэтому K(\xi \mid \mathcal{U}) = \mathcal{O}(1). Фильтр стабильности требует двух параметров: C_{\max} и \Delta t, каждый из которых измеряется с точностью до \sim 4 значащих цифр, так что K(C_{\max}, \Delta t) \leq 2 \times (4 \times \log_2 10) \approx 26 бит. Условие R_{\text{req}} \leq B_{\max} представляет собой одно неравенство в фиксированной нотации: \sim 10 бит. Итого: K_0 \leq K(\mathcal{U}) + 36 бит.

Чтобы корректно учесть K(\mathcal{U}), мы должны предположить «эпистемически нейтральную» UTM — то есть референсную машину, чей встроенный набор инструкций не кодирует никакую физическую теорию привилегированным образом (то есть базовую геометрию комбинаторов или эквивалент Brainfuck, полностью агностичную по отношению к физике). При такой непредвзятой машине допустимо сохранять K(\xi, \text{Filter}) \approx 36 бит при стандартизации K(\mathcal{M}_1) \approx 1750 бит. Мы специально отмечаем, что это делает абсолютное число бит уязвимым к масштабированию на константу \mathcal{O}(1) при смене UTM, а значит, вычисление 36 против 1750 по своей природе является относительным. Структурно честная математическая формулировка здесь — это ранжирование (K_0 \ll K(\mathcal{M}_1)), утверждающее устойчивое структурное преимущество, независимое от точного численного значения константы. \blacksquare

Сравнение: Если исключить общий накладной расход UTM, то K_0 \approx 36 бит против K(\mathcal{M}_1) \approx 1750 бит. Правило селекции OPT короче описания Стандартной модели на K(\mathcal{M}_1) - K_0 \approx 1714 бит. Именно это структурное преимущество в экономии описания и утверждается в §5 препринта — теперь с явным подсчётом бит.


§4. Граница доминирования Соломонова — Теорема T-4b

Теорема T-4b (Граница доминирования Соломонова). Для любой вычислимой меры физики \nu (включая \mathcal{M}_1, \mathcal{M}_2, \mathcal{M}_3) с K(\nu) < \infty и для любого потока данных y_{1:T}:

L_T(\text{OPT}) \leq L_T(\nu) + K'_0

где K'_0 = K_0 + \log(1/\xi(\mathcal{O})). Это выражает базовую сложность правила плюс необходимый штраф алгоритмической нормализации, возникающий при условливании универсальной меры на класс наблюдателей \mathcal{O}.

Доказательство. Из определения Универсальной семимеры Соломонова (препринт, ур. 1), при w_\nu \asymp 2^{-K(\nu)}:

\xi(y_{1:T}) \geq w_\nu \cdot \nu(y_{1:T}) \geq 2^{-K(\nu)} \cdot \nu(y_{1:T})

Беря отрицательные логарифмы, получаем:

-\log \xi(y_{1:T}) \leq -\log \nu(y_{1:T}) + K(\nu)

При переходе от универсальной меры \xi к ограниченному фильтру \xi^{\text{Filter}} мы платим цену нормализации -\log \xi^{\text{Filter}}(y) = -\log \xi(y) + \log(1/\xi(\mathcal{O})). Подставляя это в L_T(\text{OPT}):

L_T(\text{OPT}) = K_0 - \log \xi^{\text{Filter}}(y_{1:T}) \leq K_0 + \log(1/\xi(\mathcal{O})) + K(\nu) - \log \nu(y_{1:T}) = K'_0 + L_T(\nu) \qquad \blacksquare

Важная оговорка. Теорема T-4b не показывает, что OPT превосходит SP. Она показывает, что OPT не может оказаться хуже любого эталона более чем на K'_0 бит. Далее мы поглощаем \log(1/\xi(\mathcal{O})) в K_0, предполагая, что класс последовательностей наблюдателя чисто ограничивается относительно структурных констант UTM, однако отмечаем этот разрыв нормализации как формальную уязвимость.


§5. Сжатие начальных условий — Теорема T-4c

Структурный источник MDL-преимущества OPT — это сжатие начальных условий. В стандартной физике законы и начальные условия — отдельные объекты, оба из которых должны быть описаны. В OPT начальные условия поглощаются приором: мера Соломонова уже приписывает наибольший вес простейшим наблюдатель-совместимым потокам, делая отдельную спецификацию IC избыточной.

5.1 Аргумент об избыточности IC

В рамках стандартной физики (\mathcal{M}_1) полный код MDL для детерминистской теории имеет вид:

L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) + 0 \qquad \text{[детерминистская: } -\log P = 0 \text{ при согласованности]}

Член IC, K(\text{IC} \mid \text{laws}), — это длина описания конкретных начальных условий при заданных законах; он не выводится из самих законов. Именно здесь локализуется тонкая настройка.

В рамках OPT двухчастный код имеет вид:

L_T(\text{OPT}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

Член -\log \xi^{\text{Filter}}(y_{1:T}) кодирует конкретный поток при заданном метаправиле. Априор Соломонова уже включает универсальную модель физики: -\log \xi(y) \approx K(y). Кодирование в OPT никогда не требует отдельно платить за IC.

Гипотеза T-4c (эвристическая граница сжатия IC). Определим преимущество сжатия IC:

\Delta_{\text{IC}} = K(\text{IC} \mid \text{SP laws}) - K(\text{IC} \mid \text{OPT})

Мы утверждаем следующую эвристическую границу:

\boxed{L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1)}

где K(\text{IC} \mid \text{OPT}) := K(\text{IC} \mid \xi, \text{Filter}, \text{codec}) — это остаточная длина описания начальных условий при задании полной модели OPT. \Delta_{\text{IC}} \geq 0, причём равенство имеет место тогда и только тогда, когда Фильтр стабильности не даёт никакого дополнительного сжатия IC сверх того, что уже обеспечивают законы.

Аргумент. Исходя из полного двухчастного кода для SP и применяя доминирование Соломонова (поглощая константы нормировки в ограничивающий член \mathcal{O}(1), зависящий от UTM):

L_T(\text{OPT}) \leq K_0 + K(\text{laws}) + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) + \mathcal{O}(1)

Перегруппировывая и подставляя L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) (детерминистская теория), получаем:

L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 + \mathcal{O}(1)

В рамках OPT член -\log \xi^{\text{Filter}}(y_{1:T}) не обязан по отдельности кодировать IC: Фильтр осуществляет отбор из априора Соломонова, который по самой своей природе сжимает IC через весовые коэффициенты длины. Субаддитивность AIT гарантирует, что K(\text{IC} \mid x, f(x)) \leq K(\text{IC} \mid x) + \mathcal{O}(1). Если постулировать, что правило отбора в OPT задаёт более компактную описательную строку, чем простое объявление сырых законов (в этом и состоит центральная ставка данного подхода, а не математически выведенное доказательство), то остаточно закодированная величина K(\text{IC} \mid \text{OPT}) не может существенно превышать K(\text{IC} \mid \text{laws}). Эвристически отсюда следует, что \Delta_{\text{IC}} \geq 0.

Подстановкой получаем: L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1). \blacksquare

Замечание. Мы выдвигаем гипотезу, что антропное сжатие K(\text{IC} \mid \text{OPT}) \approx 0 реализуется в пределе, где Фильтр стабильности является сильно ограничивающим, отображая математически в единственные состояния, совместимые с наблюдателем. Это мотивированное физическое предположение, а не алгоритмически доказанная граница единственности.


§6. Преимущество сложности модели с постоянным числом бит — Теорема T-4d

Теорема T-4d (Постоянное преимущество MDL с фиксированным числом бит — при условии типичности). Для любой фиксированной нетривиальной вычислимой физической модели \nu с K_0 < K(\nu) < \infty формулировка OPT обеспечивает фиксированное, постоянное преимущество по сложности модели именно для любого y_{1:T} \in \mathcal{O}, которое также является \nu-типичным. По мере того как длина последовательности T \to \infty, разность полной длины кода структурно ограничена:

L_T(\text{OPT}) - L_T(\nu) \to K_0 - K(\nu)

Доказательство. Из T-4b следует, что L_T(\text{OPT}) \leq K'_0 - \log \xi^{\text{Filter}}(y_{1:T}). Для любой вычислимой \nu теорема Соломонова гарантирует, что \xi сходится к \nu именно на \nu-типичных последовательностях, то есть для \nu-почти всех y_{1:\infty}. Здесь важно отметить глубокое формальное напряжение: Фильтр стабильности выделяет потоки, которые строго оцениваются как низкоэнтропийные и структурированные, тем самым структурно отображая их как нетипичные по сравнению со стандартными неограниченными потоками меры \nu с максимальной энтропией. Если только между отфильтрованным классом наблюдателей \mathcal{O} и классом \nu-типичных последовательностей не существует демонстрируемого нетривиального математического пересечения, предел сходимости Соломонова не может быть непосредственно использован. Следовательно, эта теорема применима условно тогда и только тогда, когда конкретный отфильтрованный поток наблюдателя остаётся \nu-типичным относительно конкретных эталонных законов (при этом множество таких теоретически допустимых пересекающихся потоков формально остаётся неохарактеризованным):

-\frac{1}{T} \log \xi(y_{1:T}) \to H(\nu) \quad \text{as } T \to \infty

где H(\nu) — энтропийная скорость \nu. Аналогично, -\frac{1}{T} \log \nu(y_{1:T}) \to H(\nu). Асимптотически члены логарифмических потерь на бит, соответствующие правдоподобию, сходятся и становятся равными, так что оставшееся преимущество по полной длине кода сводится исключительно к длине описания модели:

\left[L_T(\text{OPT}) - L_T(\nu)\right] \to K_0 - K(\nu) < 0 \qquad \text{[since } K_0 \approx 36 \text{ vs } K(\nu) \sim 1750 \text{]}

Замечание: хотя полная длина кода сохраняет это постоянное преимущество в фиксированном числе бит, преимущество на бит (\frac{K_0 - K(\nu)}{T}) действительно стремится к нулю. Это не означает асимптотически непрерывно растущего преимущества за счёт накопления данных, а лишь постоянное жёсткое структурное смещение. \blacksquare

Численная оценка для \mathcal{M}_1: K(\mathcal{M}_1) - K_0 \approx 1714 бит. Как только логарифмические потери правдоподобия сходятся на достаточно длинных окнах \nu-типичных наблюдений, OPT сохраняет постоянное математическое превосходство по полной длине кодирования примерно в 1714 бит.


§7. Конечное-T условное преимущество — Теорема T-4e

Для потоков конечной длины сравнение MDL требует, чтобы преимущество сжатия IC из T-4c превышало накладные расходы K_0.

Теорема T-4e (Конечное-T условное MDL-преимущество). Теория упорядоченного патча (OPT) достигает строгого конечного-T MDL-преимущества над \mathcal{M}_1 — то есть L_T(\text{OPT}) < L_T(\mathcal{M}_1) — тогда и только тогда, когда выполняется следующее условие:

\boxed{K(\text{IC} \mid \text{SP laws}) > K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y_{1:T}) - \left(-\log P_{\text{SP}}(y_{1:T})\right)\right]}

Скобка в правой части представляет собой дефицит лог-правдоподобия OPT относительно SP на конкретном потоке y_{1:T}. Условие выполняется всякий раз, когда стоимость описания IC превышает совокупные накладные расходы метаправила и дефицит предсказания OPT на данном потоке.

Доказательство. Непосредственное преобразование длин двухчастного кода:

L_T(\text{OPT}) < L_T(\text{SP}) \iff \quad K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) - \log \xi^{\text{Filter}}(y) < K_{\text{laws}} + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) \iff \quad K(\text{IC} \mid \text{laws}) - K_0 > \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] + \left[K_{\text{laws}} - K_{\text{laws}}\right]

После перегруппировки (K_{\text{laws}} сокращается по обеим сторонам) непосредственно получаем сформулированное условие. \blacksquare

7.1 Оценка условия для стандартной космологии

При инфляционном кодировании (наиболее благоприятный случай для SP):

Следовательно, условие сводится к K(\text{IC} \mid \text{SP laws}) > K_0, то есть 300 > 36. Это выполняется с существенным структурным запасом. Условие нарушается только в том случае, если IC требует менее чем \sim 36 бит — то есть если конкретное IC нашей вселенной структурно выводимо из одних лишь законов SP с остатком менее 36 бит. Ни одна современная космологическая модель этого не достигает.


§8. Сравнительная таблица MDL

Модель K(\mathcal{M}) (биты) K(\text{IC}\mid\mathcal{M}) (биты) -\log P(y\mid\mathcal{M}) L_T всего Ранг MDL
\mathcal{M}_1 — SM + GR \sim 1750 \sim 300 (инфляционный) \sim 0 (детерминированный) \sim 2050 2-е место (инфляционный)
\mathcal{M}_3 — Больцман \sim 1750 \sim 10 \gg 0 (редкий поток) \gg 1760 Последнее место (катастрофическое правдоподобие)
\mathcal{M}_{\text{OPT}} — OPT \sim 36 \sim 0 (условно, через сильно ограниченный Фильтр) \sim 0^* (детерминистическая аппроксимация кодека) \sim 36 (условно) 1-е место (условно)

^* При явной идентификации кодека в §9.2 активный член данных в OPT сводится к -\log P_{K_\theta}(y) = -\log P_\text{SP}(y) = 0 после отождествления K_\theta с кодеком SP.


§9. Пределы сравнения

9.1 K(y \mid \text{Filter}) невычислимо

Длина кода OPT K_0 + K(y \mid \text{Filter}) = K_0 - \log \xi^{\text{Filter}}(y) содержит член, который невычислим в смысле Тьюринга (проблема остановки не позволяет вычислить \xi точно). На практике предсказания OPT должны аппроксимироваться конечным кодеком K_\theta — что и соответствует стандартной физике. Это означает, что для предиктивных целей OPT сводится к лучшему доступному вычислимому кодеку. Следовательно, преимущество OPT над SP в терминах MDL является структурным преимуществом (в описании правила селекции), а не операционным преимуществом в получении новых предсказаний.

Это не изъян — это и есть корректное формальное содержание утверждения препринта: «OPT переносит часть объяснительной нагрузки с перечисления законов на отбор законов». Этот сдвиг реален и формально квантифицирован (\approx 1700 бит для правила селекции по сравнению с \mathcal{M}_1), однако он не порождает нового предиктивного содержания сверх того, что уже обеспечивает кодек.

9.2 Проблема идентификации кодека

OPT-кодек K_\theta — это конкретная вычислимая мера из \mathcal{M}, которую выбирает Фильтр стабильности. T-4 не определяет, какая именно это мера, — такая идентификация требует T-5 (восстановления констант) и полной программы физического объединения. Пока K_\theta не будет явно отождествлён со SM + GR, сравнение по MDL остаётся условным относительно этой идентификации. Формальная граница L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 гарантирует, что Теория упорядоченного патча (OPT) не может показать результат хуже, чем SP, но не гарантирует, что она покажет лучший результат за конечное время, если не выполнено условие IC из T-4e, — а оно выполнено при стандартных космологических предпосылках.

Ограничение из P-2. Приложение P-2 (вложение гильбертова пространства через квантовую коррекцию ошибок) устанавливает, что при локальном шуме кодек должен удовлетворять структуре QECC — его внутреннее представление должно образовывать квантовый код коррекции ошибок с конкретными параметрами (n, k, d). Это сужает проблему идентификации кодека: K_\theta больше не является произвольной вычислимой мерой, а представляет собой меру, чьи предиктивные состояния несут геометрию исправления ошибок гильбертова пространства. Это ограничение предшествует программе восстановления констант T-5 и может предоставить дополнительные критерии отбора для отождествления K_\theta со Стандартной моделью.


§10. Итоговое резюме

Результаты T-4 — подтверждённо закрыты (с условиями нормализации и типичности)

  1. Конвенции кодирования зафиксированы (§1). Двухчастный MDL, префиксная колмогоровская сложность относительно инклюзивной фиксированной UTM, с функциональным отображением области данных на поток сознания y_{1:T} = z_{0:T}.

  2. Классы бенчмарков зафиксированы (§2). Оценивает \mathcal{M}_1 (SM+GR) в сопоставлении с тривиальными границами вроде \mathcal{M}_2 (выбор параметров со взрывающейся генеративной областью) и \mathcal{M}_3 (коллапс правдоподобия Больцмана).

  3. T-4a (Сложность метаправила). K(\xi, \text{Filter}) = K_0 \approx 36 бит, включая смещения относительно UTM.

  4. T-4b (Ограниченность по Соломонову). L_T(\text{OPT}) \leq L_T(\nu) + K_0 + \log(1/\xi(\mathcal{O})). Явно определяет параметр алгоритмического штрафа за нормализацию.

  5. Гипотеза T-4c (эвристическая граница IC-компрессии). Структурная избыточность начальных условий является предполагаемым механизмом сжатия: \Delta_{\text{IC}} = K(\text{IC}\mid\text{SP}) - K(\text{IC}\mid\text{OPT}) \geq 0, хотя уникальность отображения носит условный характер. Это служит эвристической границей, а не формально доказанной теоремой.

  6. T-4d (Преимущество модели с постоянным числом бит). Условно ограничивает предельное поведение: для вычислимых бенчмарков, чей \nu-типичный класс нетривиально пересекается с \mathcal{O}, OPT получает постоянное численное преимущество по сложности (\sim -1714 бит), хотя его бесконечная побитовая плотность стремится к нулю.

  7. T-4e (Преимущество при конечном T — условно). OPT численно превосходит \mathcal{M}_1 при конечном T тогда и только тогда, когда эмпирические поточечные потери не опрокидывают базовую структурную границу K(\text{IC}\mid\text{SP}) > K_0 (300 > 36). Это прямо локализует уязвимость в предположениях об алгоритмическом поточечном доминировании.

Условия фальсификации для утверждения MDL

Последующие зависимости


Это приложение поддерживается как часть репозитория проекта OPT наряду с theoretical_roadmap.pdf. Ссылки: Rissanen (1978) [12], Li & Vitányi (2008) [27], Solomonoff (1964) [11], Penrose (2004).