Теорія впорядкованого патча (OPT)
Додаток T-4: Порівняння MDL / парсимонії
v2.0.0 — 2 квітня 2026 | DOI: 10.5281/zenodo.19300777
Початкове завдання T-4: Порівняння MDL / парсимонії Проблема: У чинному препринті стверджується парсимонійна перевага над стандартною фізикою завдяки трактуванню фізичних законів як макроскопічних алгоритмів стиснення, але формального порівняння MDL не наведено. Результат: Порівняльний MDL-аналіз OPT проти еталонних класів фізичних моделей за явно заданих конвенцій кодування.
Статус закриття: ЗАКРИТО (за умови типовості та нормалізації IC). У цьому додатку подано формальну MDL-оцінку, якої вимагало T-4. Зафіксовано три еталонні класи моделей із явно заданими конвенціями кодування. Встановлено чотири теореми та одну гіпотезу: (T-4a) правило селекції OPT має довжину опису \mathcal{O}(1); (T-4b) домінування Соломонова обмежує згори log-loss OPT; (Гіпотеза T-4c) гіпотетичним джерелом структурної переваги OPT є стиснення початкових умов; (T-4d) OPT досягає сталої переваги в складності моделі на постійну кількість бітів над кожним обчислюваним еталоном; (T-4e) перевагу для скінченного T умовно кількісно визначено. Закриття спирається на три несівні умови: типовість потоку спостерігача, поглинання штрафу нормалізації Соломонова \log(1/\xi(\mathcal{O})) та виконання умови K(\text{IC} \mid \text{SP}) > K_0.
§1. Фіксація конвенцій кодування MDL
Порівняння MDL не мають сенсу без явних, фіксованих конвенцій кодування. §5.1 препринту зазначає цю вимогу, але відкладає її. Тут ми фіксуємо конвенції, спираючись на Ріссанена (1978) [12] і двочастинний MDL-фреймворк Лі та Вітаньї (2008) [27].
1.1 Двочастинна довжина коду
Для класу гіпотез \mathcal{M} та послідовності спостережень y_{1:T} \in \{0,1\}^* двочастинна довжина коду MDL має вигляд:
L_T(\mathcal{M}) = K(\mathcal{M}) + L(y_{1:T} \mid \mathcal{M}) \tag{preprint §5.1, Eq. 13}
де K(\mathcal{M}) — це префіксна колмогоровська складність гіпотези, тобто довжина найкоротшої самоделімітованої програми на фіксованій універсальній машині Тюрінга (UTM), яка виводить повний опис \mathcal{M}, а L(y_{1:T} \mid \mathcal{M}) — від’ємний логарифм правдоподібності даних за найкращою предиктивною моделлю в межах \mathcal{M}:
L(y_{1:T} \mid \mathcal{M}) = -\log_2 P_\mathcal{M}(y_{1:T})
Для детерміністичних теорій (закони + IC однозначно визначають спостереження) L(y_{1:T} \mid \mathcal{M}) = 0, коли y узгоджується з теорією, і L = \infty в іншому разі. Усі логарифми мають основу 2; усі довжини коду подано в бітах.
1.2 Універсальна машина
Ми всюди фіксуємо одну оптимальну UTM \mathcal{U}. Усі колмогоровські складності задаються відносно \mathcal{U}; за іншого вибору UTM результати змінюються щонайбільше на \mathcal{O}(1) бітів. Міра Соломонова \xi визначається відносно \mathcal{U} (препринт, рівн. 1). Це фіксує конвенцію для всіх подальших порівнянь.
1.3 Обсяг y_{1:T}
Ми порівнюємо моделі на тій області, для передбачення якої кожну з них було створено: свідомому потоці спостерігача y_{1:T} = z_{0:T} (послідовності стиснених латентних станів, C_{\max} бітів за секунду протягом T секунд). Стандартну фізику оцінюють на тій самій області, зводячи її передбачення до сумісного зі спостерігачем потоку через огрублення. Обидві теорії мають пояснити рівно ті самі спостереження.
§2. Еталонні класи моделей
Фіксуються три еталонні класи. Кожному призначається явна оцінка K(\mathcal{M}) за нашою конвенцією UTM. Точні числові значення є оцінками за порядком величини; структурні результати в §§3–7 залежать лише від упорядкування, а не від точних значень.
2.1 \mathcal{M}_1 — Стандартна модель + загальна теорія відносності
Найточніша за передбачувальною силою фізична теорія, доступна на сьогодні. Її опис потребує трьох компонентів:
Математична структура K_{\text{struct}}: калібрувальна група \text{SU}(3) \times \text{SU}(2) \times \text{U}(1), лоренц-інваріантність, ренормовність і дифеоморфізмова симетрія ЗТВ. Колмогорівська складність: K_{\text{struct}} \approx 10^3 біт.
Значення параметрів K_{\text{param}}: 19 вільних параметрів СМ + 3 кути змішування + 1 CP-фаза + \Lambda + G + c \approx 25 констант, закодованих з експериментальною точністю (\sim 30 біт кожна): K_{\text{param}} \approx 750 біт.
Початкові умови K_{\text{IC}}: у межах інфляційної парадигми K_{\text{IC}}^{\text{inf}} \approx 200–400 біт. Примітка: Ми не враховуємо тут пенроузівську межу термодинамічної ентропії 10^{123}, оскільки вона вимірює макроскопічний об’єм фазового простору (S), а не конкретну алгоритмічну колмогорівську складність (K). Конкретний мікростан може бути сильно стисливим. Ми спираємося виключно на коректні інфляційні межі.
K(\mathcal{M}_1) = K_{\text{struct}} + K_{\text{param}} \approx 1750 \text{ bits}
K(\text{IC} \mid \mathcal{M}_1) \approx 300 \text{ bits (inflationary)}
2.2 \mathcal{M}_2 — Загальна ренормалізовна КТП
Клас усіх ренормалізовних квантових теорій поля у вимірах простору-часу \leq 4. Цей клас містить \mathcal{M}_1 як один зі своїх елементів. Оскільки також необхідно специфікувати калібрувальну групу та склад частинок:
K(\mathcal{M}_2) \gg K(\mathcal{M}_1) \gg 1750 \text{ біт}
\mathcal{M}_2 включено як контрастний приклад для твердження OPT про те, що закони відбираються, а не перелічуються. Хоча порівняння MDL з \mathcal{M}_2 тривіально виграє будь-який скінченний підклас (зокрема й \mathcal{M}_1), оскільки K(\mathcal{M}_2) є необмеженою, її включення формально слугує для демонстрації нескінченного масштабу проблеми вибору параметрів, яку Фільтр стабільності природним чином згортає.
2.3 \mathcal{M}_3 — Мозок Больцмана / Теплова флуктуація
Стандартна фізика з максимально простими початковими умовами: тепловий (стан максимальної ентропії) на планківському масштабі. Закони тотожні \mathcal{M}_1; початкові умови тривіально прості:
K(\mathcal{M}_3) \approx K(\mathcal{M}_1) \approx 1750 \text{ bits}, \qquad K(\text{IC} \mid \mathcal{M}_3) \approx 10 \text{ bits}
Однак логарифм правдоподібності спостереження впорядкованого потоку свідомості y_{1:T} за \mathcal{M}_3 є астрономічно малим: L(y_{1:T} \mid \mathcal{M}_3) \approx K(y_{1:T}) \gg T \cdot C_{\max}. Отже, \mathcal{M}_3 має мізерну вартість IC, але катастрофічну вартість правдоподібності, і її включено, щоб показати, що перевага OPT за MDL не досягається тим самим трюком.
§3. Довжина коду OPT — Теорема T-4a
Довжина коду MDL для OPT розкладається так:
L_T(\text{OPT}) = K(\xi, \text{Filter}) + L(y_{1:T} \mid \xi, \text{Filter}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)
де \xi^{\text{Filter}} — це міра Соломонова \xi, обумовлена на класі, сумісному зі спостерігачем, \mathcal{O} (потоки, що задовольняють R_{\text{req}} \leq B_{\max}), а K_0 = K(\xi, \text{Filter}) — це довжина опису правила селекції.
Теорема T-4a (Межа складності метаправила). K(\xi, \text{Filter}) = K_0 = \mathcal{O}(1) бітів. Зокрема:
K_0 \leq K(\mathcal{U}) + K(C_{\max}) + K(\Delta t) + c
де K(\mathcal{U}) — складність UTM, K(C_{\max}) = \mathcal{O}(\log C_{\max}) бітів кодує поріг пропускної здатності з експериментальною точністю, K(\Delta t) = \mathcal{O}(\log \Delta t) кодує вікно оновлення, а c — мала універсальна стала.
Доведення. Міра Соломонова \xi однозначно визначається фіксованою UTM \mathcal{U}, тож K(\xi \mid \mathcal{U}) = \mathcal{O}(1). Фільтр стабільності потребує двох параметрів: C_{\max} і \Delta t, кожен із яких вимірюється з точністю до \sim 4 значущих цифр, тож K(C_{\max}, \Delta t) \leq 2 \times (4 \times \log_2 10) \approx 26 бітів. Умова R_{\text{req}} \leq B_{\max} — це одна нерівність у фіксованій нотації: \sim 10 бітів. Разом: K_0 \leq K(\mathcal{U}) + 36 бітів.
Щоб коректно врахувати K(\mathcal{U}), ми мусимо припустити «епістемічно нейтральну» UTM — тобто референтну машину, чий вбудований набір інструкцій не кодує жодної фізичної теорії привілейовано (тобто базову комбінаторну або Brainfuck-еквівалентну геометрію, цілком агностичну щодо фізики). За такої неупередженої машини припущення, що K(\xi, \text{Filter}) \approx 36 бітів, тоді як K(\mathcal{M}_1) \approx 1750 бітів, є правомірним. Ми спеціально визнаємо, що це робить абсолютний підрахунок бітів вразливим до масштабування сталою \mathcal{O}(1) у разі зміни UTM, а отже, обчислення 36 проти 1750 є за своєю природою відносним. Структурно чесне математичне твердження тут — це ранжування (K_0 \ll K(\mathcal{M}_1)), яке стверджує стійку структурну перевагу, незалежну від точної числової сталої. \blacksquare
Порівняння: Якщо не враховувати спільні накладні витрати UTM, маємо K_0 \approx 36 бітів проти K(\mathcal{M}_1) \approx 1750 бітів. Правило селекції OPT коротше за опис Стандартної моделі на K(\mathcal{M}_1) - K_0 \approx 1714 бітів. Саме цю перевагу структурної ощадності заявлено в §5 препринту — тепер із явним підрахунком бітів.
§4. Межа домінування Соломонова — Теорема T-4b
Теорема T-4b (Межа домінування Соломонова). Для будь-якої обчислюваної міри фізики \nu (включно з \mathcal{M}_1, \mathcal{M}_2, \mathcal{M}_3) з K(\nu) < \infty, і для будь-якого потоку даних y_{1:T}:
L_T(\text{OPT}) \leq L_T(\nu) + K'_0
де K'_0 = K_0 + \log(1/\xi(\mathcal{O})). Це виражає базову складність правила разом із необхідним штрафом алгоритмічної нормалізації, що виникає при умовленні універсальної міри на клас спостерігачів \mathcal{O}.
Доведення. Із означення міри Соломонова (препринт, рівн. 1), де w_\nu \asymp 2^{-K(\nu)}:
\xi(y_{1:T}) \geq w_\nu \cdot \nu(y_{1:T}) \geq 2^{-K(\nu)} \cdot \nu(y_{1:T})
Беручи від’ємні логарифми:
-\log \xi(y_{1:T}) \leq -\log \nu(y_{1:T}) + K(\nu)
При переході від універсальної міри \xi до обмеженого фільтра \xi^{\text{Filter}} ми сплачуємо вартість нормалізації -\log \xi^{\text{Filter}}(y) = -\log \xi(y) + \log(1/\xi(\mathcal{O})). Підставляючи в L_T(\text{OPT}):
L_T(\text{OPT}) = K_0 - \log \xi^{\text{Filter}}(y_{1:T}) \leq K_0 + \log(1/\xi(\mathcal{O})) + K(\nu) - \log \nu(y_{1:T}) = K'_0 + L_T(\nu) \qquad \blacksquare
Важливе застереження. Теорема T-4b не показує, що OPT перевершує SP. Вона показує, що OPT не може бути гіршою за будь-який еталон більш ніж на K'_0 бітів. Надалі ми поглинаємо \log(1/\xi(\mathcal{O})) у K_0, припускаючи, що клас послідовностей спостерігача має чисту межу відносно структурних констант UTM, але відзначаємо цей розрив нормалізації як формальну вразливість.
§5. Стиснення початкових умов — Теорема T-4c
Структурним джерелом переваги OPT за MDL є стиснення початкових умов. У стандартній фізиці закони та початкові умови є окремими об’єктами, які обидва потрібно описати. В OPT початкові умови поглинаються апріорним розподілом: міра Соломонова вже надає найбільшу вагу найпростішим потокам, сумісним зі спостерігачем, роблячи окрему специфікацію IC надлишковою.
5.1 Аргумент надлишковості IC
У межах стандартної фізики (\mathcal{M}_1) повний код MDL для детерміністичної теорії має вигляд:
L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) + 0 \qquad \text{[детерміністично: } -\log P = 0 \text{ за умови узгодженості]}
Член IC K(\text{IC} \mid \text{laws}) є довжиною опису конкретних початкових умов за заданих законів — він не виводиться із самих законів. Саме тут локалізується тонке налаштування.
У межах OPT двочастинний код має вигляд:
L_T(\text{OPT}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)
Член -\log \xi^{\text{Filter}}(y_{1:T}) кодує конкретний потік за заданого метаправила. Апріорний розподіл Соломонова вже включає універсальну модель фізики: -\log \xi(y) \approx K(y). Кодування в OPT ніколи не потребує окремої плати за IC.
Гіпотеза T-4c (евристична межа стискання IC). Визначимо перевагу стискання IC:
\Delta_{\text{IC}} = K(\text{IC} \mid \text{SP laws}) - K(\text{IC} \mid \text{OPT})
Ми стверджуємо таку евристичну межу:
\boxed{L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1)}
де K(\text{IC} \mid \text{OPT}) := K(\text{IC} \mid \xi, \text{Filter}, \text{codec}) — це залишкова довжина опису початкових умов за повної моделі OPT. \Delta_{\text{IC}} \geq 0, причому рівність має місце тоді й лише тоді, коли Фільтр стабільності не забезпечує жодного додаткового стискання IC понад те, що вже задають закони.
Аргумент. Починаючи з повного двочастинного коду для SP і застосовуючи домінування Соломонова (поглинаючи константи нормалізації в обмежувальний член \mathcal{O}(1), пов’язаний з UTM):
L_T(\text{OPT}) \leq K_0 + K(\text{laws}) + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) + \mathcal{O}(1)
Перегруповуючи та підставляючи L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) (детерміністична теорія), отримуємо:
L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 + \mathcal{O}(1)
У межах OPT член -\log \xi^{\text{Filter}}(y_{1:T}) не мусить окремо кодувати IC: Фільтр здійснює відбір із апріорного розподілу Соломонова, який внутрішньо стискає IC через ваги довжини. Субадитивність AIT гарантує, що K(\text{IC} \mid x, f(x)) \leq K(\text{IC} \mid x) + \mathcal{O}(1). Якщо постулювати, що правило відбору в OPT задає межу як щільніший описовий рядок, ніж просте декларування сирих законів (що і є центральною ставкою цієї рамки, а не математичним доказом через виведення), тоді залишково закодований K(\text{IC} \mid \text{OPT}) не може суттєво перевищувати K(\text{IC} \mid \text{laws}). Евристично звідси випливає, що \Delta_{\text{IC}} \geq 0.
Підставляючи, маємо: L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1). \blacksquare
Примітка. Ми висуваємо гіпотезу, що антропне стискання K(\text{IC} \mid \text{OPT}) \approx 0 реалізується в границі, де Фільтр стабільності є сильно обмежувальним і математично відображає систему в однозначно сумісні зі спостерігачем стани. Це фізично вмотивоване твердження, а не алгоритмічно доведена межа єдиності.
§6. Перевага складності моделі зі сталою кількістю бітів — Теорема T-4d
Теорема T-4d (Постійна перевага MDL зі сталою кількістю бітів — за умови типовості). Для кожної фіксованої, нетривіальної обчислюваної моделі фізики \nu з K_0 < K(\nu) < \infty формулювання OPT досягає фіксованої, постійної переваги в складності моделі, зокрема для будь-якого y_{1:T} \in \mathcal{O}, що також є \nu-типовим. Коли довжина послідовності T \to \infty, різниця загальної довжини коду структурно обмежується:
L_T(\text{OPT}) - L_T(\nu) \to K_0 - K(\nu)
Доведення. Із T-4b маємо L_T(\text{OPT}) \leq K'_0 - \log \xi^{\text{Filter}}(y_{1:T}). Для будь-якого обчислюваного \nu теорема Соломонова гарантує, що \xi збігається до \nu саме на \nu-типових послідовностях, тобто на \nu-майже-всіх y_{1:\infty}. Тут слід відзначити глибоку формальну напругу: Фільтр стабільності ізолює потоки, що оцінюються як строго низькоентропійні та структуровані, тим самим структурно відносячи їх до атипових порівняно зі стандартними необмеженими потоками міри \nu з максимальною ентропією. Якщо між відфільтрованим класом спостерігачів \mathcal{O} та класом \nu-типових послідовностей не існує демонстрованого нетривіального математичного перетину, границю збіжності Соломонова неможливо безпосередньо використати. Отже, ця теорема застосовується умовно тоді й лише тоді, коли конкретний відфільтрований потік спостерігача залишається \nu-типовим відносно конкретних еталонних законів (при цьому множина таких теоретично сумісних потоків перетину формально залишається неохарактеризованою):
-\frac{1}{T} \log \xi(y_{1:T}) \to H(\nu) \quad \text{as } T \to \infty
де H(\nu) — це ентропійна швидкість \nu. Аналогічно, -\frac{1}{T} \log \nu(y_{1:T}) \to H(\nu). Асимптотично члени log-loss log-likelihood на біт збігаються й зрівнюються, а це означає, що решта переваги в загальній довжині коду зводиться суто до довжини опису моделі:
\left[L_T(\text{OPT}) - L_T(\nu)\right] \to K_0 - K(\nu) < 0 \qquad \text{[оскільки } K_0 \approx 36 \text{ проти } K(\nu) \sim 1750 \text{]}
Примітка: хоча загальна довжина коду зберігає цю постійну перевагу у фіксованій кількості бітів, побітова перевага (\frac{K_0 - K(\nu)}{T}) активно прямує до нуля. Це не означає асимптотично безперервно зростаючої переваги через накопичення даних, а радше постійне жорстке структурне зміщення. \blacksquare
Числова оцінка для \mathcal{M}_1: K(\mathcal{M}_1) - K_0 \approx 1714 бітів. Щойно log-loss likelihoods збігаються на достатніх вікнах \nu-типових спостережень, OPT зберігає постійну математичну перевагу в загальному кодуванні приблизно на 1714 бітів.
§7. Умовна перевага для скінченного T — Теорема T-4e
Для потоків скінченної довжини порівняння MDL вимагає, щоб перевага стискання IC з T-4c перевищувала накладні витрати K_0.
Теорема T-4e (Умовна MDL-перевага для скінченного T). OPT досягає строгої MDL-переваги для скінченного T над \mathcal{M}_1 — тобто L_T(\text{OPT}) < L_T(\mathcal{M}_1) — тоді й лише тоді, коли виконується така умова:
\boxed{K(\text{IC} \mid \text{SP laws}) > K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y_{1:T}) - \left(-\log P_{\text{SP}}(y_{1:T})\right)\right]}
Дужка в правій частині є дефіцитом лог-правдоподібності OPT відносно SP на конкретному потоці y_{1:T}. Умова виконується щоразу, коли вартість опису IC перевищує сукупні накладні витрати метаправила та дефіцит передбачення OPT на цьому потоці.
Доведення. Безпосереднє перетворення довжин двочастинного коду:
L_T(\text{OPT}) < L_T(\text{SP}) \iff \quad K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) - \log \xi^{\text{Filter}}(y) < K_{\text{laws}} + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) \iff \quad K(\text{IC} \mid \text{laws}) - K_0 > \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] + \left[K_{\text{laws}} - K_{\text{laws}}\right]
Після перестановки членів (K_{\text{laws}} скорочується з обох боків) безпосередньо отримуємо сформульовану умову. \blacksquare
7.1 Оцінювання умови для стандартної космології
За інфляційного кодування (найсприятливіший випадок для SP):
- K(\text{IC} \mid \text{SP laws}) \approx 300 бітів (інфляційні параметри + кількість e-folds + reheating)
- K_0 \approx 36 бітів (T-4a)
- Дефіцит лог-правдоподібності: Ми функціонально висуваємо гіпотезу, що OPT, оснащена обмеженнями кодека R_{T,h}(D), відображеними в T-1, досягає принаймні настільки ж стійкої поточкової лог-правдоподібності, як і стандартна фізика, на потоці, сумісному зі спостерігачем. Зауважимо, що межі Соломонова строго дають домінування над очікуваними сумами, а не визначальні поточкові межі для конкретних сингулярних потоків; тому \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] \leq 0 є емпіричним структурним очікуванням, а не алгоритмічною гарантією.
Отже, умова зводиться до K(\text{IC} \mid \text{SP laws}) > K_0, тобто 300 > 36. Це виконується зі значним структурним запасом. Умова не виконується лише тоді, коли IC коштує менше ніж \sim 36 бітів — тобто якщо конкретний IC нашого всесвіту структурно виводиться лише із законів SP, породжуючи менше ніж 36 залишкових бітів. Жодна сучасна космологічна модель цього не досягає.
§8. Порівняльна таблиця MDL
| Модель | K(\mathcal{M}) (біти) | K(\text{IC}\mid\mathcal{M}) (біти) | -\log P(y\mid\mathcal{M}) | загальний L_T | ранг MDL |
|---|---|---|---|---|---|
| \mathcal{M}_1 — SM + GR | \sim 1750 | \sim 300 (інфляційний) | \sim 0 (детерміністичний) | \sim 2050 | 2-ге місце (інфляційний) |
| \mathcal{M}_3 — Больцман | \sim 1750 | \sim 10 | \gg 0 (рідкісний потік) | \gg 1760 | Останнє (катастрофічна правдоподібність) |
| \mathcal{M}_{\text{OPT}} — OPT | \sim 36 | \sim 0 (умовно через сильно обмежений Фільтр стабільності) | \sim 0^* (детерміністична апроксимація кодека) | \sim 36 (умовно) | 1-ше місце (умовно) |
^* За явної ідентифікації кодека в §9.2 активний член даних в OPT зводиться до -\log P_{K_\theta}(y) = -\log P_\text{SP}(y) = 0, щойно K_\theta ототожнюється з кодеком SP.
§9. Межі порівняння
9.1 K(y \mid \text{Filter}) не є обчислюваним
Довжина коду OPT K_0 + K(y \mid \text{Filter}) = K_0 - \log \xi^{\text{Filter}}(y) містить член, який не є обчислюваним у тюрінговому сенсі (проблема зупинки не дозволяє обчислити \xi точно). На практиці передбачення OPT мають апроксимуватися скінченним кодеком K_\theta — що є стандартною практикою у фізиці. Це означає, що для предиктивних цілей OPT зводиться до найкращого доступного обчислюваного кодека. Отже, перевага OPT над SP у термінах MDL є структурною перевагою (в описі правила селекції), а не операційною перевагою у формуванні нових передбачень.
Це не вада — це і є коректний формальний зміст твердження препринта: “OPT переносить частину пояснювального навантаження з переліку законів на відбір законів”. Це зміщення є реальним і формально квантифікованим (\approx 1700 біт для правила селекції проти \mathcal{M}_1), але воно не породжує нового предиктивного змісту понад те, що вже забезпечує кодек.
9.2 Проблема ідентифікації кодека
OPT-кодек K_\theta — це конкретна обчислювана міра з \mathcal{M}, яку відбирає Фільтр стабільності. T-4 не визначає, яка саме це міра, — така ідентифікація потребує T-5 (відновлення констант) і повної програми фізичного об’єднання. Доти, доки K_\theta не буде явно ототожнено зі SM + GR, порівняння MDL є умовним щодо цього ототожнення. Формальна межа L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 гарантує, що OPT не може показати гірший результат, ніж SP, але не гарантує, що вона покаже кращий результат за скінченний час, якщо не виконується умова IC з T-4e — а вона виконується за стандартних космологічних припущень.
Обмеження з P-2. Додаток P-2 (вкладення гільбертового простору через квантову корекцію помилок) встановлює, що за локального шуму кодек має задовольняти структурі QECC — його внутрішнє представлення має утворювати квантовий код корекції помилок зі специфічними параметрами (n, k, d). Це звужує проблему ідентифікації кодека: K_\theta більше не є довільною обчислюваною мірою, а такою, чиї предиктивні стани несуть геометрію корекції помилок гільбертового простору. Це обмеження передує програмі відновлення констант T-5 і може надати додаткові критерії відбору для ототожнення K_\theta зі Стандартною моделлю.
§10. Підсумок замикання
Результати T-4 — підтверджено як замкнені (з умовами нормалізації та типовості)
Конвенції кодування зафіксовано (§1). Двочастинний MDL, префіксна колмогорівська складність відносно інклюзивної фіксованої UTM, відображення домену даних функціонально на потік свідомості y_{1:T} = z_{0:T}.
Класи бенчмарків зафіксовано (§2). Оцінює \mathcal{M}_1 (SM+GR) проти тривіальних меж на кшталт \mathcal{M}_2 (вибір параметрів із вибуховим розширенням генеративного обсягу) та \mathcal{M}_3 (колапс правдоподібності Больцмана).
T-4a (Складність метаправила). K(\xi, \text{Filter}) = K_0 \approx 36 бітів, включно зі зсувами відносно UTM.
T-4b (Обмеженість за Соломоновим). L_T(\text{OPT}) \leq L_T(\nu) + K_0 + \log(1/\xi(\mathcal{O})). Явно визначає параметр алгоритмічного штрафу нормалізації.
Гіпотеза T-4c (Евристична межа IC-компресії). Структурна надлишковість початкових умов є гіпотетичним рушієм стиснення: \Delta_{\text{IC}} = K(\text{IC}\mid\text{SP}) - K(\text{IC}\mid\text{OPT}) \geq 0, хоча унікальність відображення є умовною. Це слугує евристичною межею, а не формально доведеною теоремою.
T-4d (Перевага моделі зі сталою бітністю). Умовно обмежує граничну поведінку: для обчислюваних бенчмарків, чий \nu-типовий клас нетривіально перетинається з \mathcal{O}, OPT здобуває сталу числову перевагу за складністю (\sim -1714 бітів), хоча її нескінченна побітова густина масштабується до нуля.
T-4e (Перевага при скінченному T — умовна). OPT чисельно перевершує \mathcal{M}_1 при скінченному T тоді й лише тоді, коли емпіричні поточкові втрати не перекидають базову структурну межу K(\text{IC}\mid\text{SP}) > K_0 (300 > 36). Це зосереджує вразливість безпосередньо на припущеннях про алгоритмічне поточкове домінування.
Умови фальсифікації для твердження MDL
- Виведення космологічних початкових умов лише із законів SP менш ніж за \sim 36 бітів — тобто демонстрація, що K(\text{IC} \mid \text{SP laws}) < K_0.
- Демонстрація того, що обмеження Фільтра стабільності на сумісні зі спостерігачем потоки не стискає IC — тобто K(\text{IC} \mid \xi, \text{Filter}) = K(\text{IC} \mid \text{laws}), що дає \Delta_{\text{IC}} = 0.
- Явний обчислюваний кодек K_\theta для OPT, який демонстративно менш точний, ніж SM+GR, на потоках спостерігача, так що дефіцит лог-правдоподібності перевищує виграш від IC-компресії.
Подальші залежності
- T-5 (Відновлення констант) є суттєвим наступним кроком: щойно кодек K_\theta буде ототожнено із законами SM+GR через T-1/T-2/T-3, порівняння MDL стане повністю явним, а умова в T-4e перетвориться на конкретну нерівність між відомими величинами.
- Оновлення препринту §5.2: фразу “Whether this meta-rule yields an actual MDL advantage… is an open comparative question” тепер можна оновити до: “Theorem T-4d establishes a conditional asymptotic advantage (for observer streams that are also \nu-typical under the benchmark physics, a set currently uncharacterised); Theorem T-4e establishes a conditional finite-T advantage; see Appendix T-4.”
Цей додаток підтримується як частина репозиторію проєкту OPT поряд із theoretical_roadmap.pdf. Посилання: Rissanen (1978) [12], Li & Vitányi (2008) [27], Solomonoff (1964) [11], Penrose (2004).