Teoria do Patch Ordenado

Apêndice T-4: Comparação MDL / Parcimónia

Anders Jarevåg

v2.0.0 — 2 de abril de 2026 | DOI: 10.5281/zenodo.19300777

Tarefa Original T-4: Comparação MDL / Parcimónia Problema: O preprint em circulação reivindica parcimónia face à física padrão ao tratar as leis físicas como algoritmos macroscópicos de compressão, mas não fornece uma comparação MDL formal. Entregável: Análise MDL comparativa da OPT versus classes de modelos de física de referência sob convenções de codificação explícitas.

Estado de encerramento: ENCERRADO (condicional à tipicidade e à normalização de IC). Este apêndice fornece a avaliação MDL formal exigida por T-4. Fixam-se três classes de modelos de referência com convenções de codificação explícitas. Estabelecem-se quatro teoremas e uma conjectura: (T-4a) a regra de seleção da OPT tem comprimento de descrição \mathcal{O}(1); (T-4b) a dominância de Solomonoff limita superiormente a log-loss da OPT; (Conjectura T-4c) a fonte conjecturada da vantagem estrutural da OPT é a compressão das condições iniciais; (T-4d) a OPT alcança uma vantagem permanente de complexidade de modelo de bits constantes sobre qualquer referência computável; (T-4e) a vantagem para T finito é quantificada condicionalmente. O encerramento assenta em três condições estruturantes: a tipicidade do fluxo do observador, a absorção da penalização de normalização de Solomonoff \log(1/\xi(\mathcal{O})), e o estado de K(\text{IC} \mid \text{SP}) > K_0.

§1. Fixação das Convenções de Codificação MDL

As comparações MDL são destituídas de sentido sem convenções de codificação explícitas e fixas. A §5.1 do preprint assinala esta exigência, mas adia-a. Fixamos aqui as convenções seguindo Rissanen (1978) [12] e a estrutura MDL em duas partes de Li & Vitányi (2008) [27].

1.1 O Comprimento de Código em Duas Partes

Para uma classe de hipóteses \mathcal{M} e uma sequência de observações y_{1:T} \in \{0,1\}^*, o comprimento de código MDL em duas partes é:

L_T(\mathcal{M}) = K(\mathcal{M}) + L(y_{1:T} \mid \mathcal{M}) \tag{preprint §5.1, Eq. 13}

onde K(\mathcal{M}) é a complexidade de Kolmogorov prefixa da hipótese — o comprimento do programa auto-delimitado mais curto, numa máquina de Turing universal (UTM) fixa, que produz uma descrição completa de \mathcal{M} — e L(y_{1:T} \mid \mathcal{M}) é o logaritmo negativo da verosimilhança dos dados sob o melhor modelo preditivo de \mathcal{M}:

L(y_{1:T} \mid \mathcal{M}) = -\log_2 P_\mathcal{M}(y_{1:T})

Para teorias determinísticas (leis + IC determinam univocamente as observações), L(y_{1:T} \mid \mathcal{M}) = 0 quando y é consistente com a teoria e L = \infty caso contrário. Todos os logaritmos são de base 2; todos os comprimentos de código estão em bits.

1.2 A Máquina Universal

Fixamos uma única UTM ótima \mathcal{U} ao longo de todo o texto. Todas as complexidades de Kolmogorov são relativas a \mathcal{U}; os resultados mudam no máximo em \mathcal{O}(1) bits sob uma escolha diferente de UTM. A medida de Solomonoff \xi é definida relativamente a \mathcal{U} (preprint Eq. 1). Isto fixa a convenção para todas as comparações subsequentes.

1.3 Âmbito de y_{1:T}

Comparamos modelos no domínio que cada um foi concebido para prever: o fluxo consciente do observador y_{1:T} = z_{0:T} (a sequência de estados latentes comprimidos, C_{\max} bits por segundo ao longo de T segundos). A física padrão é avaliada no mesmo domínio, reduzindo as suas previsões ao fluxo compatível com o observador por meio de coarse-graining. Pede-se a ambas as teorias que deem conta exatamente das mesmas observações.


§2. Classes de Modelos de Referência

Fixam-se três classes de referência. A cada uma é atribuída uma estimativa explícita de K(\mathcal{M}) segundo a nossa convenção de UTM. Os valores numéricos precisos são estimativas de ordem de grandeza; os resultados estruturais nas §§3–7 dependem apenas da ordenação, não dos valores exatos.

2.1 \mathcal{M}_1 — Modelo Padrão + Relatividade Geral

A teoria física actualmente disponível com maior precisão preditiva. A sua descrição requer três componentes:

K(\mathcal{M}_1) = K_{\text{struct}} + K_{\text{param}} \approx 1750 \text{ bits}

K(\text{IC} \mid \mathcal{M}_1) \approx 300 \text{ bits (inflacionário)}

2.2 \mathcal{M}_2 — QFT Renormalizável Genérica

A classe de todas as teorias quânticas de campos renormalizáveis em \leq 4 dimensões do espaço-tempo. Esta classe contém \mathcal{M}_1 como um dos seus membros. Como o grupo de gauge e o conteúdo em partículas também têm de ser especificados:

K(\mathcal{M}_2) \gg K(\mathcal{M}_1) \gg 1750 \text{ bits}

\mathcal{M}_2 é incluída como contraponto à tese da OPT de que as leis são selecionadas, e não enumeradas. Embora a comparação MDL com \mathcal{M}_2 seja trivialmente vencida por qualquer subclasse finita (incluindo \mathcal{M}_1), porque K(\mathcal{M}_2) é ilimitado, a sua inclusão serve formalmente para demonstrar a escala infinita do problema de seleção de parâmetros que o Filtro de Estabilidade colapsa nativamente.

2.3 \mathcal{M}_3 — Cérebro de Boltzmann / Flutuação Térmica

Física padrão com condições iniciais maximamente simples: um estado térmico (de entropia máxima) à escala de Planck. As leis são idênticas às de \mathcal{M}_1; as condições iniciais são trivialmente simples:

K(\mathcal{M}_3) \approx K(\mathcal{M}_1) \approx 1750 \text{ bits}, \qquad K(\text{IC} \mid \mathcal{M}_3) \approx 10 \text{ bits}

No entanto, a log-verosimilhança de observar um fluxo consciente ordenado y_{1:T} sob \mathcal{M}_3 é astronomicamente pequena: L(y_{1:T} \mid \mathcal{M}_3) \approx K(y_{1:T}) \gg T \cdot C_{\max}. \mathcal{M}_3 tem, assim, um custo de IC negligenciável, mas um custo de verosimilhança catastrófico, e é incluído para mostrar que a vantagem MDL da OPT não é obtida pelo mesmo artifício.


§3. Comprimento de Código da OPT — Teorema T-4a

O comprimento de código MDL para a OPT decompõe-se como:

L_T(\text{OPT}) = K(\xi, \text{Filter}) + L(y_{1:T} \mid \xi, \text{Filter}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

onde \xi^{\text{Filter}} é a Semimedida Universal de Solomonoff \xi condicionada à classe compatível com o observador \mathcal{O} (fluxos que satisfazem R_{\text{req}} \leq B_{\max}), e K_0 = K(\xi, \text{Filter}) é o comprimento de descrição da regra de seleção.

Teorema T-4a (Limite de Complexidade da Meta-Regra). K(\xi, \text{Filter}) = K_0 = \mathcal{O}(1) bits. Especificamente:

K_0 \leq K(\mathcal{U}) + K(C_{\max}) + K(\Delta t) + c

onde K(\mathcal{U}) é a complexidade da UTM, K(C_{\max}) = \mathcal{O}(\log C_{\max}) bits codifica o limiar de largura de banda com precisão experimental, K(\Delta t) = \mathcal{O}(\log \Delta t) codifica a janela de atualização, e c é uma pequena constante universal.

Prova. A Semimedida Universal de Solomonoff \xi é unicamente determinada pela UTM fixa \mathcal{U}, pelo que K(\xi \mid \mathcal{U}) = \mathcal{O}(1). O Filtro de Estabilidade requer dois parâmetros: C_{\max} e \Delta t, cada um medido com \sim 4 algarismos significativos, pelo que K(C_{\max}, \Delta t) \leq 2 \times (4 \times \log_2 10) \approx 26 bits. A condição R_{\text{req}} \leq B_{\max} é uma única desigualdade em notação fixa: \sim 10 bits. Total: K_0 \leq K(\mathcal{U}) + 36 bits.

Para absorver K(\mathcal{U}) de forma justa, devemos assumir uma UTM “epistemicamente neutra” — isto é, uma máquina de referência cujo conjunto de instruções embutido não codifica preferencialmente nenhuma teoria física (isto é, uma geometria básica de combinadores ou equivalente a Brainfuck, completamente agnóstica em relação à física). Sob uma tal máquina não enviesada, é válido manter K(\xi, \text{Filter}) \approx 36 bits enquanto se padroniza K(\mathcal{M}_1) \approx 1750 bits. Reconhecemos que isto deixa especificamente a contagem absoluta de bits vulnerável a uma reescala por constante \mathcal{O}(1) se a UTM for alterada, o que significa que o cálculo 36 vs 1750 é inerentemente relativo. A formulação matemática estruturalmente honesta aqui é a ordenação por posto (K_0 \ll K(\mathcal{M}_1)), afirmando uma vantagem estrutural robusta independente da constante numérica precisa. \blacksquare

Comparação: Excluindo a sobrecarga partilhada da UTM, K_0 \approx 36 bits vs. K(\mathcal{M}_1) \approx 1750 bits. A regra de seleção da OPT é mais curta do que a descrição do Modelo Padrão por K(\mathcal{M}_1) - K_0 \approx 1714 bits. Esta é a vantagem de parcimónia estrutural reivindicada na §5 do preprint — agora com uma contagem explícita de bits.


§4. O Limite de Dominância de Solomonoff — Teorema T-4b

Teorema T-4b (Limite de Dominância de Solomonoff). Para qualquer medida de física computável \nu (incluindo \mathcal{M}_1, \mathcal{M}_2, \mathcal{M}_3) com K(\nu) < \infty, e para qualquer fluxo de dados y_{1:T}:

L_T(\text{OPT}) \leq L_T(\nu) + K'_0

onde K'_0 = K_0 + \log(1/\xi(\mathcal{O})). Isto representa a complexidade da regra de base mais a penalização necessária de normalização algorítmica incorrida ao condicionar a medida universal à classe de observadores \mathcal{O}.

Prova. A partir da definição da medida de Solomonoff (preprint Eq. 1), com w_\nu \asymp 2^{-K(\nu)}:

\xi(y_{1:T}) \geq w_\nu \cdot \nu(y_{1:T}) \geq 2^{-K(\nu)} \cdot \nu(y_{1:T})

Tomando logaritmos negativos:

-\log \xi(y_{1:T}) \leq -\log \nu(y_{1:T}) + K(\nu)

Ao transitar da medida universal \xi para o filtro restrito \xi^{\text{Filter}}, paga-se o custo de normalização -\log \xi^{\text{Filter}}(y) = -\log \xi(y) + \log(1/\xi(\mathcal{O})). Substituindo em L_T(\text{OPT}):

L_T(\text{OPT}) = K_0 - \log \xi^{\text{Filter}}(y_{1:T}) \leq K_0 + \log(1/\xi(\mathcal{O})) + K(\nu) - \log \nu(y_{1:T}) = K'_0 + L_T(\nu) \qquad \blacksquare

Ressalva importante. O Teorema T-4b não mostra que a OPT supera a SP. Mostra que a OPT não pode sair-se pior do que qualquer benchmark por mais de K'_0 bits. Doravante, absorvemos \log(1/\xi(\mathcal{O})) em K_0 ao assumir que a classe de sequências de observadores se limita de forma limpa em relação às constantes estruturais da UTM, mas assinalamos esta lacuna de normalização como uma vulnerabilidade formal.


§5. A Compressão das Condições Iniciais — Teorema T-4c

A fonte estrutural da vantagem MDL da OPT é a compressão das condições iniciais. Na física padrão, as leis e as condições iniciais são objetos separados que ambos têm de ser descritos. Na OPT, as condições iniciais são absorvidas no prior: a medida de Solomonoff já atribui o maior peso aos fluxos mais simples compatíveis com o observador, tornando redundante uma especificação separada de CI.

5.1 O Argumento da Redundância das IC

Sob a física padrão (\mathcal{M}_1), o código MDL completo para uma teoria determinista é:

L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) + 0 \qquad \text{[deterministic: } -\log P = 0 \text{ if consistent]}

O termo IC K(\text{IC} \mid \text{laws}) é o comprimento de descrição das condições iniciais específicas dadas as leis — não é derivável das próprias leis. Este é o locus do ajuste fino.

Sob a OPT, o código em duas partes é:

L_T(\text{OPT}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

O termo -\log \xi^{\text{Filter}}(y_{1:T}) codifica o fluxo específico dada a meta-regra. O prior de Solomonoff já incorpora um modelo universal da física: -\log \xi(y) \approx K(y). A codificação da OPT nunca precisa pagar separadamente pelas IC.

Conjetura T-4c (Limite Heurístico da Compressão das IC). Definimos a vantagem de compressão das IC:

\Delta_{\text{IC}} = K(\text{IC} \mid \text{SP laws}) - K(\text{IC} \mid \text{OPT})

Sustentamos o seguinte limite heurístico:

\boxed{L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1)}

onde K(\text{IC} \mid \text{OPT}) := K(\text{IC} \mid \xi, \text{Filter}, \text{codec}) é o comprimento de descrição residual das condições iniciais dado o modelo completo da OPT. \Delta_{\text{IC}} \geq 0, com igualdade sse o Filtro de Estabilidade não fornecer compressão adicional das IC para além daquilo que as leis já fornecem.

Argumento. Partindo do código completo em duas partes para a SP e aplicando a dominância de Solomonoff (absorvendo as constantes de normalização num termo de limitação \mathcal{O}(1) da UTM):

L_T(\text{OPT}) \leq K_0 + K(\text{laws}) + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) + \mathcal{O}(1)

Reorganizando e substituindo L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) (teoria determinista):

L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 + \mathcal{O}(1)

No interior da OPT, -\log \xi^{\text{Filter}}(y_{1:T}) não precisa codificar individualmente as IC: o Filtro seleciona a partir do prior de Solomonoff, que comprime as IC inerentemente por via de ponderações de comprimento. A subaditividade da AIT garante K(\text{IC} \mid x, f(x)) \leq K(\text{IC} \mid x) + \mathcal{O}(1). Se postulamos que a regra de seleção da OPT se limita como uma cadeia descritiva mais apertada do que simplesmente declarar as leis brutas (o que é a aposta central do enquadramento, não uma prova derivativa matemática), então o K(\text{IC} \mid \text{OPT}) residual codificado não pode exceder significativamente K(\text{IC} \mid \text{laws}). Produzindo, heurísticamente, \Delta_{\text{IC}} \geq 0.

Por substituição: L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1). \blacksquare

Observação. Hipotetizamos que a compressão antrópica K(\text{IC} \mid \text{OPT}) \approx 0 opera no limite em que o Filtro de Estabilidade é altamente constrangedor, mapeando matematicamente para estados univocamente compatíveis com observadores. Trata-se de uma proposição física motivada, e não de um limite de unicidade provado algoritmicamente.


§6. Vantagem de Complexidade de Modelo em Bits Constantes — Teorema T-4d

Teorema T-4d (Vantagem Permanente de MDL em Bits Constantes — Condicional à Tipicidade). Para todo modelo computável de física \nu fixo e não trivial, com K_0 < K(\nu) < \infty, a formulação da OPT alcança uma vantagem fixa e permanente de complexidade de modelo especificamente para qualquer y_{1:T} \in \mathcal{O} que seja também \nu-típico. À medida que o comprimento da sequência T \to \infty, a diferença total de comprimento de código fica estruturalmente limitada por:

L_T(\text{OPT}) - L_T(\nu) \to K_0 - K(\nu)

Prova. Pelo T-4b, L_T(\text{OPT}) \leq K'_0 - \log \xi^{\text{Filter}}(y_{1:T}). Para qualquer \nu computável, o teorema de Solomonoff garante que \xi converge para \nu exatamente em sequências \nu-típicas: medindo-se em termos de \nu-quase-todo y_{1:\infty}. Note-se aqui a profunda tensão formal: o Filtro de Estabilidade isola fluxos que se avaliam estritamente como de baixa entropia e estruturados, mapeando-os nativamente como estruturalmente atípicos em comparação com os fluxos de medida \nu padrão não constrangidos de entropia máxima. A menos que a classe filtrada de observadores \mathcal{O} e a classe \nu-típica possuam uma sobreposição matemática não trivial demonstrável, o limite de convergência de Solomonoff não pode ser explorado de forma nativa. Consequentemente, este teorema aplica-se condicionalmente se, e somente se, o fluxo específico do observador filtrado permanecer \nu-típico sob as leis de referência específicas (deixando o conjunto de tais fluxos intersectantes teoricamente conformes formalmente por caracterizar):

-\frac{1}{T} \log \xi(y_{1:T}) \to H(\nu) \quad \text{quando } T \to \infty

onde H(\nu) é a taxa de entropia de \nu. De modo semelhante, -\frac{1}{T} \log \nu(y_{1:T}) \to H(\nu). Assintoticamente, os termos de log-loss por bit da log-verosimilhança convergem e igualam-se, o que significa que a vantagem remanescente no comprimento total de código se isola puramente no comprimento da descrição do modelo:

\left[L_T(\text{OPT}) - L_T(\nu)\right] \to K_0 - K(\nu) < 0 \qquad \text{[uma vez que } K_0 \approx 36 \text{ vs } K(\nu) \sim 1750 \text{]}

Nota: Embora o comprimento de código total mantenha esta vantagem permanente fixa em bits, a vantagem por bit (\frac{K_0 - K(\nu)}{T}) diminui ativamente até zero. Isto não representa uma vantagem assintótica em crescimento contínuo por acumulação de dados, mas antes um desfasamento estrutural rígido e permanente. \blacksquare

Estimativa numérica para \mathcal{M}_1: K(\mathcal{M}_1) - K_0 \approx 1714 bits. Assim que as verosimilhanças de log-loss convergem ao longo de janelas de observação \nu-típicas adequadas, a OPT mantém uma superioridade matemática permanente de codificação total de aproximadamente 1714 bits.


§7. A Vantagem Condicional para T Finito — Teorema T-4e

Para fluxos de comprimento finito, a comparação MDL exige que a vantagem de compressão do IC de T-4c exceda o overhead K_0.

Teorema T-4e (Vantagem MDL Condicional para T Finito). A OPT alcança uma vantagem MDL estrita para T finito sobre \mathcal{M}_1 — isto é, L_T(\text{OPT}) < L_T(\mathcal{M}_1) — se, e somente se, a seguinte condição se verificar:

\boxed{K(\text{IC} \mid \text{SP laws}) > K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y_{1:T}) - \left(-\log P_{\text{SP}}(y_{1:T})\right)\right]}

O termo entre colchetes no lado direito é o défice de log-verosimilhança da OPT em relação a SP no fluxo específico y_{1:T}. A condição é satisfeita sempre que o custo de descrição do IC exceda o overhead combinado da meta-regra e o défice preditivo da OPT neste fluxo.

Prova. Manipulação direta dos comprimentos de código em duas partes:

L_T(\text{OPT}) < L_T(\text{SP}) \iff \quad K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) - \log \xi^{\text{Filter}}(y) < K_{\text{laws}} + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) \iff \quad K(\text{IC} \mid \text{laws}) - K_0 > \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] + \left[K_{\text{laws}} - K_{\text{laws}}\right]

Reordenando (como K_{\text{laws}} se anula em ambos os lados), obtém-se diretamente a condição enunciada. \blacksquare

7.1 Avaliação da Condição para a Cosmologia Padrão

Sob a codificação inflacionária (o caso mais favorável para SP):

Portanto, a condição reduz-se a K(\text{IC} \mid \text{SP laws}) > K_0, isto é, 300 > 36. Isto verifica-se com uma margem estrutural substancial. A condição falha apenas se IC custar menos de \sim 36 bits — isto é, se a IC específica do nosso universo for estruturalmente derivável apenas das leis de SP, gerando menos de 36 bits residuais. Nenhum modelo cosmológico atual alcança isso.


§8. A Tabela Comparativa de MDL

Modelo K(\mathcal{M}) (bits) K(\text{IC}\mid\mathcal{M}) (bits) -\log P(y\mid\mathcal{M}) L_T total classificação MDL
\mathcal{M}_1 — SM + GR \sim 1750 \sim 300 (inflacionário) \sim 0 (determinístico) \sim 2050 2.º (inflacionário)
\mathcal{M}_3 — Boltzmann \sim 1750 \sim 10 \gg 0 (fluxo raro) \gg 1760 Último (verosimilhança catastrófica)
\mathcal{M}_{\text{OPT}} — OPT \sim 36 \sim 0 (condicional via Filtro altamente restringido) \sim 0^* (aprox. determinística do codec) \sim 36 (condicional) 1.º (condicional)

^* Sob a identificação explícita do codec em §9.2, o termo de dados ativo da OPT reduz-se a -\log P_{K_\theta}(y) = -\log P_\text{SP}(y) = 0 assim que K_\theta é identificado com o codec SP.


§9. Limites da Comparação

9.1 K(y \mid \text{Filter}) não é computável

O comprimento de código da OPT K_0 + K(y \mid \text{Filter}) = K_0 - \log \xi^{\text{Filter}}(y) contém um termo que não é computável no sentido de Turing (o problema da paragem impede o cálculo exato de \xi). Na prática, as previsões da OPT têm de ser aproximadas por um codec finito K_\theta — o que corresponde à física padrão. Isto significa que, para fins preditivos, a OPT se reduz ao melhor codec computável disponível. A vantagem MDL da OPT sobre a SP é, portanto, uma vantagem estrutural (na descrição da regra de seleção) e não uma vantagem operacional na formulação de previsões novas.

Isto não é uma falha — é o conteúdo formal correto da afirmação do preprint: “A OPT desloca parte do ónus explicativo da enumeração de leis para a seleção de leis.” O deslocamento é real e formalmente quantificado (\approx 1700 bits para a regra de seleção vs. \mathcal{M}_1), mas não gera novo conteúdo preditivo para além daquilo que o codec já fornece.

9.2 O Problema da Identificação do Codec

O codec OPT K_\theta é a medida computável específica de \mathcal{M} que o Filtro de Estabilidade seleciona. T-4 não determina qual é essa medida — essa identificação requer T-5 (recuperação das constantes) e o programa completo de unificação física. Até que K_\theta seja explicitamente identificado com o MP + RG, a comparação MDL é condicional a essa identificação. O limite formal L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 garante que a OPT não pode ter um desempenho pior do que a SP, mas não garante que tenha um desempenho melhor em tempo finito, a menos que a condição IC de T-4e seja satisfeita — o que ocorre sob pressupostos cosmológicos padrão.

Restrição de P-2. O Apêndice P-2 (Embedding do Espaço de Hilbert via Correção Quântica de Erros) estabelece que, sob ruído local, o codec deve satisfazer uma estrutura QECC — a sua representação interna deve constituir um código quântico de correção de erros com parâmetros específicos (n, k, d). Isto restringe o problema da identificação do codec: K_\theta deixa de ser uma medida computável arbitrária, passando a ser uma medida cujos estados preditivos transportam a geometria corretora de erros de um espaço de Hilbert. Esta restrição é anterior ao programa de recuperação das constantes de T-5 e pode fornecer critérios adicionais de seleção para identificar K_\theta com o Modelo Padrão.

§10. Resumo de Encerramento

Entregáveis de T-4 — Encerramento Confirmado (com Condições de Normalização e Tipicidade)

  1. Convenções de codificação fixadas (§1). MDL em duas partes, complexidade de Kolmogorov prefixa relativa a uma UTM fixa inclusiva, mapeando o domínio dos dados funcionalmente para a corrente consciente y_{1:T} = z_{0:T}.

  2. Classes de referência fixadas (§2). Avalia \mathcal{M}_1 (SM+GR) face a fronteiras triviais como \mathcal{M}_2 (seleção explosiva de parâmetros do escopo generativo) e \mathcal{M}_3 (colapso de verosimilhança de Boltzmann).

  3. T-4a (Complexidade da meta-regra). K(\xi, \text{Filter}) = K_0 \approx 36 bits, incluindo os offsets relativos da UTM.

  4. T-4b (Solomonoff limitado). L_T(\text{OPT}) \leq L_T(\nu) + K_0 + \log(1/\xi(\mathcal{O})). Define explicitamente o parâmetro de penalização de normalização algorítmica.

  5. Conjetura T-4c (Limite Heurístico de Compressão de IC). A redundância estrutural das condições iniciais é o mecanismo conjeturado da compressão: \Delta_{\text{IC}} = K(\text{IC}\mid\text{SP}) - K(\text{IC}\mid\text{OPT}) \geq 0, embora a unicidade do mapeamento apenas condicionalmente. Isto funciona como um limite heurístico, não como um teorema formalmente demonstrado.

  6. T-4d (Vantagem do Modelo de Bits Constantes). Delimita condicionalmente o comportamento no limite: para referências computáveis cuja classe \nu-típica se sobrepõe de modo não trivial com \mathcal{O}, a OPT assegura uma vantagem permanente de complexidade numérica (\sim -1714 bits), embora a sua densidade infinita por bit escale para zero.

  7. T-4e (Vantagem em T finito — condicional). A OPT supera numericamente \mathcal{M}_1 em T finito exatamente quando as perdas empíricas pontuais não revertem a fronteira estrutural central K(\text{IC}\mid\text{SP}) > K_0 (300 > 36). Concentra a vulnerabilidade diretamente nas hipóteses de dominância algorítmica pontual.

Condições de falseabilidade para a tese MDL

Dependências a jusante


Este apêndice é mantido como parte do repositório do projeto OPT, juntamente com theoretical_roadmap.pdf. Referências: Rissanen (1978) [12], Li & Vitányi (2008) [27], Solomonoff (1964) [11], Penrose (2004).