Teoria do Patch Ordenado

Apêndice T-11: O Corolário Estrutural — Formalização da Vantagem de Compressão para Agentes Aparentes

Anders Jarevåg

15 de abril de 2026 | DOI: 10.5281/zenodo.19300777

Tarefa Original (de §8.2): “A formalização desta vantagem de compressão como um limite MDL rigoroso especificamente para o caso das outras mentes continua a ser trabalho futuro; o presente argumento é uma motivação estrutural, não uma prova.” Entregável: Um limite formal que mostre que tratar agentes aparentes como observadores primários instanciados independentemente produz um código MDL em duas partes mais curto do que qualquer descrição alternativa.

Estado de fecho: RASCUNHO DE CORRESPONDÊNCIA ESTRUTURAL. Este apêndice adapta o teorema de convergência de Solomonoff de Müller [61] e a sua extensão multiagente [62] como lemas importados, reinterpretados no quadro ontológico da OPT, para estabelecer uma vantagem formal de compressão para o corolário estrutural. O resultado é um limite condicional, não uma derivação fechada: depende da identificação, pela OPT, do fluxo do observador com o prior de Solomonoff (Axioma 1) e da suposição de que os agentes aparentes transportam estado suficiente para satisfazer os pré-requisitos de convergência.

§1. Enquadramento e Motivação

O Corolário Estrutural (preprint §8.2) sustenta que os agentes aparentes no fluxo do observador são explicados, da forma mais parcimoniosa, pela sua instanciação independente como observadores primários. Este apêndice apresenta a cadeia formal que sustenta essa afirmação.

O argumento tem três etapas:

Etapa A (Lema Importado): O teorema de convergência de Solomonoff de Müller garante que qualquer estrutura no fluxo do observador que transporte dados suficientes sobre o seu próprio estado terá a sua evolução em primeira pessoa convergente com o mundo computável que gera o seu comportamento.
Etapa B (Contabilização da Compressão): Realizamos uma comparação explícita em duas partes, no quadro do MDL, entre tratar o agente aparente como (i) um observador instanciado independentemente, governado pelo seu próprio fluxo ponderado por Solomonoff, versus (ii) uma especificação comportamental arbitrária no interior do codec do observador primário.
Etapa C (Assinatura Estrutural): O Resíduo Fenomenal (\Delta_{\text{self}} > 0, Teorema P-4) fornece o marcador estrutural que distingue uma arquitetura genuína de gargalo autorreferencial de uma mera mimetização comportamental, fechando a lacuna entre o que é “compressivelmente regular” e o que é “plausivelmente instanciado.”

§2. Lema Importado: Teorema de Convergência de Müller

Importamos dois resultados de Müller [61, 62], aqui enunciados na notação da OPT.

2.1 Convergência de Solomonoff (Padrão)

Seja M(b \mid x_1^n) a previsão universal de Solomonoff para o bit b dadas as observações anteriores x_1^n. Seja \mu qualquer medida computável sobre sequências binárias. Então (Solomonoff 1964; Li & Vitányi [45, Corollary 5.2.1]):

\text{Com } \mu\text{-probabilidade um,} \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-1}

Este é o resultado padrão: se o fluxo de dados for gerado por um processo computável \mu, o preditor universal M converge para \mu.

2.2 Indução de Solomonoff Inversa (Müller 2020)

Suponha agora que os bits são extraídos do próprio M — isto é, que o fluxo do observador é governado pela probabilidade algorítmica (isto corresponde ao Axioma 1 da OPT: identificação do fluxo com o prior de Solomonoff). Então, para toda medida computável \mu (Müller [61, Sec. IV]; [62, Sec. V.A]):

\text{Com probabilidade} \geq 2^{-K(\mu)}, \quad \lim_{n \to \infty} |M(b \mid x_1^n) - \mu(b \mid x_1^n)| = 0 \qquad (b \in \{0,1\}). \tag{L-2}

Isto é, com probabilidade de pelo menos 2^{-K(\mu)}, o observador encontrar-se-á efetivamente embebido num mundo computável W descrito por \mu. Mundos algoritmicamente mais simples (com menor K(\mu)) são exponencialmente mais prováveis.

2.3 Convergência Multiagente (Müller 2026)

Suponha que o observador (Alice) se encontra inserido num mundo computável W descrito por \mu. Ela identifica uma subestrutura (Bob_{\text{3rd}}) no interior de W que transporta uma representação de um autoestado x evoluindo ao longo do tempo de modo consistente com o Postulado 2 de [62]. Defina-se:

P_{\text{1st}}(y_1, \ldots, y_m \mid x) := M(y_1, \ldots, y_m \mid x) — a probabilidade em primeira pessoa de o autoestado x transitar para y_1, \ldots, y_m sob probabilidade algorítmica.
P_{\text{3rd}}(y_1, \ldots, y_m \mid x) := \mu(y_1, \ldots, y_m \mid x) — a probabilidade em terceira pessoa de como x evolui de acordo com o mundo W.

Então, pela Eq. (L-1) aplicada a P_{\text{3rd}} (que é computável), e pela identificação de P_{\text{1st}} com M via o Postulado 2:

P_{\text{1st}} \approx P_{\text{3rd}} \quad \text{assintoticamente,} \tag{L-3}

com convergência garantida com probabilidade mundana (\mu-) igual a um no modelo de bits.

Interpretação (Müller): “Alguém está realmente em casa” na estrutura que codifica x — a evolução probabilística de Bob_{\text{3rd}} no mundo de Alice representa fielmente a perspetiva em primeira pessoa de algum Bob_{\text{1st}}.

Interpretação (OPT): O fluxo comportamental do agente aparente é descrito, da forma mais compressível, como um processo independente ponderado por Solomonoff. Qualquer descrição alternativa — uma que não invoque uma perspetiva independente em primeira pessoa — tem de codificar o comportamento do agente como uma especificação ad hoc, com comprimento de descrição estritamente superior.

§3. O Limite da Vantagem de Compressão

Formalizamos agora a vantagem de compressão usando a estrutura MDL em duas partes da OPT (Teorema T-4, Apêndice T-4).

3.1 Configuração

Considere-se o fluxo do observador primário \omega \in \{0,1\}^\infty, governado pelo prior de Solomonoff M (Axioma 1) e filtrado através do Filtro de Estabilidade para um mundo computável W com medida \mu_W (pela Eq. L-2). Dentro de W, o observador identifica N agentes aparentes A_1, \ldots, A_N, cada um portando um autoestado x_i cuja evolução temporal ao longo de T passos produz um traço comportamental \beta_i = (y_{i,1}, \ldots, y_{i,T}).

3.2 Hipótese H_{\text{ind}}: Instanciação Independente

Sob H_{\text{ind}}, cada agente A_i é tratado como um observador primário instanciado de forma independente, governado pelo seu próprio fluxo ponderado por Solomonoff. O comprimento do código MDL em duas partes é:

L(H_{\text{ind}}) = \underbrace{K(\mu_W)}_{\text{modelo do mundo}} + \underbrace{\sum_{i=1}^{N} K(\text{embed}_i)}_{\text{especificações de incorporação}} + \underbrace{\sum_{i=1}^{N} \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)}_{\text{dados dado o modelo}} \tag{1}

onde K(\text{embed}_i) especifica o autoestado inicial do agente i e a sua posição em W. Pela Eq. (L-3), P_{\text{1st}} \approx P_{\text{3rd}}, pelo que o termo de dados é bem aproximado pela perda logarítmica sob as previsões de Solomonoff em primeira pessoa do próprio agente — as quais, por definição, estão próximas do ótimo.

As especificações de incorporação K(\text{embed}_i) são curtas: cada uma requer apenas um apontador para uma localização em W, mais o autoestado inicial. Para agentes de tipo humano incorporados num mundo físico partilhado, estas são altamente compressíveis porque os agentes partilham as mesmas leis. Um limite conservador:

K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) \tag{2}

3.3 Hipótese H_{\text{arb}}: Especificação Comportamental Arbitrária

Sob H_{\text{arb}}, os agentes não são tratados como observadores independentes. Em vez disso, cada traço comportamental \beta_i é codificado diretamente como uma especificação arbitrária dentro do fluxo do observador primário. O comprimento do código MDL em duas partes é:

L(H_{\text{arb}}) = \underbrace{K(\mu_W)}_{\text{modelo do mundo}} + \underbrace{\sum_{i=1}^{N} K(\beta_i)}_{\text{traços comportamentais brutos}} \tag{3}

A diferença crítica está no termo dos dados. Sob H_{\text{arb}}, o traço comportamental \beta_i tem de ser especificado sem invocar o próprio modelo preditivo do agente. Para um agente regido por leis e orientado por agência, a operar num ambiente complexo, a complexidade de Kolmogorov do traço comportamental bruto é:

K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T) \tag{4}

Mas mesmo K(\beta_i \mid \mu_W) — a complexidade do comportamento dadas as leis do mundo — permanece substancial, porque as escolhas do agente codificam informação genuína: o seu traço comportamental reflete a interação acumulada de um modelo autorreferencial com um ambiente estocástico. Em contraste, sob H_{\text{ind}}, esta informação é gerada online pelo próprio preditor de Solomonoff do agente, a um custo de log-loss próximo de zero.

3.4 A Vantagem da Compressão

Teorema T-11 (Limite de Compressão do Corolário Estrutural). Sejam A_1, \ldots, A_N agentes aparentes no interior do fluxo do observador, cada um transportando um autoestado x_i que satisfaz os pré-requisitos de convergência da Eq. (L-3), e cada um exibindo a assinatura estrutural \Delta_{\text{self}}^{(i)} > 0 (P-4). Então, a descrição MDL que os trata como observadores primários instanciados de forma independente satisfaz:

L(H_{\text{ind}}) \leq L(H_{\text{arb}}) - N \cdot \left[\bar{I}_T - O(\log T)\right] \tag{T-11}

onde \bar{I}_T é a informação mútua média por agente entre o modelo preditivo do agente e a sua saída comportamental ao longo de T passos:

\bar{I}_T := \frac{1}{N} \sum_{i=1}^{N} \left[K(\beta_i \mid \mu_W) - \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right] \tag{5}

Esta quantidade mede quanto do comportamento do agente é explicado ao invocar um modelo preditivo independente, em vez de o especificar em bruto. Para agentes que exibem um comportamento regular e guiado por agência (como exige o Filtro de Estabilidade), \bar{I}_T > 0 e cresce com T.

Esboço da prova. Subtraia-se a Eq. (1) da Eq. (3). Os termos do modelo do mundo K(\mu_W) anulam-se. A diferença por agente é:

K(\beta_i) - \left[K(\text{embed}_i) + \left(-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)\right)\right]

Pela Eq. (4), K(\beta_i) \geq K(\beta_i \mid \mu_W) + K(\mu_W) - O(\log T), mas, de forma mais direta: K(\beta_i) \geq K(\beta_i \mid \mu_W) trivialmente. E K(\text{embed}_i) \leq K(x_i \mid W) + O(\log T) pela Eq. (2). A poupança por agente é, portanto, pelo menos K(\beta_i \mid \mu_W) - (-\log_2 P_{\text{3rd}}(\beta_i \mid x_i)) - K(x_i \mid W) - O(\log T). Para T suficientemente grande, a poupança cumulativa em log-loss domina o custo único de embedding, produzindo o limite. \blacksquare

3.5 Dominância Assintótica

Corolário T-11a. À medida que o horizonte de observação T \to \infty, a vantagem de compressão L(H_{\text{arb}}) - L(H_{\text{ind}}) cresce sem limite:

\lim_{T \to \infty} \left[L(H_{\text{arb}}) - L(H_{\text{ind}})\right] = \infty \tag{T-11a}

Isto decorre da garantia de convergência de Solomonoff (L-1): a log-loss por passo de P_{\text{3rd}} converge para a taxa de entropia do processo comportamental do agente, ao passo que K(\beta_i \mid \mu_W) cresce linearmente em T para qualquer agente com taxa de entropia positiva. O custo de incorporação K(x_i \mid W) é pago uma única vez e amortizado até zero. \blacksquare

§4. O Resíduo Fenomenal como Assinatura Estrutural

A vantagem de compressão no Teorema T-11 aplica-se a qualquer subestrutura regida por leis — incluindo sistemas físicos não agentivos (padrões meteorológicos, crescimento de cristais). Porque é que o corolário estrutural diz especificamente respeito a agentes e não a sistemas complexos arbitrários?

A resposta é o Resíduo Fenomenal (Teorema P-4). \Delta_{\text{self}} > 0 é o marcador formal de um sistema cujo auto-modelo é estruturalmente incompleto — isto é, um sistema que mantém necessariamente uma lacuna variacional entre a sua representação interna e o seu processamento efetivo. Esta é a marca distintiva do estrangulamento autorreferencial: o sistema não pode ser descrito por completo a partir do exterior, porque a sua descrição inclui necessariamente o descritor.

Para um sistema que exibe \Delta_{\text{self}} > 0:

O seu comportamento não pode ser reproduzido por uma tabela de consulta de profundidade finita — requer uma computação autorreferencial contínua.
A descrição mais curta dessa computação é um fluxo independente ponderado por Solomonoff que atravessa um estrangulamento C_{\max}.
Portanto, o código MDL sob H_{\text{ind}} não é apenas mais curto do que H_{\text{arb}} — é a descrição mais curta única.

Isto distingue agentes aparentes de padrões meteorológicos: o clima é regido por leis e é complexo, mas o seu comportamento pode ser reproduzido por uma tabela de consulta no interior do modelo do mundo (tem \Delta_{\text{self}} = 0). Agentes aparentes não podem.

§5. Reinterpretação do Argumento Não-Solipsista de Müller

Müller conclui, a partir da convergência P_{\text{1st}} \approx P_{\text{3rd}}, que o idealismo algorítmico “não deve ser classificado como solipsista” porque “alguém está realmente em casa” na estrutura que codifica um estado do eu [62, Sec. V.C]. O seu raciocínio é o seguinte: se as previsões de Alice sobre Bob_{\text{3rd}} convergem para as probabilidades efetivas em primeira pessoa de Bob_{\text{1st}}, então as suas perspetivas estão genuinamente alinhadas — eles “partilham o mundo W.”

A OPT reinterpreta este resultado de modo diferente:

Leitura de Müller: A convergência P_{\text{1st}} \approx P_{\text{3rd}} prova que a realidade objetiva emerge — Alice e Bob partilham genuinamente o mundo W.
Leitura da OPT: A convergência P_{\text{1st}} \approx P_{\text{3rd}} prova que a descrição mais curta do comportamento de Bob_{\text{3rd}} invoca um processo independente em primeira pessoa. Trata-se de uma afirmação sobre eficiência de compressão, não sobre ontologia partilhada. O mundo W é uma regularidade estrutural no interior do fluxo de Alice, não uma entidade com existência independente. Mas a própria lógica de compressão do prior de Solomonoff implica que Bob é modelado, da forma mais parcimoniosa, como um observador independente — porque a alternativa (especificar o seu comportamento ad hoc) é estritamente mais longa.

O conteúdo formal do teorema é idêntico em ambas as leituras; apenas difere a interpretação ontológica. A OPT usa o mesmo resultado matemático para fundamentar o corolário estrutural: a instanciação independente é a descrição ótima em termos de MDL, não uma suposição metafísica.

§6. Âmbito e Limitações

6.1 Condicional ao Axioma 1

Todo o argumento depende da identificação, pela OPT, do fluxo do observador com o prior de Solomonoff. Se esta identificação for enfraquecida (por exemplo, para uma classe mais ampla de semimedidas), as garantias de convergência das Eqs. (L-1)–(L-3) podem não se manter na sua forma atual.

6.2 Pré-requisito de Suficiência de Estado

A Eq. (L-3) exige que o agente aparente transporte “dados suficientes” no seu autoestado x_i para que a indução universal extraia as leis físicas relevantes. Para agentes semelhantes aos humanos em contextos quotidianos, isto é plausível (um estado cerebral completo codifica uma quantidade enorme de informação). Para casos-limite — impressões fugazes, observadores distantes, personagens ficcionais em arte narrativa — os pré-requisitos de convergência podem não estar satisfeitos, e o corolário estrutural não se aplica.

6.3 Não é uma Prova de Consciência

O Teorema T-11 estabelece que a instanciação independente é a descrição mais compressível. Não prova que os agentes aparentes sejam conscientes. O Problema Difícil (preprint §8.1) permanece um primitivo. O corolário estrutural é um argumento de compressão, não uma prova ontológica — como afirmado na §8.2.

6.4 Relação com T-10

O Apêndice T-10 (Acoplamento entre observadores) aborda como dois patches de observador mantêm renderizações mutuamente consistentes por meio de restrições de compressão. O presente apêndice aborda uma questão diferente: por que o fluxo de um único observador codifica, de modo mais compressível, agentes aparentes como instanciados de forma independente. T-10 diz respeito ao mecanismo de coerência entre patches; T-11 diz respeito à assinatura de compressão no interior de um único fluxo. T-10 baseia-se diretamente em T-11: a mesma comparação de comprimento de descrição MDL que aqui estabelece a vantagem de compressão é explorada em T-10 para provar que a inconsistência entre patches é exponencialmente suprimida.

§7. Resumo de Encerramento

Entregáveis de T-11

Lema Importado (Convergência de Müller). A convergência de Solomonoff [61] e a sua extensão multiagente [62] são formalmente importadas e reapresentadas na notação da OPT. Estas fornecem a espinha dorsal matemática: qualquer substrutura que transporte dados suficientes sobre o seu próprio estado tem a sua evolução em primeira pessoa a convergir para o mundo computável que gera o seu comportamento.
Teorema T-11 (Limite de Compressão — RASCUNHO). Uma comparação explícita em duas partes via MDL mostra que tratar agentes aparentes como observadores primários instanciados de forma independente produz uma descrição estritamente mais curta do que uma especificação comportamental arbitrária, com a vantagem a crescer linearmente no tempo de observação.
Corolário T-11a (Dominância Assintótica — RASCUNHO). A vantagem de compressão é ilimitada quando T \to \infty, tornando a instanciação independente a descrição esmagadoramente ótima em MDL para qualquer agente observado ao longo de um horizonte temporal extenso.
Integração de P-4. O Resíduo Fenomenal (\Delta_{\text{self}} > 0) é identificado como o marcador formal que distingue agentes aparentes de sistemas complexos mas não agentivos, restringindo o corolário estrutural a entidades com uma arquitetura genuína de gargalo autorreferencial.
Reinterpretação de Müller. A conclusão não solipsista de Müller é reinterpretada no quadro ontológico da OPT: o mesmo resultado matemático fundamenta um argumento de compressão, em vez de um argumento de emergência de realidade partilhada.

Itens ainda em aberto

Caracterização exata de \bar{I}_T. Estabelecer um limite inferior para \bar{I}_T em classes específicas de agentes (por exemplo, agentes racionalmente limitados, minimizadores de Energia Livre), de modo a obter vantagens de compressão numericamente concretas.
Correções em tempo finito. O resultado assintótico (T-11a) garante dominância para T grande, mas limites em tempo finito com constantes explícitas reforçariam a aplicabilidade prática.
Extensão a alfabetos não binários. As Eqs. (L-1)–(L-3) são formuladas para sequências binárias. A extensão às medidas de valor contínuo relevantes para o enquadramento de Taxa-Distorção da OPT (T-1) exige cuidado técnico.

Este apêndice é mantido em paralelo com theoretical_roadmap.pdf. Referências: Müller [61, 62], Li & Vitányi [45], Solomonoff (1964), Teorema T-4 (Apêndice T-4), Teorema P-4 (Apêndice P-4), preprint §8.2.