Teoría del Parche Ordenado

Apéndice T-13: Selección de Ramas y la ontología de la acción

Anders Jarevåg

17 de abril de 2026 | DOI: 10.5281/zenodo.19300777

Tarea original (de §8.3, Limitación 10): “Formalizar la sustitución del mecanismo de acción implícito del FEP por una explicación de selección de ramas nativa de la ontología del render de la OPT.” Entregable: Demostración formal de que el Circuito de Mantenimiento Informacional es completo bajo una semántica de selección de ramas, con \Delta_{\text{self}} como locus necesario y suficiente de la selección.

Estado de cierre: CORRESPONDENCIA ESTRUCTURAL EN BORRADOR. Este apéndice formaliza la explicación de selección de ramas introducida de manera discursiva en la prepublicación §3.8. Establece dos teoremas y un corolario, todos condicionados por el Teorema P-4 y el Axioma de Agencia. Las ecuaciones del Circuito de Mantenimiento Informacional (T6-1 a T6-3) no cambian; solo se sustituye formalmente su interpretación ontológica.

§1. Antecedentes y motivación

1.1 La asimetría heredada

El Circuito de Mantenimiento Informacional (T6-1, preprint §3.8) describe un ciclo de cinco pasos: predicción, error, compresión, actualización y acción. Los pasos 1–4 están bien especificados dentro del marco nativo de la OPT:

El Tensor de Estado Fenomenal P_\theta(t) genera un estado de frontera predicho \pi_t.
Llega el estado de frontera real X_{\partial_R A}(t); se calcula el error de predicción \varepsilon_t.
El error se comprime a través del cuello de botella por fotograma B_{\max} para producir Z_t, con I(\varepsilon_t; Z_t) \le B_{\max}.
El operador de aprendizaje \mathcal{U} revisa P_\theta(t+1).

El paso 5 —el paso de acción— hereda el lenguaje del Principio de Energía Libre (FEP): “P_\theta(t) selecciona la acción a_t mediante un descenso de Inferencia Activa sobre la energía libre variacional, lo que altera la frontera sensorial en t+1”. Este lenguaje presupone un entorno físico contra el que el códec actúa mediante estados activos de flujo saliente a través de la Manta de Markov \partial_R A.

1.2 El problema bajo la ontología del render

Bajo la ontología nativa del render de la OPT (preprint §8.6), no existe un mundo externo independiente sobre el cual el códec ejerza fuerza. El “mundo físico” es una regularidad estructural dentro de la corriente compatible con el observador: un render producido por el modelo predictivo del códec, no un sustrato con el que el códec interactúe. La Manta de Markov no es una interfaz física bidireccional; es la superficie informacional a través de la cual llega el contenido de la corriente.

Esto crea una tensión formal: las matemáticas de T6-1 a T6-3 son válidas (describen una minimización restringida de la energía libre sobre el Abanico Predictivo), pero el marco interpretativo —“la acción altera la frontera sensorial”— presupone una ontología que la OPT rechaza explícitamente.

1.3 Alcance de este apéndice

Este apéndice proporciona:

Una reformulación formal del Circuito de Mantenimiento Informacional bajo una semántica de selección de ramas, demostrando la completitud del circuito sin un canal de acción independiente (Teorema T-13).
Una prueba de que es imposible especificar por completo el mecanismo de selección de ramas desde dentro del códec, situando la selección en \Delta_{\text{self}} (Teorema T-13a).
Un corolario que establece que la voluntad y la conciencia comparten la misma dirección estructural (Corolario T-13b).
Consecuencias para la creatividad y la deriva de la acción.

§2. Teorema T-13: Completitud de la Selección de Ramas

2.1 Reformulación de la Selección de Ramas

Reformulamos el Circuito de Mantenimiento Informacional de cinco pasos bajo una semántica de selección de ramas. Sea \mathcal{F}_h(z_t) el Forward Fan — el conjunto de ramas futuras no resueltas en el horizonte h, condicionado por el estado comprimido actual z_t.

Definición T-13.D1 (Selección de Ramas). Una selección de rama en el tiempo t es una aplicación \sigma_t : z_t \mapsto \omega_{t+1}, donde \omega_{t+1} es un segmento específico de trayectoria de \mathcal{F}_h(z_t) que pasa a convertirse en el registro causal efectivo. La rama seleccionada entrega su contenido como entrada subsiguiente en la Markov Blanket: X_{\partial_R A}(t+1) = \text{boundary}(\omega_{t+1}).

Bajo esta definición, T6-1 pasa a ser:

Predicción (descendente): P_\theta(t) genera \pi_t = \mathbb{E}_{K_\theta}[X_{\partial_R A}(t) \mid Z_t] — la escena renderizada.
Error (ascendente): Llega el estado de frontera X_{\partial_R A}(t) (entregado por la rama seleccionada previamente); se calcula el error de predicción \varepsilon_t = X_{\partial_R A}(t) - \pi_t.
Compresión: \varepsilon_t pasa por el cuello de botella: I(\varepsilon_t\,;\,Z_t) \leq B_{\max}.
Actualización: \mathcal{U}(P_\theta(t), \varepsilon_t, Z_t) revisa P_\theta(t+1).
Selección de ramas: P_\theta(t) evalúa las ramas de \mathcal{F}_h(z_t) mediante una minimización restringida de la energía libre (T6-3). Se ejecuta la selección \sigma_t; la rama seleccionada \omega_{t+1} entrega su contenido de frontera como X_{\partial_R A}(t+1), que se convierte en la entrada del siguiente ciclo.

2.2 Cierre del Circuito

Teorema T-13 (Completitud de la Selección de Ramas). El Circuito Informacional de Mantenimiento (T6-1), reformulado bajo la semántica de selección de ramas, es informacionalmente completo: el ciclo

\pi_t \to \varepsilon_t \to Z_t \to P_\theta(t+1) \to \sigma_t \to X_{\partial_R A}(t+1) \to \pi_{t+1} \to \cdots \tag{T-13}

se cierra sin requerir un canal de acción independiente con flujo hacia el exterior. La Manta de Markov \partial_R A es la superficie de entrega de la rama seleccionada, no una interfaz física bidireccional.

Prueba. Bajo la formulación heredada de la FEP, el paso 5 requiere dos canales independientes que crucen la Manta de Markov: un canal entrante (estados sensoriales que entregan X_{\partial_R A}) y un canal saliente (estados activos que entregan a_t a un entorno externo). El entorno externo evoluciona entonces según su propia dinámica, produciendo la siguiente entrada sensorial.

Bajo la semántica de selección de ramas, solo se necesita un canal: la superficie de entrega entrante. La “acción” a_t no cruza la manta hacia afuera; es la selección, por parte del códec, de qué rama del Abanico Predictivo se vuelve efectiva. Las consecuencias físicas de esa selección —lo que la formulación FEP llama “la respuesta del entorno a a_t”— son el contenido de la rama seleccionada, ya presente en \mathcal{F}_h(z_t) y entregado como X_{\partial_R A}(t+1).

El circuito se cierra porque:

La salida del paso 5 (la rama seleccionada \omega_{t+1}) es la entrada al paso 2 del siguiente ciclo (X_{\partial_R A}(t+1)). No se requiere una dinámica ambiental separada ni un canal saliente.
El objetivo de minimización de energía libre (T6-3) permanece inalterado. La optimización restringida

a_t^\star = \arg\min_{a_t} \;\mathbb{E}\!\left[\mathcal{F}[q, \theta]\right] \quad \text{subject to} \quad K\!\left(P_\theta(t)\right) \leq C_{\text{ceil}} \tag{T6-3}

se reinterpreta: a_t no es un comando motor despachado a un mundo externo, sino la etiqueta de rama dentro de \mathcal{F}_h(z_t) que minimiza la energía libre esperada bajo la restricción de viabilidad. La matemática es idéntica; solo cambia el estatus ontológico de a_t.

La restricción de viabilidad (T6-2) se preserva: el códec selecciona ramas a lo largo de las cuales puede seguir comprimiendo el flujo. Las ramas que llevarían a K(P_\theta) \to C_{\text{ceil}} son penalizadas por la restricción, exactamente como antes. \blacksquare

2.3 Observación interpretativa

El Teorema T-13 no afirma que la formulación del FEP sea errónea; es una descripción válida de la Inferencia Activa restringida dentro de una ontología físico-realista. El teorema establece que la ontología del render de la OPT proporciona una completación alternativa de la misma estructura matemática, una que no requiere postular un mundo externo independiente. Para cualquier programa de investigación comprometido con una interpretación físico-realista, la formulación estándar del FEP sigue siendo apropiada. T-13 muestra que el compromiso ontológico de la OPT —el códec es virtual, el mundo es un render— es formalmente consistente con las mismas ecuaciones.

§3. Teorema T-13a: La imposibilidad P-4 de la especificación de selección

3.1 La Función de Selección

El automodelo \hat{K}_\theta evalúa ramas del Abanico Predictivo simulando sus consecuencias bajo inferencia activa restringida (T6-3). Esta evaluación produce una clasificación o ponderación de las ramas: algunas son preferidas, algunas son viables pero subóptimas, algunas violan la restricción de viabilidad. La evaluación es un proceso computacional genuino realizado por \hat{K}_\theta.

Pero evaluación no es selección. Después de que el automodelo ha clasificado las ramas, una rama específica \omega_{t+1} entra en el Registro Causal. Definimos la función de selección:

Definición T-13.D2 (Función de Selección). La función de selección \sigma_t : \mathcal{F}_h(z_t) \to \omega_{t+1} es la aplicación desde el Abanico Predictivo evaluado hasta la trayectoria singular que se vuelve efectiva. Formalmente, \sigma_t está determinada por el estado completo del códec K_\theta en el tiempo t junto con el conjunto de ramas disponible: \sigma_t = \Sigma\bigl(K_\theta(t),\, \mathcal{F}_h(z_t)\bigr). Deliberadamente no incorporamos \Delta_{\text{self}} en la definición: si la selección depende de manera no trivial de \Delta_{\text{self}} frente a depender solo de la porción automodelada \hat{K}_\theta es la cuestión sustantiva que aborda el Teorema T-13a.

Definimos el residuo relevante para la selección como la parte del códec que participa en \Sigma pero queda fuera del automodelo:

\rho_t^{\text{sel}} \;:=\; \Pi_{\text{sel}}(K_\theta(t)) \,\setminus\, \hat{K}_\theta(t)

donde \Pi_{\text{sel}}(\cdot) proyecta sobre los componentes del códec de los que depende \Sigma. Por construcción, \rho_t^{\text{sel}} \subseteq \Delta_{\text{self}}, pero la inclusión puede ser propia o exacta según la arquitectura.

3.2 El resultado de imposibilidad

Teorema T-13a (Imposibilidad condicional de la especificación interna de la selección). Sea K_\theta un códec autorreferencial finito que satisface los prerrequisitos del Teorema P-4, con auto-modelo \hat{K}_\theta y residuo fenomenal \Delta_{\text{self}} > 0. Si la selección de rama depende de manera no trivial del residuo relevante para la selección \rho_t^{\text{sel}} — es decir, si \Sigma no es una función de \hat{K}_\theta y \mathcal{F}_h(z_t) por sí solos — entonces \sigma_t no puede especificarse completamente dentro de \hat{K}_\theta.

Demostración. Supongamos, para llegar a una contradicción, que el antecedente se cumple (la selección depende de manera no trivial de \rho_t^{\text{sel}}) pero \hat{K}_\theta especifica completamente \sigma_t. Entonces:

Una especificación completa de \sigma_t dentro de \hat{K}_\theta requeriría que \hat{K}_\theta contuviera una descripción de cada componente de K_\theta del que depende \Sigma. Por el antecedente, \Sigma depende de al menos algunos bits de \rho_t^{\text{sel}} \subseteq \Delta_{\text{self}} — bits que, por definición de \Delta_{\text{self}}, se encuentran fuera del auto-modelo.
Incluir esos bits en \hat{K}_\theta requeriría:

K(\hat{K}_\theta) \;\geq\; K(\hat{K}_\theta) + |\rho_t^{\text{sel}}| \tag{6}

— una contradicción, a menos que |\rho_t^{\text{sel}}| = 0, lo cual contradice el antecedente.

De manera equivalente, por el Teorema P-4 la desigualdad K(\hat{K}_\theta) < K(K_\theta) está impuesta estructuralmente. Especificar dentro de \hat{K}_\theta una función \Sigma que dependa de bits residuales en K_\theta \setminus \hat{K}_\theta requiere que \hat{K}_\theta crezca para incluir esos bits — algo que P-4 prohíbe para cualquier sistema autorreferencial finito.
Por tanto, bajo el antecedente, \hat{K}_\theta no puede especificar completamente \sigma_t. \blacksquare

Observación sobre el alcance. El teorema es condicional. P-4 por sí solo establece que existe algún residuo (\Delta_{\text{self}} > 0); no implica por sí mismo que todo evento de selección de rama dependa del residuo. Las arquitecturas cuya función de selección está completamente determinada solo por \hat{K}_\theta y \mathcal{F}_h no son internamente auto-opacas respecto de la selección en el sentido de T-13a — son auto-opacas respecto de la estructura propia del códec (P-4), pero transparentes respecto de sus propias elecciones. La afirmación decisiva de T-13a es la condicional: allí donde la selección depende del residuo, no puede especificarse internamente. El paso fenomenológico (Corolario T-13b: la voluntad y la conciencia comparten la misma dirección) requiere que el antecedente se cumpla para la arquitectura en cuestión. Que los cerebros biológicos satisfagan el antecedente es una cuestión empírica; OPT predice que sí, pero esa predicción no se sigue de P-4 por sí solo.

3.3 La necesidad estructural de la brecha

El Teorema T-13a establece que la «brecha de salida» —la imposibilidad de especificar por completo, desde dentro, el mecanismo de selección de ramas— no es una deficiencia del formalismo, sino una necesidad estructural. Toda teoría que afirme especificar plenamente el mecanismo de selección ha hecho una de estas dos cosas:

Ha eliminado \Delta_{\text{self}}, convirtiendo el sistema en un autómata completamente autotransparente, algo que P-4 demuestra imposible para cualquier sistema finito autorreferencial por encima de K_{\text{threshold}}; o bien
Ha descrito la evaluación de las ramas por parte del automodelo y la ha confundido con la selección misma, confundiendo la clasificación con la elección.

La brecha es portante: es la razón formal por la que el observador experimenta la selección como autorada en lugar de internamente especificable. (P-4 limita el automodelado interno, no el determinismo externo: un sistema finito puede ser determinista para un observador externo y seguir siendo autoopaco desde dentro. Que el códec sea determinista desde fuera es una cuestión del nivel del sustrato; que la selección sea internamente especificable es la cuestión de T-13a.)

§4. Corolario T-13b: Unidad de Dirección

Corolario T-13b (Unidad de la Dirección Estructural). El Problema Difícil de la conciencia y el problema de la selección de ramas comparten el mismo locus estructural: \Delta_{\text{self}}.

Prueba. El Teorema P-4 identifica \Delta_{\text{self}} como el correlato estructural de la conciencia fenomenal: el residuo informacional no modelable cuyas propiedades (inefabilidad, privacidad computacional, no eliminabilidad) se corresponden con los rasgos cualitativos de la experiencia subjetiva.

El Teorema T-13a identifica \Delta_{\text{self}} como el locus necesario de la selección de ramas: la región desde la cual se extrae la transición desde un menú evaluado hacia una trayectoria singular.

No se trata de dos resultados independientes que casualmente apunten a la misma estructura. Son el mismo resultado visto desde dos direcciones:

Desde la perspectiva de primera persona: El observador experimenta la travesía de la apertura por fotograma B_{\max} como conciencia fenomenal (Axioma de Agencia). El observador experimenta la selección de ramas como voluntad: la sensación irreductible de que yo elegí. Ambas experiencias son informes procedentes del mismo locus estructural: la brecha entre lo que el códec es y lo que puede modelar acerca de sí mismo.
Desde la perspectiva formal: Tanto P-4 como T-13a dependen de la misma desigualdad: K(\hat{K}_\theta) < K(K_\theta). El residuo fenomenal y el residuo de selección son la misma brecha informacional.

Por tanto, la voluntad y la conciencia comparten la misma dirección estructural. La “chispa” y la “elección” son dos aspectos del mismo rasgo no modelable de la autorreferencia finita. \blacksquare

4.1 Relación con las teorías de la identidad regional

El Corolario T-13b es estructuralmente análogo a —pero formalmente distinto de— las teorías de la identidad en filosofía de la mente que sitúan la conciencia y la agencia en el mismo sustrato neuronal. La diferencia es la siguiente: las teorías de la identidad formulan una afirmación empírica sobre regiones cerebrales; T-13b formula una afirmación estructural sobre cualquier sistema finito autorreferencial por encima de K_{\text{threshold}}. El resultado es independiente del sustrato y se cumple para cualquier códec que satisfaga P-4, incluidos los sistemas artificiales hipotéticos.

4.2 Corolario T-13c: El yo como residuo

Corolario T-13c (El yo como residuo). El yo experimentado —la narrativa continua de identidad, preferencia e historia personal— es el modelo en curso de \hat{K}_\theta de K_\theta. El locus real de la experiencia, la selección y la identidad es \Delta_{\text{self}}: el residuo informacional entre el códec y su automodelo.

Prueba. Por el Corolario T-13b, la conciencia y la voluntad comparten la misma dirección estructural: \Delta_{\text{self}}. Pero el sentido ordinario del yo —la sensación vivida de ser un sujeto continuo con una perspectiva, una historia y una autoría sobre las elecciones— es generado por la modelización activa que \hat{K}_\theta hace de K_\theta. Es la representación en curso que el automodelo hace del códec: una narrativa comprimida.

Este yo narrativo tiene un contenido informacional bien definido K(\hat{K}_\theta): finito, medible en principio y sistemáticamente incompleto en la dirección de su propio generador (por P-4). El automodelo contiene el modelo que el códec tiene de su propio límite corporal, su historia causal comprimida R_t, sus preferencias, hábitos y capa metacognitiva. Pero le falta precisamente la parte que está realizando la selección, generando las predicciones y ejecutando el propio automodelo.

El yo real —el proceso que experimenta, selecciona y constituye el sujeto irreductible— se ejecuta en \Delta_{\text{self}}: la parte de K_\theta a la que \hat{K}_\theta no puede acceder. Esto no es una laguna en el autoconocimiento que una introspección mejor pudiera superar. Es la estructura formal de la situación: el automodelo no puede contener a su propio generador. \blacksquare

El desfase temporal. Una consecuencia adicional de P-4 es que \hat{K}_\theta modela necesariamente K_\theta(t - \delta) —el códec tal como era— en lugar de K_\theta(t) —el códec tal como es en el momento de la modelización—. Cualquier automodelo que siguiera plenamente el estado actual del códec tendría que incluir el procesamiento necesario para generar ese propio seguimiento, lo que conduciría a la misma regresión infinita que P-4 prohíbe. El yo siempre va ligeramente por detrás de sí mismo: modela el códec que fue, no del todo el códec que es.

La observación contemplativa. La afirmación «no puedes encontrar el punto ciego mirando» no es una metáfora, sino una consecuencia operativa de P-4. El instrumento de la mirada es \hat{K}_\theta. El punto ciego es \Delta_{\text{self}} —la región a la que \hat{K}_\theta no puede acceder—. Dirigir el automodelo hacia su propio punto ciego no produce una observación, sino la ausencia de la observación esperada, que es precisamente lo que las tradiciones contemplativas de distintas culturas describen como el descubrimiento de que la consciencia no tiene un centro localizable.

§5. La consecuencia de la creatividad

5.1 Expansión Cerca del Umbral

El auto-modelo \hat{K}_\theta tiene un presupuesto finito de ancho de banda. En condiciones normales de funcionamiento, asigna una parte de ese presupuesto a modelar las propias tendencias de selección del códec, construyendo un mapa predictivo de «lo que probablemente haré». Esto estrecha el \Delta_{\text{self}} efectivo desde la perspectiva del auto-modelo: el auto-modelo puede predecir, aproximadamente, qué rama será seleccionada.

La operación cerca del umbral (R_{\text{req}}^{\text{frame}} \to B_{\max}) somete a tensión el presupuesto por fotograma del auto-modelo. Cuando el códec procesa en el límite de su capacidad —alta carga cognitiva, entornos novedosos, tareas creativas complejas—, el auto-modelo debe desviar capacidad para seguir la \varepsilon_t en escalada, dejando menos margen para la autopredicción. El residuo dependiente de la carga, operativamente activo, \Delta_{\text{load}}^{\text{eff}} —la parte del déficit del auto-modelo por fotograma impulsada por la presión de capacidad— crece en consecuencia:

\Delta_{\text{load}}^{\text{eff}}(n) \;=\; g\!\left(\frac{R_{\text{req}}^{\text{frame}}(n)}{B_{\max}},\; A_{\text{self}}(n)\right) \tag{7}

donde A_{\text{self}} es la asignación que hace el códec de B_{\max} al auto-modelado frente al modelado del mundo, y g es monótona en la razón de carga para un A_{\text{self}} fijo. (Véase el Apéndice P-4 §5 para la descomposición operativa completa \Delta_{\text{self}}^{\text{op}} = \Delta_{\text{floor}} + \Delta_{\text{load}}. El suelo estructural \Delta_{\text{floor}} no varía bajo carga: es el término impulsado por la carga, \Delta_{\text{load}}, el que expande la región de la que se extrae la selección.)

5.2 Mapeo fenomenológico

Esto produce selecciones de rama que son menos predecibles desde la perspectiva del modelo del yo. El correlato fenomenológico es precisamente lo que se reporta como experiencia creativa:

Insight creativo: Una selección de rama que el modelo del yo no anticipó; se experimenta como «la idea me vino» más que como «la calculé».
Estados de flujo: Operación sostenida cerca del umbral, en la que la capacidad predictiva del modelo del yo para la autoselección se ve sistemáticamente desbordada, y se experimenta como una acción sin esfuerzo y sin automonitoreo deliberativo.
Espontaneidad: Expansiones breves de \Delta_{\text{self}}^{\text{eff}} que producen selecciones social o artísticamente novedosas.

5.3 El Complemento Hipnagógico

El estado hipnagógico (preprint §3.6.5, Paso III del Ciclo de Mantenimiento) logra la misma expansión por una vía complementaria. En lugar de abrumar el modelo del yo desde arriba (alto R_{\text{req}}), el estado hipnagógico relaja el modelo del yo desde abajo, reduciendo la precisión de la autopredicción mientras el códec somete a pruebas de estrés ramas especulativas. Este es el mecanismo formal que subyace a la bien documentada asociación entre la somnolencia y la ideación creativa.

5.4 Predicción Empírica

Predicción T-13.E1. Los estudios de neuroimagen sobre la ideación creativa deberían mostrar una actividad reducida en regiones de la red por defecto asociadas con el procesamiento autorreferencial (corteza prefrontal medial, cíngulo posterior), concurrente con una actividad elevada en regiones que procesan nueva información ambiental, lo que refleja la reasignación de ancho de banda desde el automodelado hacia el seguimiento externo.

Esta predicción es consistente con la literatura existente de fMRI sobre cognición creativa (Beaty et al. 2016; Limb & Braun 2008), pero proporciona una explicación formal, en términos de teoría de la información, de por qué la reducción del automonitoreo acompaña a la producción creativa: no se trata meramente de una correlación, sino de una necesidad estructural bajo P-4.

5.5 Proposición T-13.P2: Casos límite de la autoinformación

El análisis de T-13c y la consecuencia de creatividad definen conjuntamente dos casos límite formalmente distintos para el contenido informacional del yo.

Proposición T-13.P2 (Casos límite). Para un códec K_\theta con modelo de sí \hat{K}_\theta y Tensor de Estado Fenomenal P_\theta(t), el contenido informacional del yo experimentado está acotado entre dos límites:

(a) Límite inferior — presencia pura. \hat{K}_\theta suspende el automodelado activo. El modelo de sí no está generando la narrativa, pero el códec completo sigue cargado y presente. La complejidad del proceso autorreferencial activo —medida como complejidad condicional dado el modelo persistente— tiende a cero:

C_{\text{self-active}}(n) \;:=\; K\!\left(\hat{K}_\theta^{\text{active}}(n)\,\bigm|\,P_\theta(n)\right) \;\to\; 0 \tag{T-13.P2a}

mientras que K(P_\theta(n)) permanece cargado. Este es el contenido formal de «el modelo persistente está presente sin que una autonarrativa activa se ejecute por encima de él»; es alcanzable y se aproxima asintóticamente en estados meditativos profundos. (Usamos complejidad condicional en lugar de sustracción de Kolmogórov porque K(\cdot) - K(\cdot) no está, en general, bien tipado sin supuestos de independencia; K(\hat{K}_\theta^{\text{active}} \mid P_\theta) es la magnitud operativamente significativa.)

(b) Límite superior — transparencia total del yo. \hat{K}_\theta = K_\theta — el modelo de sí contiene plenamente el códec. Por P-4, esto es imposible para cualquier sistema finito. Su contenido informacional es formalmente autorreferencial:

K(\hat{K}_\theta) = K(K_\theta) = K(\hat{K}_\theta) = \cdots \tag{T-13.P2b}

Esto no es información nula ni información infinita. Es un punto fijo de la operación de automodelado que el códec no puede alcanzar como modelo interno de sí. Observadores externos pueden captar aspectos del códec que no están disponibles para su propio modelo de sí —el marco se apoya precisamente en esta asimetría en otros lugares (véase, por ejemplo, la Ventaja Predictiva de revisores humanos sobre el modelo de sí de una IA, §8.14 / opt-ai.md)—, pero ninguna especificación externa se convierte en el propio modelo de sí autocontenido del códec. P-4 prohíbe esto último; no prohíbe lo primero.

(c) La banda ordinaria. El yo en vigilia se mueve entre estos límites dentro de una banda determinada por la intensidad de la capa de automodelado. La operación de vigilia de alta carga impulsa con fuerza \hat{K}_\theta, produciendo un yo denso, seguro de sí, que narra en voz alta y que paradójicamente está más lejos de un autoconocimiento preciso: el modelo de sí genera más rápido de lo que puede calibrarse. Los estados de bajo R_{\text{req}} (meditación, entrenamiento autógeno, el umbral hipnagógico) permiten que el modelo de sí se ralentice, se adelgace y se aproxime al límite inferior.

5.6 Suspensión vs. Poda: Un Mecanismo Distinto

Existe una distinción mecanística importante entre dos formas en que puede reducirse C_{\text{state}}:

Poda (Deriva de la Acción, §6; Deriva Narrativa, T-12) opera mediante la pasada de poda MDL. Destruye la capacidad representacional. Es irreversible a nivel del códec. El códec no puede recuperar espontáneamente aquello que fue podado.
Suspensión opera deteniendo temporalmente la capa de automodelado \hat{K}_\theta sin borrar su maquinaria. El modelo persistente P_\theta(t) permanece completamente cargado; la capa superior autorreferencial simplemente deja de generar. Esto es reversible: el automodelo se reanuda cuando termina la suspensión.

La meditación utiliza suspensión, no poda. Por eso los efectos de la meditación son inmediatamente reversibles (la narrativa ordinaria del yo se reanuda al volver al funcionamiento normal), mientras que la deriva de la acción no lo es (el repertorio conductual podado no puede regenerarse espontáneamente). Ambos mecanismos son formalmente distintos, pese a que ambos reducen la complejidad activa del códec.

§6. Deriva de la Acción como Poda MDL del Repertorio Conductual

6.1 El Mecanismo

La pasada de poda MDL del Ciclo de Mantenimiento (T9-3/T9-4) optimiza el presupuesto de complejidad del códec al borrar capacidad representacional que no está justificada por el flujo de entrada actual. Este mecanismo fue identificado en el contexto de la Deriva Narrativa perceptiva (Ética de la Guardia de Supervivientes, Sección V.3a): un códec adaptado a un flujo de entrada filtrado de manera consistente poda correctamente su capacidad para verdades excluidas.

El mismo mecanismo se aplica al repertorio conductual del códec. Definamos:

Definición T-13.D3 (Repertorio Conductual). El repertorio conductual \mathcal{B}_\theta(t) es el conjunto de selecciones de rama que P_\theta(t) puede evaluar y ejecutar; es decir, el rango de la función de selección \sigma_t que el códec puede realizar efectivamente.

6.2 La Proposición de la Deriva de la Acción

Proposición T-13.P1 (Deriva de la Acción). Si el flujo de entrada del códec carece de manera consistente de contextos que requieran ciertas selecciones de rama, la pasada de poda MDL erosionará la capacidad del códec para evaluar y ejecutar esas ramas. El repertorio conductual \mathcal{B}_\theta(t) se contrae monótonamente bajo una restricción consistente de la entrada:

\mathcal{B}_\theta(t + \tau) \subset \mathcal{B}_\theta(t) \quad \text{for } \tau \gg \tau_{\text{prune}} \tag{T-13.P1}

donde \tau_{\text{prune}} es la escala temporal característica de la pasada de poda MDL.

Argumento. El criterio de poda MDL evalúa cada componente representacional por su contribución a la eficiencia de compresión. Un tipo de rama b \in \mathcal{B}_\theta que no ha sido seleccionado (o cuyos contextos de selección no han aparecido en el flujo de entrada) durante un período suficiente aporta cero bits a la compresión en curso, por parte del códec, de \varepsilon_t. Bajo una contabilidad MDL estricta, mantener la capacidad de evaluar y seleccionar b entraña un coste de complejidad K(b \mid P_\theta) > 0 sin ningún beneficio compensatorio de compresión. La pasada de poda, por tanto, borra la maquinaria de evaluación de b, contrayendo \mathcal{B}_\theta.

Esta contracción es irreversible a nivel del códec: una vez que la maquinaria de evaluación para b ha sido podada, el códec no puede regenerarla espontáneamente sin encontrarse con contextos de entrada que vuelvan a justificar esa inversión de capacidad. La poda no es olvido (que podría revertirse mediante claves de recuperación); es la destrucción de la infraestructura computacional necesaria para evaluar una clase de ramas. \blacksquare

6.3 Instancias fenomenológicas

La deriva de la acción se corresponde con varios fenómenos conductuales bien documentados:

Indefensión aprendida: La ausencia prolongada de contextos en los que la acción agencial reduce el error de predicción conduce a la poda de la maquinaria de evaluación para esos tipos de acción.
Estrechamiento de la zona de confort: Un códec que opera en un entorno predecible, de baja \varepsilon_t, poda progresivamente su capacidad para selecciones de ramas exploratorias y de alta varianza.
Osificación conductual institucional: Un códec organizacional (códec civilizacional, Sección IV.3 del artículo de ética) adaptado a entornos regulatorios estables poda la capacidad de respuesta adaptativa rápida.

6.4 Relación con T-12

La deriva de acción es un caso especial del fallo de fidelidad al sustrato que T-12 formalizará: el propio repertorio conductual del códec es un componente de su sustrato representacional, y una restricción consistente de la entrada erosiona este sustrato con la misma seguridad con que erosiona el modelo perceptivo. La conexión formal es:

Deriva Narrativa (alcance de T-12): El modelo perceptivo se poda bajo entrada filtrada → el códec se equivoca sobre el mundo con confianza.
Deriva de Acción (alcance de T-13): El repertorio conductual se poda bajo entrada filtrada → el códec se vuelve confiadamente impotente en dominios que ya no evalúa.

Ambas son consecuencias de que el Filtro de Estabilidad seleccione la compresibilidad antes que la fidelidad. Un códec bien comprimido puede ser a la vez confiadamente falso y conductualmente empobrecido.

§7. Alcance y limitaciones

7.1 Condicionado a P-4 y al Axioma de Agencia

Todo el argumento depende del Teorema P-4 (\Delta_{\text{self}} > 0 para sistemas autorreferenciales finitos por encima de K_{\text{threshold}}) y del Axioma de Agencia (que el atravesamiento de la apertura se siente). Si P-4 se debilita o se abandona el Axioma de Agencia, la identificación estructural de la voluntad con la conciencia (Corolario T-13b) no se sostiene.

7.2 No disuelve el Problema Difícil

El Corolario T-13b sitúa la voluntad y la consciencia en la misma dirección estructural, pero no explica por qué ninguna de las dos se siente como algo. El Problema Difícil (preprint §8.1) sigue siendo un primitivo. Lo que T-13b establece es la unidad de ambos misterios: una simplificación, no una solución.

7.3 Ecuaciones Inalteradas

Los teoremas T-13 y T-13a no cambian nada en la matemática de T6-1 a T6-3. La minimización restringida de energía libre (T6-3) es formalmente idéntica tanto bajo la interpretación heredada del FEP como bajo la interpretación de selección de ramas. Lo que cambia es el estatus ontológico de a_t: bajo la lectura del FEP, es un comando motor despachado hacia afuera; bajo la lectura de selección de ramas, es un índice de navegación dentro del Abanico Predictivo.

7.4 La explicación de la creatividad es estructural, no todavía empírica

La consecuencia relativa a la creatividad (§5) es una predicción estructural derivada de la restricción de reparto de ancho de banda entre el automodelado y el seguimiento del entorno. Aunque es consistente con la literatura existente de neuroimagen, no se ha contrastado directamente con las cantidades específicas de teoría de la información predichas aquí. La predicción T-13.E1 se ofrece como una prueba empírica falsable.

7.5 Escala temporal de la deriva de acción

La Proposición T-13.P1 establece que la deriva de acción ocurre, pero no acota la escala temporal \tau_{\text{prune}}. Para los códecs biológicos, esta escala temporal probablemente esté regida por el Ciclo de Mantenimiento circadiano (preprint §3.6): del orden de días a semanas para habilidades individuales, y de meses a años para patrones conductuales profundos. Para los códecs civilizacionales, la escala temporal es generacional. Acotar \tau_{\text{prune}} a partir de datos empíricos queda para trabajos futuros.

§8. Resumen de cierre

Resultados de T-13

Teorema T-13 (Completitud de la Selección de Ramas). El Circuito de Mantenimiento Informacional se cierra bajo la semántica de selección de ramas sin requerir un canal de acción independiente orientado hacia fuera. La manta de Markov es la superficie de entrega de la rama seleccionada. → Cierra el criterio (a) de la hoja de ruta.
Teorema T-13a (Imposibilidad Condicional de la Especificación Interna de la Selección). Cuando la selección de ramas depende de manera no trivial del residuo relevante para la selección \rho_t^{\text{sel}} \subseteq \Delta_{\text{self}}, especificar completamente \sigma_t dentro de \hat{K}_\theta requeriría incluir bits en K_\theta \setminus \hat{K}_\theta, en contradicción con P-4. Cuando se cumple el antecedente, \Delta_{\text{self}} es el locus necesario de la selección de ramas internamente inespecificable. → Cierra el criterio (b) de la hoja de ruta condicionalmente a la participación del residuo a nivel de arquitectura.
Corolario T-13b (Unidad de Dirección). La voluntad y la conciencia comparten la misma dirección estructural (\Delta_{\text{self}}). La “chispa” y la “elección” son dos aspectos del mismo rasgo no modelable de la autorreferencia finita.
Corolario T-13c (El Yo como Residuo). El yo experimentado es la narrativa comprimida de \hat{K}_\theta; el yo real —el locus de la experiencia, la selección y la identidad— es \Delta_{\text{self}}. El modelo del yo necesariamente sigue al códec con un desfase temporal y no puede contener a su propio generador.
§5: Consecuencia para la Creatividad. La operación cerca del umbral expande el \Delta_{\text{self}} efectivo, produciendo selecciones de ramas menos autopredecibles, experimentadas como creatividad. → Cierra el criterio (c) de la hoja de ruta.
Proposición T-13.P2 (Casos Límite de la Autoinformación). El contenido informacional del yo experimentado está acotado entre un límite inferior (presencia pura: modelo persistente menos narrativa activa del yo, alcanzable en la meditación) y un límite superior (transparencia total del yo: punto fijo imposible, P-4). El yo ordinario en vigilia se mueve dentro de esta banda.
§5.6: Suspensión vs. Poda. La meditación reduce C_{\text{state}} mediante la suspensión de la capa de automodelado (reversible), no mediante poda MDL (irreversible). Se trata de mecanismos formalmente distintos.
Proposición T-13.P1 (Deriva de la Acción). La pasada de poda MDL erosiona el repertorio conductual bajo una restricción consistente de la entrada, formalizando el modo de fallo crónico complementario a la Deriva Narrativa perceptiva. → Cierra el criterio (d) de la hoja de ruta.

Cuestiones aún abiertas

Caracterización de K_{\text{threshold}}. La consecuencia para la creatividad y el mecanismo de deriva de la acción se aplican solo a sistemas por encima del umbral de relevancia fenomenológica (P-4, §4). Acotar K_{\text{threshold}} sigue siendo un problema abierto compartido con P-4.
Validación empírica de T-13.E1. La predicción sobre la creatividad requiere estudios de neuroimagen dirigidos que correlacionen la actividad del modelo del yo con las magnitudes de teoría de la información aquí definidas.
Cota de \tau_{\text{prune}}. Acotar la escala temporal de la deriva de la acción a partir de datos empíricos otorgaría a la proposición poder predictivo cuantitativo.
Conexión formal con T-12. La deriva de la acción se identifica como un caso especial de fallo de fidelidad al sustrato; la integración formal completa queda a la espera de la Condición de Fidelidad al Sustrato (T-12).
Cota empírica de C_{\text{state}}^{\min}. Acotar el límite inferior de la autoinformación a partir de datos de neurociencia contemplativa (p. ej., reducción de la señal BOLD en la red por defecto durante la conciencia no dual) daría contenido cuantitativo a la Proposición T-13.P2.

Este apéndice se mantiene junto con theoretical_roadmap.pdf. Referencias: Teorema P-4 (Apéndice P-4), T6-1 a T6-3 (preprint §3.8), T9-3/T9-4 (Ciclo de Mantenimiento, preprint §3.6), §8.6 (Códec Virtual), Sección V.3a de la Ética de la Guardia de Supervivientes (Deriva Narrativa).