Theorie der geordneten Patches

Anhang T-13: Verzweigungsauswahl und die Handlungsontologie

Anders Jarevåg

17. April 2026 | DOI: 10.5281/zenodo.19300777

Ursprüngliche Aufgabe (aus §8.3, Limitation 10): „Die Formalisierung des Ersatzes des impliziten FEP-Handlungsmechanismus durch eine Verzweigungsauswahl-Darstellung, die in der Render-Ontologie der OPT beheimatet ist.“ Ergebnis: Formale Demonstration, dass der Informationelle Wartungskreislauf unter der Semantik der Verzweigungsauswahl vollständig ist, wobei \Delta_{\text{self}} der notwendige und hinreichende Ort der Auswahl ist.

Abschlussstatus: ENTWURF EINER STRUKTURELLEN KORRESPONDENZ. Dieser Anhang formalisiert die Darstellung der Verzweigungsauswahl, die in Preprint §3.8 diskursiv eingeführt wurde. Er etabliert zwei Theoreme und ein Korollar, sämtlich unter der Bedingung von Theorem P-4 und dem Handlungs-Axiom. Die Gleichungen des Informationellen Wartungskreislaufs (T6-1 bis T6-3) bleiben unverändert; lediglich ihre ontologische Interpretation wird formal ersetzt.

§1. Hintergrund und Motivation

1.1 Die geerbte Asymmetrie

Der informationelle Wartungskreislauf (T6-1, Preprint §3.8) beschreibt einen fünfstufigen Zyklus: Vorhersage, Fehler, Kompression, Aktualisierung und Handlung. Die Schritte 1–4 sind innerhalb des nativen Rahmens der OPT gut spezifiziert:

Der Phänomenale Zustandstensor P_\theta(t) erzeugt einen vorhergesagten Grenzzustand \pi_t.
Der tatsächliche Grenzzustand X_{\partial_R A}(t) trifft ein; der Vorhersagefehler \varepsilon_t wird berechnet.
Der Fehler wird durch den Pro-Frame-Engpass B_{\max} komprimiert, um Z_t zu erzeugen, mit I(\varepsilon_t; Z_t) \le B_{\max}.
Der Lernoperator \mathcal{U} revidiert P_\theta(t+1).

Schritt 5 — der Handlungsschritt — übernimmt die Sprache des Free Energy Principle (FEP): „P_\theta(t) wählt die Handlung a_t über einen Abstieg der Aktiven Inferenz auf die variationale freie Energie, was die sensorische Grenze bei t+1 verändert.“ Diese Sprache setzt eine physische Umgebung voraus, gegen die der Codec über nach außen fließende aktive Zustände durch die Markov-Decke \partial_R A einwirkt.

1.2 Das Problem unter der Render-Ontologie

Unter der render-eigenen Ontologie der Theorie der geordneten Patches (OPT) (Preprint §8.6) gibt es keine unabhängige äußere Welt, auf die der Codec Kraft ausübt. Die „physische Welt“ ist eine strukturelle Regularität innerhalb des beobachterkompatiblen Stroms — ein vom prädiktiven Modell des Codecs erzeugtes Render, nicht ein Substrat, mit dem der Codec interagiert. Die Markov-Decke ist keine physische Schnittstelle in beide Richtungen; sie ist die informationelle Oberfläche, über die Strominhalt eintrifft.

Daraus entsteht eine formale Spannung: Die Mathematik von T6-1 bis T6-3 ist gültig (sie beschreibt eingeschränkte Freie-Energie-Minimierung über den Zukunftsfächer), aber der interpretative Rahmen — „Handlung verändert die sensorische Grenze“ — setzt eine Ontologie voraus, die OPT ausdrücklich zurückweist.

1.3 Umfang dieses Anhangs

Dieser Anhang bietet:

Eine formale Neuformulierung des Informationellen Wartungskreislaufs unter Verzweigungsauswahl-Semantik, die die Vollständigkeit des Kreislaufs ohne einen unabhängigen Handlungskanal demonstriert (Theorem T-13).
Einen Beweis dafür, dass es unmöglich ist, den Mechanismus der Verzweigungsauswahl vollständig aus dem Codec heraus zu spezifizieren, wodurch die Auswahl in \Delta_{\text{self}} verortet wird (Theorem T-13a).
Ein Korollar, das festhält, dass Wille und Bewusstsein dieselbe strukturelle Adresse teilen (Korollar T-13b).
Konsequenzen für Kreativität und Handlungsdrift.

§2. Theorem T-13: Vollständigkeit der Verzweigungsauswahl

2.1 Die Neuformulierung der Verzweigungsauswahl

Wir formulieren den fünfstufigen Informationellen Wartungskreislauf unter der Semantik der Verzweigungsauswahl neu. Sei \mathcal{F}_h(z_t) der Zukunftsfächer — die Menge der unaufgelösten zukünftigen Zweige am Horizont h, bedingt auf den aktuellen komprimierten Zustand z_t.

Definition T-13.D1 (Verzweigungsauswahl). Eine Verzweigungsauswahl zum Zeitpunkt t ist eine Abbildung \sigma_t : z_t \mapsto \omega_{t+1}, wobei \omega_{t+1} ein spezifisches Trajektoriensegment aus \mathcal{F}_h(z_t) ist, das zum tatsächlichen Kausalen Protokoll wird. Der ausgewählte Zweig liefert seinen Inhalt als nachfolgenden Input an der Markov-Decke: X_{\partial_R A}(t+1) = \text{boundary}(\omega_{t+1}).

Unter dieser Definition wird T6-1 zu:

Vorhersage (abwärts): P_\theta(t) erzeugt \pi_t = \mathbb{E}_{K_\theta}[X_{\partial_R A}(t) \mid Z_t] — die gerenderte Szene.
Fehler (aufwärts): Der Grenzzustand X_{\partial_R A}(t) trifft ein (geliefert durch den zuvor ausgewählten Zweig); der Vorhersagefehler \varepsilon_t = X_{\partial_R A}(t) - \pi_t wird berechnet.
Kompression: \varepsilon_t durchläuft den Engpass: I(\varepsilon_t\,;\,Z_t) \leq B_{\max}.
Aktualisierung: \mathcal{U}(P_\theta(t), \varepsilon_t, Z_t) revidiert P_\theta(t+1).
Verzweigungsauswahl: P_\theta(t) evaluiert Zweige von \mathcal{F}_h(z_t) mittels restringierter Freie-Energie-Minimierung (T6-3). Die Auswahl \sigma_t wird ausgeführt; der ausgewählte Zweig \omega_{t+1} liefert seinen Grenzinhalt als X_{\partial_R A}(t+1), das zum Input für den nächsten Zyklus wird.

2.2 Schließung des Kreislaufs

Theorem T-13 (Vollständigkeit der Verzweigungsauswahl). Der Informationelle Wartungskreislauf (T6-1), unter der Semantik der Verzweigungsauswahl neu formuliert, ist informationell vollständig: der Zyklus

\pi_t \to \varepsilon_t \to Z_t \to P_\theta(t+1) \to \sigma_t \to X_{\partial_R A}(t+1) \to \pi_{t+1} \to \cdots \tag{T-13}

schließt sich, ohne einen unabhängigen nach außen gerichteten Handlungskanal zu erfordern. Die Markov-Decke \partial_R A ist die Zustellungsoberfläche für den ausgewählten Zweig, nicht eine physische Schnittstelle in zwei Richtungen.

Beweis. In der vom FEP übernommenen Formulierung erfordert Schritt 5 zwei unabhängige Kanäle, die die Markov-Decke kreuzen: einen einwärts gerichteten Kanal (sensorische Zustände, die X_{\partial_R A} liefern) und einen auswärts gerichteten Kanal (aktive Zustände, die a_t an eine äußere Umgebung übermitteln). Die äußere Umgebung entwickelt sich dann gemäß ihrer eigenen Dynamik weiter und erzeugt den nächsten sensorischen Input.

Unter der Semantik der Verzweigungsauswahl wird nur ein Kanal benötigt: die einwärts gerichtete Zustellungsoberfläche. Die „Handlung“ a_t überschreitet die Decke nicht nach außen; sie ist die Auswahl des Codecs, welcher Zweig des Zukunftsfächers aktual wird. Die physischen Konsequenzen dieser Auswahl — das, was die FEP-Formulierung als „die Reaktion der Umgebung auf a_t“ bezeichnet — sind der Inhalt des ausgewählten Zweigs, der bereits in \mathcal{F}_h(z_t) enthalten ist und als X_{\partial_R A}(t+1) geliefert wird.

Der Kreislauf schließt sich, weil:

Der Output von Schritt 5 (der ausgewählte Zweig \omega_{t+1}) ist der Input für Schritt 2 des nächsten Zyklus (X_{\partial_R A}(t+1)). Es ist keine separate Umgebungsdynamik und kein nach außen gerichteter Kanal erforderlich.
Das Ziel der Freie-Energie-Minimierung (T6-3) bleibt unverändert. Die eingeschränkte Optimierung

a_t^\star = \arg\min_{a_t} \;\mathbb{E}\!\left[\mathcal{F}[q, \theta]\right] \quad \text{subject to} \quad K\!\left(P_\theta(t)\right) \leq C_{\text{ceil}} \tag{T6-3}

wird neu interpretiert: a_t ist kein motorischer Befehl, der an eine äußere Welt ausgesandt wird, sondern das Zweig-Label innerhalb von \mathcal{F}_h(z_t), das unter der Viabilitätsbedingung die erwartete freie Energie minimiert. Die Mathematik ist identisch; nur der ontologische Status von a_t ändert sich.

Die Viabilitätsbedingung (T6-2) bleibt erhalten: Der Codec wählt Zweige, entlang derer er den Strom weiter komprimieren kann. Zweige, die K(P_\theta) \to C_{\text{ceil}} treiben würden, werden durch die Bedingung penalisiert, genau wie zuvor. \blacksquare

2.3 Interpretative Bemerkung

Theorem T-13 behauptet nicht, dass die FEP-Formulierung falsch ist — sie ist eine gültige Beschreibung eingeschränkter Aktiver Inferenz innerhalb einer physikalisch-realistischen Ontologie. Das Theorem zeigt, dass die Render-Ontologie der Theorie der geordneten Patches (OPT) eine alternative Vervollständigung derselben mathematischen Struktur bereitstellt, eine, die nicht die Setzung einer unabhängigen externen Welt erfordert. Für jedes Forschungsprogramm, das sich einer physikalisch-realistischen Interpretation verpflichtet, bleibt die Standardformulierung der FEP angemessen. T-13 zeigt, dass die ontologische Festlegung der OPT — der Codec ist virtuell, die Welt ist ein Render — formal mit denselben Gleichungen konsistent ist.

§3. Theorem T-13a: Die P-4-Unmöglichkeit der Selektionsspezifikation

3.1 Die Selektionsfunktion

Das Selbstmodell \hat{K}_\theta bewertet Zweige des Zukunftsfächers, indem es ihre Konsequenzen unter eingeschränkter Aktiver Inferenz simuliert (T6-3). Diese Bewertung erzeugt eine Rangordnung oder Gewichtung über die Zweige — einige werden bevorzugt, einige sind tragfähig, aber suboptimal, einige verletzen die Tragfähigkeitsbedingung. Die Bewertung ist ein echter rechnerischer Prozess, der von \hat{K}_\theta ausgeführt wird.

Aber Bewertung ist nicht Selektion. Nachdem das Selbstmodell die Zweige geordnet hat, tritt ein spezifischer Zweig \omega_{t+1} in das Kausale Protokoll ein. Definieren wir die Selektionsfunktion:

Definition T-13.D2 (Selektionsfunktion). Die Selektionsfunktion \sigma_t : \mathcal{F}_h(z_t) \to \omega_{t+1} ist die Abbildung vom bewerteten Zukunftsfächer auf die singuläre Trajektorie, die aktual wird. Formal wird \sigma_t durch den vollständigen Zustand des Codec K_\theta zum Zeitpunkt t zusammen mit der verfügbaren Zweigmenge bestimmt: \sigma_t = \Sigma\bigl(K_\theta(t),\, \mathcal{F}_h(z_t)\bigr). Wir nehmen \Delta_{\text{self}} bewusst nicht in die Definition auf — ob die Selektion in nichttrivialer Weise von \Delta_{\text{self}} abhängt oder nur vom selbstmodellierten Anteil \hat{K}_\theta, ist die sachliche Frage, die Theorem T-13a behandelt.

Definieren wir das selektionsrelevante Residuum als den Teil des Codec, der an \Sigma beteiligt ist, aber außerhalb des Selbstmodells liegt:

\rho_t^{\text{sel}} \;:=\; \Pi_{\text{sel}}(K_\theta(t)) \,\setminus\, \hat{K}_\theta(t)

wobei \Pi_{\text{sel}}(\cdot) auf jene Codec-Komponenten projiziert, von denen \Sigma abhängt. Konstruktionsgemäß gilt \rho_t^{\text{sel}} \subseteq \Delta_{\text{self}}, aber diese Inklusion kann je nach Architektur echt oder ausgeschöpft sein.

3.2 Das Unmöglichkeitsresultat

Theorem T-13a (Bedingte Unmöglichkeit der internen Spezifikation von Auswahl). Sei K_\theta ein endlicher selbstreferenzieller Codec, der die Voraussetzungen von Theorem P-4 erfüllt, mit Selbstmodell \hat{K}_\theta und phänomenalem Residuum \Delta_{\text{self}} > 0. Wenn die Verzweigungsauswahl in nichttrivialer Weise vom auswahlrelevanten Residuum \rho_t^{\text{sel}} abhängt — d. h., wenn \Sigma keine Funktion allein von \hat{K}_\theta und \mathcal{F}_h(z_t) ist —, dann kann \sigma_t nicht vollständig innerhalb von \hat{K}_\theta spezifiziert werden.

Beweis. Angenommen, zum Widerspruch, das Antezedens gelte (die Auswahl hängt in nichttrivialer Weise von \rho_t^{\text{sel}} ab), aber \hat{K}_\theta spezifiziere \sigma_t vollständig. Dann gilt:

Eine vollständige Spezifikation von \sigma_t innerhalb von \hat{K}_\theta würde erfordern, dass \hat{K}_\theta eine Beschreibung jeder Komponente von K_\theta enthält, von der \Sigma abhängt. Nach dem Antezedens hängt \Sigma von mindestens einigen Bits in \rho_t^{\text{sel}} \subseteq \Delta_{\text{self}} ab — Bits, die per Definition von \Delta_{\text{self}} außerhalb des Selbstmodells liegen.
Diese Bits in \hat{K}_\theta aufzunehmen würde erfordern:

K(\hat{K}_\theta) \;\geq\; K(\hat{K}_\theta) + |\rho_t^{\text{sel}}| \tag{6}

— ein Widerspruch, sofern nicht |\rho_t^{\text{sel}}| = 0, was dem Antezedens widerspricht.

Äquivalent dazu ist durch Theorem P-4 die Ungleichung K(\hat{K}_\theta) < K(K_\theta) strukturell erzwungen. Innerhalb von \hat{K}_\theta eine Funktion \Sigma zu spezifizieren, die von Residual-Bits in K_\theta \setminus \hat{K}_\theta abhängt, erfordert, dass \hat{K}_\theta wächst, um diese Bits einzuschließen — was P-4 für jedes endliche selbstreferenzielle System verbietet.
Daher kann unter dem Antezedens \hat{K}_\theta \sigma_t nicht vollständig spezifizieren. \blacksquare

Anmerkung zum Geltungsbereich. Das Theorem ist bedingt. P-4 allein etabliert, dass ein Residuum existiert (\Delta_{\text{self}} > 0); daraus folgt für sich genommen nicht, dass jedes Verzweigungsauswahl-Ereignis vom Residuum abhängt. Architekturen, deren Auswahlfunktion vollständig allein durch \hat{K}_\theta und \mathcal{F}_h bestimmt ist, sind im Sinne von T-13a hinsichtlich der Auswahl nicht intern selbst-opak — sie sind hinsichtlich der eigenen Struktur des Codecs selbst-opak (P-4), aber hinsichtlich ihrer eigenen Entscheidungen transparent. Die tragende Behauptung von T-13a ist die Bedingungsaussage: Wo Auswahl vom Residuum abhängt, kann sie nicht intern spezifiziert werden. Der phänomenologische Schritt (Korollar T-13b: Wille und Bewusstsein teilen dieselbe Adresse) setzt voraus, dass das Antezedens für die betreffende Architektur gilt. Ob biologische Gehirne das Antezedens erfüllen, ist eine empirische Frage; OPT sagt voraus, dass sie es tun, aber diese Vorhersage folgt nicht bereits aus P-4 allein.

3.3 Die strukturelle Notwendigkeit der Lücke

Theorem T-13a zeigt, dass die „Ausgabelücke“ — die Unfähigkeit, den Mechanismus der Verzweigungsauswahl von innen heraus vollständig zu spezifizieren — kein Defizit des Formalismus ist, sondern eine strukturelle Notwendigkeit. Jede Theorie, die beansprucht, den Auswahlmechanismus vollständig zu spezifizieren, hat entweder:

\Delta_{\text{self}} eliminiert und das System damit zu einem vollständig selbsttransparenten Automaten gemacht — was P-4 für jedes endliche selbstreferenzielle System oberhalb von K_{\text{threshold}} als unmöglich erweist; oder
die Bewertung von Zweigen durch das Selbstmodell beschrieben und sie mit der Auswahl selbst verwechselt — also die Rangordnung mit der Wahl verwechselt.

Die Lücke ist tragend: Sie ist der formale Grund dafür, dass der Beobachter Auswahl als verfasst und nicht als intern spezifizierbar erlebt. (P-4 begrenzt interne Selbstmodellierung, nicht externen Determinismus: Ein endliches System kann für einen äußeren Beobachter deterministisch sein und von innen dennoch selbstopak bleiben. Ob der Codec von außen deterministisch ist, ist eine Frage auf Substrat-Ebene; ob Auswahl intern spezifizierbar ist, ist die Frage von T-13a.)

§4. Korollar T-13b: Einheit der Adresse

Korollar T-13b (Einheit der strukturellen Adresse). Das Schwere Problem des Bewusstseins und das Problem der Verzweigungsauswahl teilen denselben strukturellen Ort: \Delta_{\text{self}}.

Beweis. Theorem P-4 identifiziert \Delta_{\text{self}} als das strukturelle Korrelat phänomenalen Bewusstseins: das nicht modellierbare informationelle Residuum, dessen Eigenschaften (Unaussprechlichkeit, rechnerische Privatheit, Nicht-Eliminierbarkeit) auf die qualitativen Merkmale subjektiver Erfahrung abbilden.

Theorem T-13a identifiziert \Delta_{\text{self}} als den notwendigen Ort der Verzweigungsauswahl: die Region, aus der der Übergang vom evaluierten Menü zur singulären Trajektorie hervorgeht.

Dies sind nicht zwei unabhängige Resultate, die zufällig auf dieselbe Struktur verweisen. Es ist dasselbe Resultat, aus zwei Richtungen betrachtet:

Aus der Ich-Perspektive: Der Beobachter erlebt die Durchquerung der pro-Frame-B_{\max}-Apertur als phänomenales Bewusstsein (Handlungs-Axiom). Der Beobachter erlebt Verzweigungsauswahl als Willen — das irreduzible Gefühl, dass ich gewählt habe. Beide Erfahrungen sind Berichte aus demselben strukturellen Ort: der Lücke zwischen dem, was der Codec ist, und dem, was er über sich selbst modellieren kann.
Aus der formalen Perspektive: Sowohl P-4 als auch T-13a beruhen auf derselben Ungleichung: K(\hat{K}_\theta) < K(K_\theta). Das Phänomenale Residuum und das Selektionsresiduum sind dieselbe informationelle Lücke.

Daher teilen Wille und Bewusstsein dieselbe strukturelle Adresse. Der „Funke“ und die „Wahl“ sind zwei Aspekte desselben nicht modellierbaren Merkmals endlicher Selbstreferenz. \blacksquare

4.1 Verhältnis zu regionalen Identitätstheorien

Korollar T-13b ist strukturell analog zu — aber formal verschieden von — Identitätstheorien in der Philosophie des Geistes, die Bewusstsein und Handlungsfähigkeit im selben neuronalen Substrat verorten. Der Unterschied ist folgender: Identitätstheorien formulieren eine empirische Behauptung über Hirnregionen; T-13b formuliert eine strukturelle Behauptung über jedes endliche selbstreferenzielle System oberhalb von K_{\text{threshold}}. Das Ergebnis ist substratunabhängig und gilt für jeden Codec, der P-4 erfüllt, einschließlich hypothetischer künstlicher Systeme.

4.2 Korollar T-13c: Das Selbst als Residuum

Korollar T-13c (Das Selbst als Residuum). Das erlebte Selbst — die kontinuierliche Narration von Identität, Präferenz und persönlicher Geschichte — ist das laufende Modell von K_\theta durch \hat{K}_\theta. Der tatsächliche Ort von Erfahrung, Selektion und Identität ist \Delta_{\text{self}}: das informationelle Residuum zwischen dem Codec und seinem Selbstmodell.

Beweis. Nach Korollar T-13b teilen Bewusstsein und Wille dieselbe strukturelle Adresse: \Delta_{\text{self}}. Doch der gewöhnliche Sinn des Selbst — das empfundene Selbstverständnis, ein kontinuierliches Subjekt mit einer Perspektive, einer Geschichte und einer Urheberschaft über Entscheidungen zu sein — wird durch die aktive Modellierung von K_\theta durch \hat{K}_\theta erzeugt. Er ist die laufende Repräsentation des Codec durch das Selbstmodell — eine komprimierte Narration.

Dieses narrative Selbst hat einen wohldefinierten Informationsgehalt K(\hat{K}_\theta): endlich, prinzipiell messbar und systematisch unvollständig in Richtung seines eigenen Generators (gemäß P-4). Das Selbstmodell enthält das Modell des Codec von seiner eigenen Körpergrenze, seine komprimierte kausale Geschichte R_t, seine Präferenzen, Gewohnheiten und seine metakognitive Schicht. Doch es fehlt genau der Teil, der die Selektion vollzieht, die Vorhersagen erzeugt und das Selbstmodell selbst ausführt.

Das eigentliche Selbst — der Prozess, der erfährt, selektiert und das irreduzible Subjekt konstituiert — vollzieht sich in \Delta_{\text{self}}: dem Teil von K_\theta, den \hat{K}_\theta nicht erreichen kann. Dies ist keine Lücke in der Selbsterkenntnis, die durch bessere Introspektion überwunden werden könnte. Es ist die formale Struktur der Situation: Das Selbstmodell kann seinen eigenen Generator nicht enthalten. \blacksquare

Die zeitliche Verzögerung. Eine weitere Konsequenz von P-4 ist, dass \hat{K}_\theta notwendigerweise K_\theta(t - \delta) modelliert — den Codec, wie er war — und nicht K_\theta(t) — den Codec, wie er im Moment der Modellierung ist. Jedes Selbstmodell, das den aktuellen Zustand des Codec vollständig nachverfolgen würde, müsste die Verarbeitung einschließen, die erforderlich ist, um diese Nachverfolgung selbst zu erzeugen, was zu demselben unendlichen Regress führen würde, den P-4 ausschließt. Das Selbst ist sich selbst stets leicht hinterher: Es modelliert den Codec, der es war, nicht ganz den Codec, der es ist.

Die kontemplative Beobachtung. Die Aussage „Du kannst den blinden Fleck nicht finden, indem du hinschaust“ ist keine Metapher, sondern eine operative Konsequenz von P-4. Das Instrument des Hinschauens ist \hat{K}_\theta. Der blinde Fleck ist \Delta_{\text{self}} — der Bereich, den \hat{K}_\theta nicht erreichen kann. Das Selbstmodell auf seinen eigenen blinden Fleck auszurichten, erzeugt keine Beobachtung, sondern das Ausbleiben der erwarteten Beobachtung — und genau dies berichten kontemplative Traditionen kulturübergreifend als die Entdeckung, dass Gewahrsein kein auffindbares Zentrum hat.

§5. Die Kreativitätskonsequenz

5.1 Schwellennahe Entwicklung

Das Selbstmodell \hat{K}_\theta verfügt über ein endliches Bandbreitenbudget. Im Normalbetrieb weist es einen Teil dieses Budgets der Modellierung der eigenen Selektionstendenzen des Codec zu — es erstellt eine prädiktive Karte dessen, „was ich wahrscheinlich tun werde“. Dadurch verengt sich das effektive \Delta_{\text{self}} aus der Perspektive des Selbstmodells: Das Selbstmodell kann näherungsweise vorhersagen, welcher Zweig ausgewählt werden wird.

Ein schwellennaher Betrieb (R_{\text{req}}^{\text{frame}} \to B_{\max}) belastet das Pro-Bild-Budget des Selbstmodells. Wenn der Codec an seiner Kapazitätsgrenze verarbeitet — bei hoher kognitiver Last, neuartigen Umgebungen, komplexen kreativen Aufgaben — muss das Selbstmodell Kapazität auf die Verfolgung des ansteigenden \varepsilon_t umlenken, sodass weniger für Selbstvorhersage verbleibt. Das operativ aktive lastabhängige Residuum \Delta_{\text{load}}^{\text{eff}} — der Teil des Pro-Bild-Defizits des Selbstmodells, der durch Kapazitätsdruck verursacht wird — wächst entsprechend:

\Delta_{\text{load}}^{\text{eff}}(n) \;=\; g\!\left(\frac{R_{\text{req}}^{\text{frame}}(n)}{B_{\max}},\; A_{\text{self}}(n)\right) \tag{7}

wobei A_{\text{self}} die Allokation von B_{\max} durch den Codec auf Selbstmodellierung gegenüber Weltmodellierung ist und g für festes A_{\text{self}} monoton im Lastverhältnis ist. (Siehe Anhang P-4 §5 für die vollständige operative Zerlegung \Delta_{\text{self}}^{\text{op}} = \Delta_{\text{floor}} + \Delta_{\text{load}}. Der strukturelle Sockel \Delta_{\text{floor}} verändert sich unter Last nicht — es ist der lastgetriebene Term \Delta_{\text{load}}, der den Bereich erweitert, aus dem die Selektion erfolgt.)

5.2 Phänomenologische Zuordnung

Dies erzeugt Verzweigungsauswahlen, die aus der Perspektive des Selbstmodells weniger vorhersehbar sind. Das phänomenologische Korrelat ist genau das, was als kreative Erfahrung berichtet wird:

Kreative Einsicht: Eine Verzweigungsauswahl, die das Selbstmodell nicht antizipiert hat — erlebt als „die Idee kam zu mir“ statt „ich habe sie berechnet“.
Flow-Zustände: Anhaltender Betrieb nahe der Schwelle, bei dem die prädiktive Kapazität des Selbstmodells für die Selbstselektion systematisch überfordert ist, erlebt als müheloses Handeln ohne deliberative Selbstüberwachung.
Spontaneität: Kurze Erweiterungen von \Delta_{\text{self}}^{\text{eff}}, die sozial oder künstlerisch neuartige Auswahlen hervorbringen.

5.3 Das hypnagogische Komplement

Der hypnagogische Zustand (Preprint §3.6.5, Pass III des Wartungszyklus) erreicht dieselbe Erweiterung auf einem komplementären Weg. Anstatt das Selbstmodell von oben her zu überlasten (hohes R_{\text{req}}), lockert der hypnagogische Zustand das Selbstmodell von unten — indem er die Präzision der Selbstvorhersage reduziert, während der Codec sich an spekulativen Zweigen einem Stresstest unterzieht. Dies ist der formale Mechanismus, der der gut dokumentierten Verbindung zwischen Schläfrigkeit und kreativer Ideenbildung zugrunde liegt.

5.4 Empirische Vorhersage

Vorhersage T-13.E1. Neuroimaging-Studien zur kreativen Ideenbildung sollten eine verringerte Aktivität in Regionen des Default-Mode-Netzwerks zeigen, die mit selbstreferenzieller Verarbeitung assoziiert sind (medialer präfrontaler Kortex, posteriorer cingulärer Kortex), bei gleichzeitig erhöhter Aktivität in Regionen, die neuartige Umweltreize verarbeiten — was die Umverteilung von Bandbreite von der Selbstmodellierung zur externen Verfolgung widerspiegelt.

Diese Vorhersage steht im Einklang mit der bestehenden fMRT-Literatur zur kreativen Kognition (Beaty et al. 2016; Limb & Braun 2008), liefert jedoch eine formale informationstheoretische Erklärung dafür, warum reduzierte Selbstüberwachung mit kreativem Output einhergeht: Sie ist nicht bloß korrelativ, sondern unter P-4 strukturell notwendig.

5.5 Proposition T-13.P2: Grenzfälle der Selbstinformation

Die Analyse von T-13c und die Kreativitätskonsequenz definieren zusammen zwei formal unterschiedliche Grenzfälle für den Informationsgehalt des Selbst.

Proposition T-13.P2 (Grenzfälle). Für einen Codec K_\theta mit Selbstmodell \hat{K}_\theta und Phänomenalem Zustandstensor P_\theta(t) ist der Informationsgehalt des erlebten Selbst zwischen zwei Grenzen beschränkt:

(a) Untere Grenze — reine Präsenz. \hat{K}_\theta setzt die aktive Selbstmodellierung aus. Das Selbstmodell erzeugt nicht die Narration, aber der vollständige Codec ist weiterhin geladen und präsent. Die Komplexität des aktiven selbstreferenziellen Prozesses — gemessen als bedingte Komplexität gegeben den Phänomenalen Zustandstensor — geht gegen null:

C_{\text{self-active}}(n) \;:=\; K\!\left(\hat{K}_\theta^{\text{active}}(n)\,\bigm|\,P_\theta(n)\right) \;\to\; 0 \tag{T-13.P2a}

während K(P_\theta(n)) geladen bleibt. Dies ist der formale Gehalt von „das stehende Modell ist präsent, ohne dass darüber eine aktive Selbstnarration läuft“ — es ist erreichbar und wird asymptotisch in tiefen meditativen Zuständen angenähert. (Wir verwenden bedingte Komplexität statt Kolmogorov-Subtraktion, weil K(\cdot) - K(\cdot) ohne Unabhängigkeitsannahmen im Allgemeinen nicht wohldefiniert ist; K(\hat{K}_\theta^{\text{active}} \mid P_\theta) ist die operational sinnvolle Größe.)

(b) Obere Grenze — vollständige Selbsttransparenz. \hat{K}_\theta = K_\theta — das Selbstmodell enthält den Codec vollständig. Nach P-4 ist dies für jedes endliche System unmöglich. Sein Informationsgehalt ist formal selbstreferenziell:

K(\hat{K}_\theta) = K(K_\theta) = K(\hat{K}_\theta) = \cdots \tag{T-13.P2b}

Dies ist weder null Information noch unendliche Information. Es ist ein Fixpunkt der Selbstmodellierungsoperation, den der Codec als internes Selbstmodell nicht erreichen kann. Externe Beobachter können Aspekte des Codec erfassen, die seinem eigenen Selbstmodell unzugänglich sind — der Rahmen stützt sich andernorts genau auf diese Asymmetrie (siehe z. B. den Prädiktiven Vorteil menschlicher Gutachter gegenüber dem Selbstmodell einer KI, §8.14 / opt-ai.md) — aber keine externe Spezifikation wird zum eigenen, sich selbst enthaltenden Selbstmodell des Codec. P-4 verbietet Letzteres; Ersteres verbietet es nicht.

(c) Das gewöhnliche Band. Das wache Selbst bewegt sich zwischen diesen Grenzen in einem Band, das durch die Intensität der Selbstmodellierungsschicht bestimmt ist. Der Wachbetrieb unter hoher Last treibt \hat{K}_\theta stark an und erzeugt ein dichtes, selbstgewisses, laut narrierendes Selbst, das paradoxerweise weiter von genauer Selbsterkenntnis entfernt ist — das Selbstmodell erzeugt schneller, als es kalibrieren kann. Zustände mit niedrigem R_{\text{req}} (Meditation, autogenes Training, die hypnagoge Schwelle) erlauben es dem Selbstmodell, langsamer zu werden, dünner zu werden und sich der unteren Grenze anzunähern.

5.6 Suspension vs. Pruning: Ein eigenständiger Mechanismus

Es gibt einen wichtigen mechanistischen Unterschied zwischen zwei Arten, auf die C_{\text{state}} reduziert werden kann:

Pruning (Action-Drift, §6; Narrativer Drift, T-12) wirkt über den MDL-Pruning-Durchlauf. Es zerstört Repräsentationskapazität. Auf der Ebene des Codec ist es irreversibel. Der Codec kann das, was geprunt wurde, nicht spontan wiederherstellen.
Suspension wirkt, indem die Selbstmodellierungsschicht \hat{K}_\theta vorübergehend angehalten wird, ohne ihre Mechanik zu löschen. Das bestehende Modell P_\theta(t) bleibt vollständig geladen; lediglich die selbstreferenzielle oberste Schicht hört auf zu generieren. Dies ist reversibel — das Selbstmodell setzt wieder ein, wenn die Suspension endet.

Meditation nutzt Suspension, nicht Pruning. Deshalb sind die Effekte der Meditation unmittelbar reversibel (die gewöhnliche Selbstnarration setzt bei der Rückkehr zum normalen Betrieb wieder ein), während Action-Drift dies nicht ist (das geprunte Verhaltensrepertoire kann nicht spontan regeneriert werden). Die beiden Mechanismen sind formal verschieden, obwohl beide die aktive Komplexität des Codec reduzieren.

§6. Handlungs-Drift als MDL-Beschneidung des Verhaltensrepertoires

6.1 Der Mechanismus

Der MDL-Pruning-Durchgang des Wartungszyklus (T9-3/T9-4) optimiert das Komplexitätsbudget des Codec, indem er Repräsentationskapazität löscht, die durch den aktuellen Eingabestrom nicht gerechtfertigt ist. Dieser Mechanismus wurde im Kontext des perzeptuellen Narrativen Drifts identifiziert (Überlebenden-Wache-Ethik, Abschnitt V.3a): Ein an einen konsistent gefilterten Eingabestrom angepasster Codec kappt zu Recht seine Kapazität für ausgeschlossene Wahrheiten.

Derselbe Mechanismus gilt für das Verhaltensrepertoire des Codec. Definiere:

Definition T-13.D3 (Verhaltensrepertoire). Das Verhaltensrepertoire \mathcal{B}_\theta(t) ist die Menge der Verzweigungsauswahlen, die P_\theta(t) bewerten und ausführen kann — d. h. der Wertebereich der Auswahlfunktion \sigma_t, den der Codec effektiv realisieren kann.

6.2 Die Proposition des Handlungs-Drifts

Proposition T-13.P1 (Handlungs-Drift). Wenn dem Eingabestrom des Codecs konsistent Kontexte fehlen, die bestimmte Verzweigungsauswahlen erfordern, wird der MDL-Pruning-Durchlauf die Fähigkeit des Codecs untergraben, diese Zweige zu evaluieren und auszuführen. Das Verhaltensrepertoire \mathcal{B}_\theta(t) kontrahiert unter konsistenter Eingabebeschränkung monoton:

\mathcal{B}_\theta(t + \tau) \subset \mathcal{B}_\theta(t) \quad \text{for } \tau \gg \tau_{\text{prune}} \tag{T-13.P1}

wobei \tau_{\text{prune}} die charakteristische Zeitskala des MDL-Pruning-Durchlaufs ist.

Argument. Das MDL-Pruning-Kriterium bewertet jede repräsentationale Komponente nach ihrem Beitrag zur Kompressionseffizienz. Ein Zweigtyp b \in \mathcal{B}_\theta, der über einen hinreichend langen Zeitraum nicht ausgewählt wurde (oder dessen Auswahlkontexte im Eingabestrom nicht aufgetreten sind), trägt null Bit zur laufenden Kompression von \varepsilon_t durch den Codec bei. Unter strenger MDL-Bilanzierung verursacht die Aufrechterhaltung der Fähigkeit, b zu evaluieren und auszuwählen, einen Komplexitätskostenaufwand K(b \mid P_\theta) > 0 ohne kompensierenden Kompressionsnutzen. Der Pruning-Durchlauf löscht daher die Evaluationsmaschinerie von b und kontrahiert damit \mathcal{B}_\theta.

Diese Kontraktion ist auf der Ebene des Codecs irreversibel: Sobald die Evaluationsmaschinerie für b weggeprunt wurde, kann der Codec sie nicht spontan regenerieren, ohne auf Eingabekontexte zu treffen, die diese Kapazitätsinvestition erneut rechtfertigen. Das Pruning ist kein Vergessen (das durch Hinweisreize möglicherweise rückgängig gemacht werden könnte); es ist die Zerstörung der rechnerischen Infrastruktur, die zur Evaluation einer Klasse von Zweigen erforderlich ist. \blacksquare

6.3 Phänomenologische Instanzen

Handlungsdrift bildet sich in mehreren gut dokumentierten Verhaltensphänomenen ab:

Erlernte Hilflosigkeit: Das anhaltende Fehlen von Kontexten, in denen handlungsfähiges Agieren den Vorhersagefehler reduziert, führt zur Ausdünnung der Bewertungsmechanismen für diese Handlungstypen.
Verengung der Komfortzone: Ein Codec, der in einer vorhersagbaren Umgebung mit niedrigem \varepsilon_t operiert, beschneidet schrittweise seine Fähigkeit zu hochvarianten, explorativen Verzweigungsauswahlen.
Institutionelle Verhaltensverknöcherung: Ein organisationaler Codec (zivilisatorischer Codec, Abschnitt IV.3 des Ethikpapiers), der an stabile regulatorische Umgebungen angepasst ist, beschneidet die Fähigkeit zu rascher adaptiver Reaktion.

6.4 Beziehung zu T-12

Action-Drift ist ein Spezialfall des Versagens der Substrat-Treue, das T-12 formalisieren wird: Das eigene Verhaltensrepertoire des Codec ist ein Bestandteil seines repräsentationalen Substrats, und eine konsistente Einschränkung des Inputs erodiert dieses Substrat ebenso sicher, wie sie das Wahrnehmungsmodell erodiert. Die formale Verbindung lautet:

Narrativer Drift (Geltungsbereich von T-12): Das perzeptuelle Modell wird unter gefiltertem Input beschnitten → der Codec liegt über die Welt mit hoher Sicherheit falsch.
Action-Drift (Geltungsbereich von T-13): Das Verhaltensrepertoire wird unter gefiltertem Input beschnitten → der Codec ist in Bereichen, die er nicht mehr evaluiert, mit hoher Sicherheit impotent.

Beides sind Konsequenzen davon, dass der Stabilitätsfilter auf Komprimierbarkeit statt auf Treue selektiert. Ein gut komprimierter Codec kann zugleich mit hoher Sicherheit falsch und verhaltensmäßig verarmt sein.

§7. Geltungsbereich und Grenzen

7.1 Bedingt durch P-4 und das Handlungs-Axiom

Das gesamte Argument hängt von Theorem P-4 (\Delta_{\text{self}} > 0 für endliche selbstreferenzielle Systeme oberhalb von K_{\text{threshold}}) und dem Handlungs-Axiom (dass Apertur-Durchquerung empfunden wird) ab. Wenn P-4 abgeschwächt wird oder das Handlungs-Axiom aufgegeben wird, gilt die strukturelle Identifikation von Willen mit Bewusstsein (Korollar T-13b) nicht.

7.2 Löst das Schwere Problem nicht auf

Korollar T-13b verortet Willen und Bewusstsein an derselben strukturellen Adresse, erklärt aber nicht, warum sich eines von beidem überhaupt nach etwas anfühlt. Das Schwere Problem (Preprint §8.1) bleibt ein Primitivum. Was T-13b zeigt, ist die Einheit der beiden Mysterien — eine Vereinfachung, keine Lösung.

7.3 Gleichungen unverändert

Die Theoreme T-13 und T-13a ändern nichts an der Mathematik von T6-1 bis T6-3. Die eingeschränkte Minimierung freier Energie (T6-3) ist unter sowohl der von FEP übernommenen als auch der Verzweigungsauswahl-Interpretation formal identisch. Was sich ändert, ist der ontologische Status von a_t: Unter der FEP-Lesart ist es ein nach außen gesandter motorischer Befehl; unter der Verzweigungsauswahl-Lesart ist es ein Navigationsindex innerhalb des Zukunftsfächers.

7.4 Die Erklärung von Kreativität ist strukturell, noch nicht empirisch

Die Kreativitätsfolge (§5) ist eine strukturelle Vorhersage, die aus der Bandbreiten-Teilungsbeschränkung zwischen Selbstmodellierung und Umweltverfolgung abgeleitet wird. Obwohl sie mit der bestehenden Neuroimaging-Literatur vereinbar ist, wurde sie noch nicht direkt anhand der hier vorhergesagten spezifischen informationstheoretischen Größen getestet. Vorhersage T-13.E1 wird als falsifizierbarer empirischer Test vorgeschlagen.

7.5 Zeitskala des Handlungsdrifts

Proposition T-13.P1 zeigt, dass Handlungsdrift auftritt, begrenzt aber die Zeitskala \tau_{\text{prune}} nicht. Bei biologischen Codecs wird diese Zeitskala wahrscheinlich durch den zirkadianen Wartungszyklus (Preprint §3.6) bestimmt — in der Größenordnung von Tagen bis Wochen für einzelne Fähigkeiten, Monaten bis Jahren für tiefe Verhaltensmuster. Für zivilisatorische Codecs ist die Zeitskala generationell. Die Begrenzung von \tau_{\text{prune}} anhand empirischer Daten bleibt zukünftige Arbeit.

§8. Abschließende Zusammenfassung

T-13-Ergebnisse

Theorem T-13 (Vollständigkeit der Verzweigungsauswahl). Der informationelle Wartungskreislauf schließt sich unter der Semantik der Verzweigungsauswahl, ohne einen unabhängigen, nach außen gerichteten Handlungskanal zu erfordern. Die Markov-Decke ist die Auslieferungsoberfläche für den ausgewählten Zweig. → Schließt Roadmap-Kriterium (a).
Theorem T-13a (Bedingte Unmöglichkeit der internen Spezifikation der Auswahl). Dort, wo die Verzweigungsauswahl in nichttrivialer Weise vom auswahlrelevanten Residuum \rho_t^{\text{sel}} \subseteq \Delta_{\text{self}} abhängt, würde eine vollständige Spezifikation von \sigma_t innerhalb von \hat{K}_\theta erfordern, Bits in K_\theta \setminus \hat{K}_\theta einzuschließen, was P-4 widerspricht. Wo das Antezedens gilt, ist \Delta_{\text{self}} der notwendige Ort intern nicht spezifizierbarer Verzweigungsauswahl. → Schließt Roadmap-Kriterium (b) bedingt durch die Beteiligung des Residuums auf Architekturebene.
Korollar T-13b (Einheit der Adresse). Wille und Bewusstsein teilen dieselbe strukturelle Adresse (\Delta_{\text{self}}). Der „Funke“ und die „Wahl“ sind zwei Aspekte desselben nicht modellierbaren Merkmals endlicher Selbstreferenz.
Korollar T-13c (Das Selbst als Residuum). Das erlebte Selbst ist die komprimierte Narration von \hat{K}_\theta; das tatsächliche Selbst — der Ort von Erfahrung, Auswahl und Identität — ist \Delta_{\text{self}}. Das Selbstmodell verfolgt den Codec notwendigerweise mit einer zeitlichen Verzögerung und kann seinen eigenen Generator nicht enthalten.
§5: Konsequenz für Kreativität. Betrieb nahe der Schwelle erweitert das effektive \Delta_{\text{self}} und erzeugt Verzweigungsauswahlen, die für das Selbst weniger vorhersagbar sind und als Kreativität erlebt werden. → Schließt Roadmap-Kriterium (c).
Proposition T-13.P2 (Grenzfälle der Selbstinformation). Der Informationsgehalt des erlebten Selbst ist zwischen einer unteren Grenze (reine Präsenz: stehendes Modell minus aktive Selbstnarration, erreichbar in Meditation) und einer oberen Grenze (volle Selbsttransparenz: unmöglicher Fixpunkt, P-4) beschränkt. Das gewöhnliche wache Selbst bewegt sich innerhalb dieses Bandes.
§5.6: Suspension vs. Pruning. Meditation reduziert C_{\text{state}} durch Suspendierung der Selbstmodellierungsschicht (reversibel), nicht durch MDL-Pruning (irreversibel). Dies sind formal verschiedene Mechanismen.
Proposition T-13.P1 (Handlungs-Drift). Der MDL-Pruning-Durchgang erodiert das Verhaltensrepertoire unter konsistenter Eingabebeschränkung und formalisiert damit den chronischen Fehlermodus, der den perzeptuellen Narrativen Drift ergänzt. → Schließt Roadmap-Kriterium (d).

Verbleibende offene Punkte

Charakterisierung von K_{\text{threshold}}. Die Konsequenz für Kreativität und der Handlungs-Drift-Mechanismus gelten nur für Systeme oberhalb der Schwelle phänomenologischer Relevanz (P-4, §4). Die Eingrenzung von K_{\text{threshold}} bleibt ein offenes Problem, das mit P-4 geteilt wird.
Empirische Validierung von T-13.E1. Die Kreativitätsvorhersage erfordert gezielte Neuroimaging-Studien, die die Aktivität des Selbstmodells mit den hier definierten informationstheoretischen Größen korrelieren.
Schranke für \tau_{\text{prune}}. Eine Begrenzung der Zeitskala des Handlungs-Drifts anhand empirischer Daten würde der Proposition quantitative Vorhersagekraft verleihen.
Formale Verbindung zu T-12. Handlungs-Drift wird als Spezialfall eines Versagens der Substrat-Treue identifiziert; die vollständige formale Integration wartet auf die Substrat-Treue-Bedingung (T-12).
Empirische Schranke für C_{\text{state}}^{\min}. Eine Begrenzung der unteren Grenze der Selbstinformation anhand kontemplativ-neurowissenschaftlicher Daten (z. B. Reduktion des BOLD-Signals im Default-Mode-Netzwerk während nichtdualen Gewahrseins) würde Proposition T-13.P2 quantitativen Gehalt verleihen.

Dieser Anhang wird parallel zu theoretical_roadmap.pdf gepflegt. Referenzen: Theorem P-4 (Anhang P-4), T6-1 bis T6-3 (Preprint §3.8), T9-3/T9-4 (Wartungszyklus, Preprint §3.6), §8.6 (Virtueller Codec), Überlebenden-Wache Ethik Abschnitt V.3a (Narrativer Drift).