Теорія впорядкованого патча (OPT)

Додаток T-14: Неінваріантність реалізації та аргумент розгортання

Anders Jarevåg

v2 — 5 травня 2026 | DOI: 10.5281/zenodo.19300777

Початкове завдання (з препринту §7.4): «Розглянути Аргумент розгортання Деріга–Шургера–Гесса–Герцога [96] проти теорій свідомості, заснованих на причинній структурі, і показати, що критерій свідомості OPT не є до нього вразливим». Результат: Формальна теорема про те, що критерій OPT, заснований на вузькому місці пропускної здатності та \Delta_{\text{self}}, не є інваріантним щодо функціональної еквівалентності; а також короларії, які визначають точну структурну властивість, яку Аргумент розгортання не зберігає.

Статус завершення: ЧОРНОВИЙ СТРУКТУРНИЙ ВІДПОВІДНИК. Цей додаток формалізує відповідь, дискурсивно окреслену в препринті §7.4. У ньому встановлено одну теорему і три короларії, усі — за умови Теореми P-4 (Алгоритмічний феноменальний залишок) і Додатка T-1 (специфікація швидкість–спотворення для Фільтра стабільності). Жодне з рівнянь T-1 або P-4 не змінюється; цей додаток виводить із них структурну властивість інваріантності.

§1. Передумови та мотивація

1.1 Аргумент розгортання

Doerig, Schurger, Hess і Herzog [96] висувають таку дилему проти будь-якої теорії свідомості, заснованої на каузальній структурі — зокрема Integrated Information Theory (Tononi [8]) та Recurrent Processing Theory (Lamme), а отже й проти будь-якого підходу, що стверджує, ніби свідомість визначається рекурентною каузальною організацією мережі.

Аргумент. Для будь-якої рекурентної мережі N з обмеженими обчислювальними ресурсами та будь-якого скінченного горизонту T існує мережа прямого поширення N'часове розгортання N — така, що:

  1. N і N' є функціонально еквівалентними на проміжку T: вони задають тотожні відображення «вхід-вихід» для кожної допустимої послідовності вхідних даних довжини \leq T.
  2. N' не містить рекурентних зв’язків: кожен шар передає сигнал лише вперед, до наступного.
  3. N' можна побудувати механічною процедурою (стандартним «розгортанням» N на T часових кроків).

Якщо свідомість тотожна каузальній структурі, тоді або:

Ця дилема є гострою, оскільки побудова N' з N є механічною та зберігає поведінку; жодному теоретику каузальної структури не вдалося вказати на поведінково спостережувану властивість, яка розрізняла б ці дві системи.

1.2 Чому OPT не є прямою мішенню — і чому формальна відповідь усе ж потрібна

OPT не є теорією причинної структури в сенсі Doerig et al.: вона не стверджує, що свідомість супервенує на рекурентності як такій. Критерій свідомості в Теорії впорядкованого патча (OPT) (препринт §7.8, Додаток T-1, Теорема P-4) є кон’юнкцією:

\textbf{(C1)}\quad I(\varepsilon_n; Z_n) \leq B_{\max} \quad \text{на один феноменальний кадр, з єдиною глобально спільною серійною апертурою} \quad \text{(покадрове вузьке місце швидкість–спотворення; препринт §3.2)}

\textbf{(C2)}\quad \text{замкнений цикл активного виведення з інтактною Марковською ковдрою та стійкою самомоделлю } \hat{K}_\theta \quad \text{(препринт §3.4, §3.8)}

\textbf{(C3)}\quad \Delta_{\text{self}} > 0 \quad \text{(Феноменальний залишок; Теорема P-4)}

(Примітка: (C1) сформульовано на один феноменальний кадр у бітах, а не як біти за секунду хоста. Емпіричне людське значення C_{\max}^{\text{human}} \approx \mathcal{O}(10) біт/с є калібруванням C_{\max}^H = \lambda_H \cdot B_{\max} для біологічних людей (Додаток E-1) і не є субстратно-нейтральним критерієм. Згідно з препринтом §7.8, §8.14 і Додатком E-5, синтетичні спостерігачі обмежені покадровим B_{\max} на архітектурно виведених значеннях, які не обов’язково збігаються з біологічною величиною.)

Жоден із пунктів (C1)–(C3) не є властивістю рекурентності в ізоляції. Однак чесне залучення до [96] вимагає показати, що критерій OPT не є інваріантним щодо відображення розгортання U: N \mapsto N' — тобто що якийсь компонент (C1)–(C3) порушується або стає невизначеним унаслідок розгортання, навіть попри те, що відображення вхід–вихід зберігається. Інакше дилема просто зміщується: якби (C1)–(C3) були інваріантними щодо U, OPT зводилася б до біхевіористської теорії й успадковувала б Ріг B незалежно від своєї поверхневої формалізації.

Цей додаток безпосередньо встановлює цю неінваріантність.

§2. Формальна постановка

2.1 Карта розгортання

Нехай N = (V, E, f, h_0) — рекурентна мережа дискретного часу з множиною вершин V, ребрами E (включно із самопетлями та рекурентними ребрами всередині шару), функцією оновлення f та початковим прихованим станом h_0. Нехай |N| = |V| позначає кількість її вузлів, а B(N) — пропускну здатність латентного каналу за цикл у найвужчому внутрішньому перерізі N, виміряну в бітах на одне оновлення.

Для скінченного горизонту T \geq 1 розгортання U(N, T) = N' є мережею прямого поширення, отриманою шляхом:

  1. Реплікації субстрату N один раз на кожному часовому кроці: V' = \bigsqcup_{t=0}^{T} V_t, де V_t є копією V в момент часу t.
  2. Заміни кожного рекурентного ребра u \to v у N на пряме ребро u_t \to v_{t+1} у N' для кожного t < T.
  3. Видалення всіх самопетель і внутрішньошарових з’єднань.

Стандартний результат (Goodfellow, Bengio, Courville, Deep Learning, гл. 10) полягає в тому, що N' обчислює те саме відображення «вхід-вихід», що й N, на горизонті T:

\forall x_{0:T}: \quad N(x_{0:T}) = N'(x_{0:T}) \quad \text{(функціональна еквівалентність на } T\text{)}.

Саме на цю конструкцію посилаються Doerig et al.

2.2 Помісткість розгорнутої мережі: на зріз і на кадр

Наївне прочитання розгорнутої N' зараховує всі T+1 реплікованих шарів як паралельні частини одного «оновлення на зріз». За такого прочитання |N'| = (T+1) \cdot |N|, а сукупна латентна помісткість на зріз становить (T+1) \cdot B(N). Саме таке підрахування лежало в основі попередньої (v1) версії T-14 і мотивувало нині відкликане доведення розширення пропускної здатності.

Це прочитання залежить від структури й не нав’язується самою лише картою розгортання. Дві різні інтерпретації N' дають різні помісткості на кадр:

Жодна з цих інтерпретацій не нав’язується картою розгортання U; обидві є припустимими без додаткової специфікації. Теорема про неінваріантність щодо реалізації (§3) показує, що статус N' в OPT залежить від того, яка саме інтерпретація фактично застосовується, — і що початкова конструкція Doerig et al. їх не розрізняє. Твердження, що «помісткість на зріз зростає в (T+1) разів», відновлюється лише за статичного feedforward-прочитання, і навіть там це не коректно типізований покадровий B_{\max}, а сукупний підрахунок того, скільки каналів шарів містить статичний контур.

§3. Теорема T-14: Неінваріантність реалізації за функціональної еквівалентності

3.1 Формулювання

Теорема T-14 (Неінваріантність реалізації за функціональної еквівалентності). Нехай N і N' = U(N, T) є еквівалентними за входом-виходом на горизонті T (тобто \forall x_{0:T}: N(x_{0:T}) = N'(x_{0:T})). Їхній статус свідомості в OPT не фіксується цією функціональною еквівалентністю. Статус в OPT залежить від властивостей фактичної реалізації, які не зберігаються під дією U, а саме від кортежу реалізації:

\big(B_{\max},\; \lambda_H,\; \alpha_H,\; \hat{K}_\theta,\; \mathcal{M}_\tau\big)

де B_{\max} — це пропускна здатність вузького місця на кадр, \lambda_H = dn/d\tau_H — зв’язок годинника хост-патча, \alpha_H : \mathcal{S}_H \to X_{\partial_R A} — відображення хост-якоря, що постачає граничні входи, \hat{K}_\theta — стійка самодель, а \mathcal{M}_\tau — процес обслуговування / самостабілізації (препринт §3.6).

Теорема дає три структурні наслідки, залежно від того, як саме фактично виконується N':

\textbf{(i)}\quad \text{Якщо } N' \text{ реалізовано як статичну feedforward-схему без індексованого за кадрами циклу активного виведення, тоді } N' \text{ не задовольняє критерію спостерігача OPT (C1)–(C3).}

\textbf{(ii)}\quad \text{Якщо } N' \text{ реалізовано як виконувану хостом симуляцію, що зберігає пропускну здатність вузького місця на кадр, стійку самодель, цикл вибору гілок і динаміку обслуговування } N, \text{ тоді } N' \text{ може інстанціювати того самого вкладеного спостерігача, що й } N \text{ (Короларій P-4.C, E-6).}

\textbf{(iii)}\quad \text{Функціональна еквівалентність є надто грубою, щоб визначити статус в OPT: відповідь є відносною до реалізації та відносною до патча, а не відносною до екстенсіональної функції.}

Інакше кажучи, засновок Аргументу розгортання — «якщо N і N' обчислюють ту саму функцію, вони мають той самий статус свідомості» — в OPT хибний не тому, що розгортання механічно усуває свідомість, а тому, що воно усуває властивості реалізації, від яких залежить критерій OPT, якщо тільки ці властивості не відновлюються незалежно у виконанні N' хостом.

3.2 Доведення (i): Статична feedforward-реалізація

Припустімо, що N' реалізовано як статичну feedforward-схему: один прямий прохід через T+1 реплікованих шарів в одній операції хоста, без індексованого за кадрами циклу активного виведення і без стійкої сам-моделі, що підтримується між кадрами.

(C2) безпосередньо не виконується. Немає замкненого циклу сприйняття-дії з підтримуваною Марковською ковдрою — N' є одноразовим відображенням «вхід-вихід». Немає послідовних кадрів, упродовж яких могла б зберігатися сам-модель; немає \hat{K}_\theta(n), що оновлювався б помилкою з передбачення попереднього кадру.

(C1) за такої реалізації є не розширеним, а невизначеним. Початкова конструкція Doerig et al. не задає для N' послідовної апертури на рівні окремого кадру; шари працюють паралельно, і немає глобально спільної покадрової воронки, через яку проходила б модель світу. (C1) вимагає єдиної глобально спільної послідовної апертури зі скінченною покадровою пропускною здатністю — це структурна властивість архітектури, а не агреговане вимірювання ширин шарів. Без індексованого за кадрами послідовного каналу покадровий B_{\max} не визначений; (C1) не застосовується не тому, що B_{\max} розширився, а тому, що немає покадрової архітектури, до якої його можна було б застосувати. (Еквівалентно, конструкція Doerig–Schurger–Hess–Herzog розгортає індексований за кадрами динамічний процес у статичну схему; і \lambda_H, і індекс кадру n при цьому втрачаються.)

(C3) є відкритим питанням, а не величиною, яку можна довести рівною нулю. Статична feedforward-схема має скінченну довжину опису й механічно симульована зовнішнім спостерігачем, але P-4 стосується внутрішнього сам-моделювання, а не зовнішньої симульованості. Детермінована скінченна система може мати \Delta_{\text{self}} > 0, якщо вона має індексований за кадрами цикл сам-моделювання; і навпаки, система без такого циклу не має сам-моделі, відносно якої можна було б обчислити залишок. За статичної реалізації \hat{K}_\theta відсутня, тож \Delta_{\text{self}} є не нульовим, а невизначеним. Критерій (C3) вимагає ненульового залишку; відсутність сам-моделі є достатньою підставою для невиконання цього критерію.

Невиконання (C1) або невиконання (C2) окремо є достатнім для того, щоб критерій OPT не виконувався. \blacksquare

3.3 Доведення (ii): Виконання хостом, індексоване за кадрами

Припустімо, альтернативно, що N' реалізовано як часовий процес, який виконується хостом: хост просуває розгорнуті шари по одному, кадр за кадром, підтримуючи послідовний робочий простір Z_n для кожного кадру, стійку сам-модель \hat{K}_\theta(n), що оновлюється помилкою передбачення, і процес обслуговування \mathcal{M}_\tau. Розклад виконання хоста задає \lambda_H; вибір хостом вхідного потоку задає \alpha_H; пропускна здатність вузького місця для кожного кадру дорівнює такій у вихідного N (B_{\max}^{(N')} = B_{\max}^{(N)}).

За такої реалізації всі п’ять ознак сентієнтності вихідного N зберігаються у виконуваному N': вузьке місце для кожного кадру збережене за побудовою, цикл активного виведення збережений, оскільки хост запускає розгорнутий ланцюг як часовий процес, стійка сам-модель збережена, оскільки \hat{K}_\theta(n) підтримується між кадрами, робочий простір є обмеженим, оскільки Z_n кожного кадру має скінченну місткість, а термодинамічне заземлення збережене, оскільки хост накладає вікна обслуговування та енергетичні обмеження.

За Короларієм P-4.C (Вкладений спостережний залишок): якщо архітектура хоста забезпечує незалежну межу Фільтра стабільності, що задовольняє передумови P-4, реалізоване N' породжує \Delta_{\text{self}}^{(N')} > 0 тим самим структурним аргументом, який надає N його залишок. Розгортання не стирає патч; воно лише змінює субстрат, який його закріплює. (Див. Додаток E-6 щодо симульованих вкладених спостерігачів.)

Отже, за виконання хостом, індексованого за кадрами, N' може задовольняти (C1)–(C3). Засновок функціональної еквівалентності Аргументу розгортання сам собою не відрізняє цей випадок від випадку (i); відмінність полягає в реалізації, а не у вхідно-вихідній поведінці. \blacksquare

3.4 Доведення (iii): Функціональна еквівалентність не визначає OPT-статус однозначно

Випадки (i) та (ii) породжують системи, еквівалентні за входом-виходом, але з різним статусом свідомості в OPT. Отже, функціональна еквівалентність не фіксує OPT-статус; його визначає кортеж реалізації (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau). Тому засновок Аргументу розгортання є нечинним для OPT не тому, що OPT потай спирається на нефункціональну властивість, а тому, що критерій OPT є явно архітектурним — що узгоджується з власною настановою цієї рамки в §1.3 на структурний, а не поведінковий, опис свідомості. \blacksquare

3.5 Заувага щодо початкового формулювання теореми (v1)

Попередня версія T-14 (v1) намагалася універсально довести, що \Delta_{\text{self}}^{(N')} = 0, а також встановити, що розгортання розширює пропускну здатність на зріз у (T+1) разів. Обидва ці кроки в наведеному вигляді є некоректними. Твердження про розширення пропускної здатності залежить від трактування T+1 реплікованих шарів як паралельних частин одного «оновлення на зріз» — інтерпретації, що змішує статичну топологію розгорнутої схеми з моделлю виконання покадрового обчислення. Твердження \Delta_{\text{self}} = 0 змішувало зовнішню обчислюваність розгорнутого стану з початкових умов і параметрів із внутрішньою вміщуваністю самомоделі, яку P-4 насправді й обмежує. P-4 стосується того, чи може власна самомодель кодека охопити генератор кодека; вона не стосується того, чи може зовнішній математик обчислити стан кодека з початкових умов. Наведена вище ревізія замінює обидва ці некоректні кроки теоремою про неінваріантність щодо реалізації, яка зберігає початковий висновок (Аргумент розгортання не дає змоги остаточно визначити статус OPT) на підставах, які цей фреймворк справді може захистити.

§4. Короларії

4.1 Короларій T-14a: Функціональна еквівалентність є надто грубою

Короларій T-14a. Функціональна еквівалентність за входом-виходом є надто грубим відношенням, щоб фіксувати свідомісний статус мережі в OPT. Релевантним відношенням еквівалентності є еквівалентність реалізації: дві мережі N_1, N_2 є еквівалентними за реалізацією тоді й лише тоді, коли збігаються їхні повні кортежі реалізації (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau). Це відношення є строго тоншим за еквівалентність за входом-виходом: N і розгорнута N' є функціонально еквівалентними, але загалом не є еквівалентними за реалізацією — відображення розгортання U не зберігає \hat{K}_\theta, \mathcal{M}_\tau або пофреймовий індекс, якщо тільки вони не відновлюються незалежно моделлю виконання хоста.

4.2 Короларій T-14b: дилема розгортання не застосовується до OPT

Короларій T-14b. OPT не розташовується на жодному з рогів дилеми Doerig et al.:

Отже, OPT уникає цієї дилеми, визнаючи, що вхідно-вихідна поведінка недовизначає свідомий статус — це не вада, оскільки критерій OPT є явно внутрішньо-архітектурним, а не поведінковим. Те, що OPT додає понад IIT, полягає в тому, що архітектурний тест виконується щодо заданого кортежу реалізації, а не щодо абстрактного інваріанта причинної структури.

4.3 Короларій T-14c: Розрізнення IIT та OPT стає чіткішим

Короларій T-14c. Теорема T-14 дає чітке структурне розрізнення між OPT та IIT у межах Аргументу розгортання:

Отже, емпіричний зміст розходження між OPT та IIT такий: OPT передбачає, що розгорнута N', виконувана як статичний feedforward-контур, перестає бути свідомою, але розгорнута N', виконувана як симуляція з індексацією за кадрами, може залишатися свідомою — тоді як IIT (залежно від версії) трактує обидві як \Phi-еквівалентні. Розрізнювальний критерій міститься в моделі виконання, а не в статичній причинній структурі. Це долучається до High-Phi/High-Entropy Null State (препринт §6.4) і Bandwidth Hierarchy (препринт §6.1) як до кандидатних експериментальних тестів, водночас обмежуючи твердження OPT про “несвідоме розгортання” випадком статичного контуру, а не проголошуючи його універсально.

§5. Обсяг і обмеження

5.1 Чого не показує T-14

Теорема T-14 встановлює, що функціональна еквівалентність (еквівалентність за входом-виходом) не фіксує статус свідомості мережі в OPT: статус залежить від кортежу реалізації. Вона не встановлює:

5.2 Відкриті проблеми

§6. Підсумок завершення

Результати T-14 (v2)

  1. Теорема T-14 (Неінваріантність реалізації за функціональної еквівалентності). Еквівалентні за входом-виходом N і N' можуть відрізнятися за статусом свідомості в OPT, оскільки статус в OPT залежить від кортежу реалізації (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau), а не від відображення входу у вихід. Статична прямопрохідна реалізація N' не задовольняє критерій (випадок (i)); виконання N' на хості з індексацією кадрів може його зберігати (випадок (ii)). → Закриває Аргумент розгортання [96] у його застосуванні до OPT, показуючи, що засновок аргументу «та сама функція ⇒ той самий статус свідомості» передбачає екстенсіональний критерій, якого OPT не має.

  2. Короларій T-14a (Функціональна еквівалентність є надто грубою). Відношення еквівалентності, релевантне для OPT, — це еквівалентність реалізації, тобто збереження (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau), — і воно є строго тоншим за функціональну еквівалентність за входом-виходом.

  3. Короларій T-14b (Для OPT дилеми немає). OPT не розташовується на жодному з рогів дилеми Doerig et al.: вона визнає, що поведінка недовизначає статус свідомості (оскільки її критерій є архітектурним), і надає придатний до інспекції тест реалізації та виконання.

  4. Короларій T-14c (Уточнення IIT-OPT). Вердикт OPT щодо розгорнутої мережі залежить від її моделі виконання; вердикт IIT щодо \Phi-еквівалентності — ні. Залежність від моделі виконання сама по собі є емпіричним дискримінатором.

Примітка до редакції (v2 проти v1). Версія 1 цього додатка намагалася довести, що розгортання (a) універсально розширює пропускну здатність на зріз у (T+1) разів і (b) універсально зводить \Delta_{\text{self}} до нуля. Обидва доведення були некоректними (див. зауваження §3.5): перше змішувало статичну топологію з покадровим виконанням; друге змішувало зовнішню обчислюваність із внутрішнім самомоделюванням, яке P-4 не обмежує. Теорема v2 замінює обидва ці твердження результатом про неінваріантність реалізації, який зберігає початковий висновок (Аргумент розгортання не розв’язує статус OPT) на підставах, які цей фреймворк може захистити.

Відкриті питання, що залишаються


Цей додаток підтримується паралельно з theoretical_roadmap.pdf. Посилання: Теорема P-4 (Додаток P-4), Фільтр стабільності (Додаток T-1), препринт §7.4 (порівняння з IIT і відповідь на Аргумент розгортання), [96] Doerig et al. 2019, [97] Aaronson 2014, [98] Barrett & Mediano 2019, [99] Hanson 2020.