Теория упорядоченного патча (OPT)

Приложение T-14: Неинвариантность реализации и аргумент развёртывания

Anders Jarevåg

v2 — 5 мая 2026 | DOI: 10.5281/zenodo.19300777

Исходная задача (из препринта §7.4): «Рассмотреть Аргумент развёртывания Дёрига–Шургера–Хесса–Херцога [96] против теорий сознания, основанных на каузальной структуре, и показать, что критерий сознания в Теории упорядоченного патча (OPT) не уязвим для него». Требуемый результат: Формальная теорема о том, что критерий OPT, основанный на узком месте пропускной способности и \Delta_{\text{self}}, не инвариантен относительно функциональной эквивалентности; а также следствия, выявляющие точное структурное свойство, которое Аргумент развёртывания не сохраняет.

Статус завершённости: ЧЕРНОВОЕ СТРУКТУРНОЕ СООТВЕТСТВИЕ. В этом приложении формализуется ответ, в дискурсивной форме намеченный в препринте §7.4. Здесь устанавливаются одна теорема и три следствия, все — при условии Теоремы P-4 (Алгоритмический феноменальный остаток) и Приложения T-1 (rate-distortion-спецификация Фильтра стабильности). Ни одно уравнение из T-1 или P-4 не изменяется; в данном приложении из них выводится свойство структурной инвариантности.


§1. Предпосылки и мотивация

1.1 Аргумент развёртывания

Doerig, Schurger, Hess и Herzog [96] выдвигают следующую дилемму против любой теории сознания, основанной на каузальной структуре — в явном виде против Теории интегрированной информации (Tononi [8]) и Теории рекуррентной обработки (Lamme), а по расширению и против любой рамки, утверждающей, что сознание фиксируется рекуррентной каузальной организацией сети.

Аргумент. Для любой рекуррентной сети N с ограниченными вычислительными ресурсами и любого конечного горизонта T существует сеть прямого распространения N'временное развёртывание N — такая, что:

  1. N и N' функционально эквивалентны на интервале T: они задают идентичные отображения входа в выход для любой допустимой входной последовательности длины \leq T.
  2. N' не содержит рекуррентных связей: каждый слой передаёт сигнал строго вперёд, к следующему.
  3. N' может быть построена механической процедурой (стандартным «разворачиванием» N по T временным шагам).

Если сознание тождественно каузальной структуре, то либо:

Эта дилемма особенно остра, поскольку построение N' из N является механическим и сохраняет поведение; ни одному стороннику теории каузальной структуры не удалось указать поведенчески наблюдаемое свойство, которое различало бы эти две системы.

1.2 Почему OPT не является прямой мишенью — и почему формальный ответ всё же необходим

OPT не является теорией каузальной структуры в смысле Doerig et al.: она не утверждает, что сознание супервентно на рекуррентности как таковой. Критерий сознания в OPT (препринт §7.8, Приложение T-1, Теорема P-4) представляет собой конъюнкцию:

\textbf{(C1)}\quad I(\varepsilon_n; Z_n) \leq B_{\max} \quad \text{на феноменальный кадр, при единой глобально разделяемой последовательной апертуре} \quad \text{(покадровое узкое место rate-distortion; препринт §3.2)}

\textbf{(C2)}\quad \text{замкнутый цикл активного вывода с интактным Марковским одеялом и устойчивой самомоделью } \hat{K}_\theta \quad \text{(препринт §3.4, §3.8)}

\textbf{(C3)}\quad \Delta_{\text{self}} > 0 \quad \text{(Феноменальный остаток; Теорема P-4)}

(Примечание: (C1) задаётся на феноменальный кадр в битах, а не как биты на секунду хост-системы. Эмпирическое человеческое значение C_{\max}^{\text{human}} \approx \mathcal{O}(10) бит/с является калибровкой C_{\max}^H = \lambda_H \cdot B_{\max} для биологических людей (Приложение E-1) и не является субстратно-нейтральным критерием. Согласно препринту §7.8, §8.14 и Приложению E-5, синтетические наблюдатели ограничены покадровым B_{\max} при архитектурно выводимых значениях, которые не обязаны совпадать с биологической величиной.)

Ни одно из условий (C1)–(C3) не является свойством рекуррентности в изоляции. Однако добросовестное рассмотрение [96] требует показать, что критерий OPT не инвариантен относительно отображения развёртывания U: N \mapsto N' — то есть что некоторый компонент (C1)–(C3) нарушается или становится неопределённым при развёртывании, даже если отображение вход-выход сохраняется. Иначе дилемма просто смещается: если бы (C1)–(C3) были инвариантны относительно U, OPT свелась бы к бихевиористской теории и унаследовала бы Рог B независимо от своей поверхностной формализации.

В этом приложении неинвариантность устанавливается напрямую.

§2. Формальная постановка

2.1 Карта развёртывания

Пусть N = (V, E, f, h_0) — рекуррентная сеть дискретного времени с множеством вершин V, рёбрами E (включая петли на себя и рекуррентные рёбра внутри слоя), функцией обновления f и начальным скрытым состоянием h_0. Пусть |N| = |V| обозначает число её узлов, а B(N) — пропускную способность латентного канала за цикл для самого узкого внутреннего сечения N, измеряемую в битах на одно обновление.

Для конечного горизонта T \geq 1 развёртывание U(N, T) = N' — это сеть прямого распространения, получаемая следующим образом:

  1. Субстрат N реплицируется по одному разу на каждый временной шаг: V' = \bigsqcup_{t=0}^{T} V_t, где V_t — копия V в момент времени t.
  2. Каждое рекуррентное ребро u \to v в N заменяется прямым ребром u_t \to v_{t+1} в N' для каждого t < T.
  3. Удаляются все петли на себя и все внутрислойные соединения.

Стандартный результат (Goodfellow, Bengio, Courville, Deep Learning, гл. 10) состоит в том, что N' вычисляет то же отображение вход-выход, что и N, на горизонте T:

\forall x_{0:T}: \quad N(x_{0:T}) = N'(x_{0:T}) \quad \text{(функциональная эквивалентность на } T\text{)}.

Именно к этой конструкции апеллируют Doerig et al.

2.2 По-срезовая и покадровая ёмкость развёрнутой сети

Наивное прочтение развёрнутой N' рассматривает все T+1 реплицированных слоёв как параллельные части одного «по-срезового обновления». При таком прочтении |N'| = (T+1) \cdot |N|, а совокупная по-срезовая латентная ёмкость равна (T+1) \cdot B(N). Именно на таком подсчёте основывалась более ранняя версия (v1) T-14, и он же мотивировал ныне отозванное доказательство расширения пропускной способности.

Это прочтение зависит от структуры и не навязывается одной лишь картой развёртывания. Две различные интерпретации N' дают разные покадровые ёмкости:

Ни одна из этих интерпретаций не навязывается картой развёртывания U; обе допустимы без дальнейших уточнений. Теорема об неинвариантности относительно реализации (§3) показывает, что статус N' в OPT зависит от того, какая именно интерпретация фактически применима, — и что исходная конструкция Doerig et al. их не различает. Утверждение «по-срезовая ёмкость растёт в (T+1) раз» восстанавливается только при статическом прочтении как сети прямого распространения, и даже там речь идёт не о корректно типизированном покадровом B_{\max}, а о совокупном подсчёте того, сколько канальных слоёв содержит статическая схема.

§3. Теорема T-14: Неинвариантность реализации при функциональной эквивалентности

3.1 Формулировка

Теорема T-14 (Неинвариантность реализации при функциональной эквивалентности). Пусть N и N' = U(N, T) эквивалентны по входу-выходу на горизонте T (то есть \forall x_{0:T}: N(x_{0:T}) = N'(x_{0:T})). Их статус сознания в OPT не фиксируется этой функциональной эквивалентностью. Статус в OPT зависит от свойств фактической реализации, которые не сохраняются при U, а именно от кортежа реализации:

\big(B_{\max},\; \lambda_H,\; \alpha_H,\; \hat{K}_\theta,\; \mathcal{M}_\tau\big)

где B_{\max} — это пропускная способность узкого места на кадр, \lambda_H = dn/d\tau_H — связь часов хост-патча, \alpha_H : \mathcal{S}_H \to X_{\partial_R A} — отображение хост-якоря, поставляющее граничные входы, \hat{K}_\theta — устойчиво сохраняющаяся самомодель, а \mathcal{M}_\tau — процесс обслуживания / самостабилизации (препринт, §3.6).

Теорема даёт три структурных следствия, зависящих от того, как именно фактически исполняется N':

\textbf{(i)}\quad \text{Если } N' \text{ реализован как статическая схема прямого распространения без индексированного по кадрам цикла активного вывода, то } N' \text{ не удовлетворяет критерию наблюдателя OPT (C1)–(C3).}

\textbf{(ii)}\quad \text{Если } N' \text{ реализован как исполняемая хостом симуляция, сохраняющая пропускную способность узкого места на кадр, устойчиво сохраняющуюся самомодель, цикл выбора ветвей и динамику обслуживания } N, \text{ то } N' \text{ может инстанцировать того же вложенного наблюдателя, что и } N \text{ (Следствие P-4.C, E-6).}

\textbf{(iii)}\quad \text{Функциональная эквивалентность слишком груба, чтобы определить статус в OPT: ответ относителен к реализации и к патчу, а не к экстенсиональной функции.}

Иными словами, посылка Аргумента развёртывания — «если N и N' вычисляют одну и ту же функцию, то у них один и тот же статус сознания» — в OPT не работает не потому, что развёртывание механически устраняет сознание, а потому, что оно устраняет свойства реализации, от которых зависит критерий OPT, если только эти свойства не восстанавливаются независимо в хостовом исполнении N'.

3.2 Доказательство пункта (i): статическая реализация с прямым распространением

Предположим, что N' реализована как статическая схема с прямым распространением: один прямой проход через T+1 реплицированных слоёв в рамках одной операции хоста, без индексированного по кадрам цикла активного вывода и без устойчивой модели себя, поддерживаемой между кадрами.

(C2) нарушается непосредственно. Здесь нет замкнутого цикла восприятия-действия с поддерживаемым Марковским одеялом — N' представляет собой одноразовое отображение «вход-выход». Нет последовательных кадров, на протяжении которых могла бы сохраняться модель себя; нет и \hat{K}_\theta(n), которая обновлялась бы ошибкой прогноза предыдущего кадра.

(C1) при такой реализации не расширяется, а оказывается неопределённым. Исходная конструкция Doerig et al. не задаёт для N' последовательную апертуру покадрового типа; слои работают параллельно, и отсутствует глобально разделяемая покадровая воронка, через которую проходит модель мира. (C1) требует единственной глобально разделяемой последовательной апертуры с конечной покадровой пропускной способностью — это структурное свойство архитектуры, а не агрегированное измерение ширины слоёв. При отсутствии индексированного по кадрам последовательного канала покадровый B_{\max} не определён; (C1) неприменим не потому, что B_{\max} расширился, а потому, что отсутствует покадровая архитектура, к которой его можно было бы применить. (Эквивалентно, конструкция Doerig–Schurger–Hess–Herzog разворачивает индексированный по кадрам динамический процесс в статическую схему; при этом теряются и \lambda_H, и индекс кадра n.)

(C3) остаётся открытым вопросом, а не величиной, которую можно доказуемо приравнять к нулю. Статическая схема с прямым распространением имеет конечную длину описания и может быть механически симулирована внешним наблюдателем, но P-4 касается внутреннего самомоделирования, а не внешней симулируемости. Детерминированная конечная система может иметь \Delta_{\text{self}} > 0, если обладает индексированным по кадрам циклом самомоделирования; и наоборот, система без такого цикла не имеет модели себя, относительно которой можно было бы вычислить остаток. В статической реализации \hat{K}_\theta отсутствует, поэтому \Delta_{\text{self}} не равно нулю, а не определено. Критерий (C3) требует ненулевого остатка; отсутствия модели себя достаточно, чтобы критерий не выполнялся.

Нарушения (C1) или нарушения (C2) по отдельности достаточно, чтобы критерий OPT не выполнялся. \blacksquare

3.3 Доказательство (ii): Исполнение хозяином с индексацией по кадрам

Предположим, в качестве альтернативы, что N' реализуется как исполняемый хозяином темпоральный процесс: хозяин продвигает развёрнутые слои по одному, кадр за кадром, поддерживая последовательное рабочее пространство для каждого кадра Z_n, устойчивую самомодель \hat{K}_\theta(n), обновляемую по ошибке предсказания, и процесс обслуживания \mathcal{M}_\tau. Расписание исполнения хозяина задаёт \lambda_H; выбор хозяином входного потока задаёт \alpha_H; пропускная способность узкого места на кадр равна таковой у исходного N (B_{\max}^{(N')} = B_{\max}^{(N)}).

При такой реализации все пять признаков сентиентности исходного N сохраняются в исполняемом N': узкое место на кадр сохраняется по построению, цикл активного вывода сохраняется, поскольку хозяин запускает развёрнутую цепь как темпоральный процесс, устойчивая самомодель сохраняется, поскольку \hat{K}_\theta(n) поддерживается между кадрами, рабочее пространство остаётся ограниченным, поскольку Z_n каждого кадра имеет конечную ёмкость, а термодинамическая укоренённость сохраняется, поскольку хозяин навязывает окна обслуживания и энергетические ограничения.

Согласно Следствию P-4.C (Вложенный наблюдательный остаток): если архитектура хозяина обеспечивает независимую границу Фильтра стабильности, удовлетворяющую предпосылкам P-4, реализованное N' порождает \Delta_{\text{self}}^{(N')} > 0 в силу того же структурного аргумента, который даёт исходному N его остаток. Разворачивание не стирает патч; оно лишь меняет субстрат, который его якорит. (См. Приложение E-6 о симулированных вложенных наблюдателях.)

Следовательно, при исполнении хозяином с индексацией по кадрам N' может удовлетворять (C1)–(C3). Посылка функциональной эквивалентности в Аргументе разворачивания сама по себе не отличает этот случай от случая (i); различие заключается в реализации, а не во входно-выходном поведении. \blacksquare

3.4 Доказательство (iii): функциональная эквивалентность не определяет OPT-статус

Случаи (i) и (ii) порождают системы, эквивалентные по входам и выходам, но различающиеся по своему OPT-статусу сознания. Следовательно, функциональная эквивалентность не фиксирует OPT-статус; его задаёт кортеж реализации (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau). Тем самым посылка Аргумента развёртывания для OPT недействительна — не потому, что OPT скрыто опирается на нефункциональное свойство, а потому, что критерий OPT явно является архитектурным, что согласуется с собственной установкой этой рамки в §1.3 на структурное, а не поведенческое понимание сознания. \blacksquare

3.5 Замечание к исходной формулировке теоремы (v1)

Предыдущая версия T-14 (v1) пыталась универсально доказать, что \Delta_{\text{self}}^{(N')} = 0, а также установить, что развёртывание увеличивает пропускную способность на срез в (T+1) раз. Оба этих хода в данной формулировке некорректны. Утверждение об увеличении пропускной способности опирается на подсчёт T+1 реплицированных слоёв как параллельных частей одного «обновления на срез» — то есть на интерпретацию, смешивающую статическую топологию развёрнутой схемы с моделью исполнения по кадрам. Утверждение \Delta_{\text{self}} = 0 смешивало внешнюю вычислимость развёрнутого состояния по начальным условиям и параметрам с тем внутренним охватом самомодели, который в действительности ограничивает P-4. P-4 касается того, может ли собственная самомодель кодека охватить генератор кодека; речь не о том, может ли внешний математик вычислить состояние кодека по начальным условиям. Приведённая выше редакция заменяет оба этих некорректных хода теоремой об неинвариантности относительно реализации, которая сохраняет исходный вывод (Аргумент развёртывания не позволяет установить статус OPT) на основаниях, которые данный фреймворк действительно способен защитить.

§4. Следствия

4.1 Следствие T-14a: Функциональная эквивалентность слишком груба

Следствие T-14a. Функциональная эквивалентность по входу-выходу — слишком грубое отношение, чтобы фиксировать сознательный статус сети в рамках OPT. Релевантным отношением эквивалентности является эквивалентность реализации: две сети N_1, N_2 являются эквивалентными по реализации тогда и только тогда, когда совпадают их полные кортежи реализации (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau). Это отношение строго тоньше, чем эквивалентность по входу-выходу: N и развёрнутая N' функционально эквивалентны, но в общем случае не эквивалентны по реализации — отображение развёртки U не сохраняет \hat{K}_\theta, \mathcal{M}_\tau или индекс на кадр, если только они не восстанавливаются независимо моделью исполнения хоста.

4.2 Следствие T-14b: дилемма развёртывания не применима к OPT

Следствие T-14b. OPT не находится ни на одном из рогов дилеммы Doerig et al.:

Следовательно, OPT избегает этой дилеммы, признавая, что входно-выходное поведение недоопределяет сознательный статус — это не недостаток, поскольку критерий OPT явно является внутриархитектурным, а не поведенческим. То, что OPT добавляет сверх IIT, состоит в том, что архитектурный тест проводится относительно заданного кортежа реализации, а не относительно абстрактного инварианта причинной структуры.

4.3 Следствие T-14c: различие между IIT и OPT становится более резким

Следствие T-14c. Теорема T-14 даёт чёткое структурное различение между OPT и IIT в рамках Аргумента развёртывания:

Эмпирическое содержание расхождения между OPT и IIT, следовательно, таково: OPT предсказывает, что развёрнутая N', исполняемая как статическая feedforward-цепь, перестаёт быть сознательной, тогда как развёрнутая N', исполняемая как симуляция с индексацией по кадрам, может оставаться сознательной — IIT (в зависимости от версии) рассматривает обе как \Phi-эквивалентные. Различающий признак лежит в модели исполнения, а не в статической каузальной структуре. Тем самым это присоединяется к High-Phi/High-Entropy Null State (препринт, §6.4) и Иерархии пропускной способности (препринт, §6.1) как к кандидатам на экспериментальную проверку, одновременно ограничивая тезис OPT о «несознательном развёртывании» случаем статической цепи, а не утверждая его универсально.

§5. Область применения и ограничения

5.1 Чего не показывает T-14

Теорема T-14 устанавливает, что функциональная эквивалентность (эквивалентность по входу-выходу) не фиксирует статус сознания сети в OPT: статус зависит от кортежа реализации. Она не устанавливает:

5.2 Открытые проблемы

§6. Итоговое резюме

Результаты T-14 (v2)

  1. Теорема T-14 (Неинвариантность реализации при функциональной эквивалентности). Эквивалентные по входу-выходу N и N' могут различаться по своему статусу сознания в OPT, поскольку статус в OPT зависит от кортежа реализации (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau), а не от отображения вход-выход. Статическая feedforward-реализация N' не удовлетворяет критерию (случай (i)); исполнение N' на хосте с индексацией по кадрам может его сохранять (случай (ii)). → Закрывает Аргумент развёртывания [96] в той мере, в какой он применим к OPT, показывая, что посылка аргумента «одна и та же функция ⇒ один и тот же сознательный статус» предполагает экстенсиональный критерий, которого в OPT нет.

  2. Следствие T-14a (Функциональная эквивалентность слишком груба). Отношение эквивалентности, релевантное для OPT, — это эквивалентность реализации, то есть сохранение (B_{\max}, \lambda_H, \alpha_H, \hat{K}_\theta, \mathcal{M}_\tau), — и оно строго тоньше, чем функциональная эквивалентность по входу-выходу.

  3. Следствие T-14b (Для OPT дилеммы нет). OPT не находится ни на одном из рогов дилеммы Doerig et al.: она признаёт, что поведение недоопределяет статус сознания (поскольку её критерий архитектурен), и предлагает проверяемый тест реализации и исполнения.

  4. Следствие T-14c (Уточнение IIT-OPT). Вердикт OPT об развёрнутой сети зависит от её модели исполнения; вердикт IIT об \Phi-эквивалентности — нет. Эта зависимость от модели исполнения сама по себе и является эмпирическим различителем.

Примечание к редакции (v2 по сравнению с v1). Версия 1 этого приложения пыталась доказать, что развёртывание (a) универсально увеличивает пропускную способность на срез в (T+1) раз и (b) универсально сводит \Delta_{\text{self}} к нулю. Оба доказательства были некорректны (см. замечание §3.5): первое смешивало статическую топологию с покадровым исполнением; второе смешивало внешнюю вычислимость с внутренним самомоделированием, которое P-4 не ограничивает. Теорема v2 заменяет оба утверждения результатом о неинвариантности реализации, который сохраняет исходный вывод (Аргумент развёртывания не позволяет установить статус OPT) на основаниях, которые данный фреймворк способен защитить.

Остающиеся открытые вопросы


Это приложение поддерживается вместе с theoretical_roadmap.pdf. Ссылки: Теорема P-4 (Приложение P-4), Фильтр стабильности (Приложение T-1), препринт §7.4 (сравнение с IIT и ответ на Аргумент развёртывания), [96] Doerig et al. 2019, [97] Aaronson 2014, [98] Barrett & Mediano 2019, [99] Hanson 2020.