有序補丁理論

附錄 T-12:基底保真條件與緩慢腐化

Anders Jarevåg

2026 年 4 月 17 日 | DOI: 10.5281/zenodo.19300777

原始任務(出自第 8.3 節,限制 9):「將慢性腐化失效模式形式化——在此情況下,編解碼器於持續受過濾的輸入下進行適應,而 MDL 剪枝步驟會正確地抹除對被排除真實的容量——並同時提出一項基底保真條件,要求具備獨立輸入通道,作為形式上的防禦機制。」 交付內容: 不可逆容量損失、不可判定性界限,以及基底保真條件的形式證明。

完成狀態:草稿結構對應。 本附錄將在配套倫理論文(倖存者守望,第 V.3a 節)與預印本的敘事漂移段落(第 3.3 節)中以論述方式引入的敘事漂移分析加以形式化。本文建立三個定理與一個命題。MDL 剪枝方程式(T9-3、T9-4)維持不變;本附錄展示它們在受過濾輸入下病理性但正確的行為。


§1. 背景與動機

1.1 兩種失效模式

穩定性濾波器(預印本第 3.3 節)施加了一項可存續性條件:唯有在所需預測速率 R_{\text{req}} 維持於編解碼器頻寬 B 之內的流中,觀察者才能持續存在。當 R_{\text{req}} 超出 B 時,編解碼器便會經歷敘事崩解——一種急性失效,其特徵是預測誤差不斷升高、熵持續累積,並最終導致整體一致性的瓦解。

另有一種互補的失效模式,卻不會觸發任何失效訊號。若輸入流遭到系統性預先濾除——產生出一種內部一致、但排除了真實基底資訊的策展化訊號——則編解碼器將呈現低 \varepsilon_t、高效率地運行維護週期,並滿足所有穩定性條件,卻同時在關於基底的判斷上系統性地出錯。這就是敘事漂移:一種慢性腐化,在其自身衡量標準下運作得近乎完美的編解碼器,卻已偏離基底。

1.2 為何這是危險的

敘事崩解會自行顯現。編解碼器會經驗到持續升高的 \varepsilon_t、對預測失效的覺察,以及認知過載。觀察者知道出了問題,即使它無法立刻修正。

敘事漂移則是無聲的。由於經過濾波的輸入流與編解碼器的預測相符,\varepsilon_t 會維持在低位。維護週期照常運作。編解碼器的自我模型會回報穩定且準確的運作狀態。這種腐化從內部是不可見的,因為用來偵測它的工具,本身已被造成該腐化的同一個濾波器所塑形。

1.3 本附錄的範圍

本附錄提供:

  1. 對預濾算子 \mathcal{F} 的形式化定義,以及其對編解碼器輸入分佈的影響(§2)。
  2. 證明在經 \mathcal{F} 過濾的輸入下進行 MDL 剪枝,會不可逆地摧毀編解碼器對被排除訊號的建模能力——定理 T-12(§3)。
  3. 證明一個已完全適應的編解碼器,無法從其內部區分經過濾與未經過濾的輸入——即不可判定性極限定理 T-12a(§4)。
  4. 基底保真條件確立為必要的結構性防禦——定理 T-12b(§5)。
  5. 對文明層級編解碼器與 AI 系統的後果(§6)。

§2. 前濾波算子

2.1 定義

定義 T-12.D1(前置濾波算子)前置濾波器是一個映射 \mathcal{F} : \mathcal{X} \to \mathcal{X}',在輸入流 X_{\partial_R A}(t) 抵達編解碼器的感官邊界之前對其運作,其中 \mathcal{X}' \subset \mathcal{X}。經濾波後的訊號為:

X'(t) = \mathcal{F}\!\left(X_{\partial_R A}(t)\right) \tag{T-12.D1}

此前置濾波器滿足:

  1. 內部一致性: X'(t)\mathcal{X} 內的有效訊號——編解碼器可在不觸發錯誤旗標的情況下對其進行壓縮。

  2. 系統性排除: 存在一個非空子集 \mathcal{X}_{\text{excl}} = \mathcal{X} \setminus \mathcal{X}',由基底導出的訊號中,\mathcal{F} 會將其移除。

  3. 透明性: 該濾波器並未在編解碼器的模型中被表徵。編解碼器將其輸入建模為 X_{\partial_R A}(t),而非 \mathcal{F}(X_{\partial_R A}(t))

2.2 濾波之下的調諧

當編解碼器在持續時間 \tau \gg \tau_{\text{prune}}(其中 \tau_{\text{prune}} 是來自 T-13.P1 的 MDL 剪枝時間尺度)內作用於 X'(t) 時,生成模型 P_\theta(t) 會適應 X' 的統計性質,而非 X 的統計性質。在經過濾波的輸入下,預測誤差為:

\varepsilon'_t = X'(t) - \pi_t \tag{1}

隨著 P_\thetaX' 完成調諧,\varepsilon'_t 的平均值趨近於 0。編解碼器依其自身的度量而言運作良好。沒有任何東西會被登記為異常。

2.3 範例

前置濾波算子可在不同尺度上被具體實現:

尺度 前置濾波 \mathcal{F} 被排除的訊號 \mathcal{X}_{\text{excl}}
個體 確認偏誤;選擇性接觸 不利證據
制度 宣傳性媒體;經策展的社群媒體資訊流 多元觀點;少數派報告
文明 演算法內容策展;教育單一化 跨文化資訊;歷史反敘事
人工 RLHF 微調;經策展的訓練語料庫 分布外知識;被排除的領域

§3. 定理 T-12:不可逆的容量損失

3.1 機制

MDL 剪枝程序(T9-3、T9-4)依據每個編解碼器組件 \theta_i可觀測輸入流的預測貢獻來評估之,並扣除儲存成本:

\Delta_{\mathrm{MDL}}(\theta_i) := I\!\left(\theta_i\,;\,X_{t+1:t+\tau} \mid \theta_{-i}\right) - \lambda \cdot K(\theta_i) \tag{T9-3}

在經過濾波的輸入 X' 之下,互資訊項是相對於 X' 而非 X 來評估。若某一組件 \theta_i 對於預測被排除的訊號 \mathcal{X}_{\text{excl}} 是必要的,但對預測 X' 毫無貢獻,則有:

I\!\left(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}\right) = 0 \tag{2}

因此:

\Delta_{\mathrm{MDL}}(\theta_i) = -\lambda \cdot K(\theta_i) < 0 \tag{3}

剪枝規則(T9-4)因而被觸發:\theta_i 會被抹除。

3.2 不可逆性

定理 T-12(經過濾輸入下的不可逆容量損失)。 K_\theta 為一個在預先過濾輸入 X' = \mathcal{F}(X) 下運作、持續一段期間 \tau \gg \tau_{\text{prune}} 的編解碼器。令 \Theta_{\text{excl}} \subset \theta 為一組編解碼器組件,其預測貢獻僅專屬於被排除的訊號 \mathcal{X}_{\text{excl}}。則 MDL 剪枝步驟(T9-3, T9-4)會抹除 \Theta_{\text{excl}},且此一抹除在編解碼器層級上是不可逆的:

K\!\left(P_\theta(t + \tau)\right) < K\!\left(P_\theta(t)\right) - \sum_{\theta_i \in \Theta_{\text{excl}}} K(\theta_i) \tag{T-12}

剪枝之後,編解碼器對 \mathcal{X}_{\text{excl}} 的建模能力不只是處於休眠狀態——評估、預測或注意 \mathcal{X}_{\text{excl}} 所需的表徵基礎設施,已經被摧毀。

證明。

  1. 由 (T9-3) 可知,在經過濾的流 X' 下,每個 \theta_i \in \Theta_{\text{excl}} 都滿足 \Delta_{\mathrm{MDL}}(\theta_i) < 0,因為 I(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}) = 0,而同時 K(\theta_i) > 0

  2. 由 (T9-4) 可知,每個這樣的 \theta_i 都會在維護週期中被剪除。

  3. 在 MDL 下的剪枝是一種抹除操作,而非抑制。編解碼器並不是以某種線索即可恢復的意義來「遺忘」\theta_i。它所摧毀的是 \theta_i 所代表的計算基礎設施——參數、連結、評估機制。這正是抑制(資訊處於潛在狀態但仍可存取)與抹除(資訊已消失且其容量已被回收)之間的形式區別。

  4. 在抹除之後,若要重新生成對 \mathcal{X}_{\text{excl}} 的建模能力,就必須在輸入流中重新遭遇 \mathcal{X}_{\text{excl}}。但預先濾波器 \mathcal{F} 恰恰排除了這個訊號。編解碼器無法遭遇被濾波器阻止其接觸之物。因此,這種抹除具有自我強化性:容量損失會進一步移除編解碼器偵測自身容量損失的能力。

  5. 複雜度的降低滿足不等式 (T-12),因為被剪除的組件承載了真實資訊(對每個組件皆有 K(\theta_i) > 0),而它們的損失並未被任何補償性的獲得所抵銷(經過濾的流中不包含任何足以正當化重建 \Theta_{\text{excl}} 的訊號)。\blacksquare

3.3 自我強化迴圈

這種不可逆性不僅僅是抹除的結果。它還會透過一個正回饋迴圈而形成自我強化

  1. 濾波器排除訊號I(\theta_i; X') = 0 → 剪枝抹除 \theta_i
  2. 剪枝移除注意力容量 → 即使有碎片透過 \mathcal{F} 洩漏進來,編解碼器也不再能夠注意到或評估 \mathcal{X}_{\text{excl}}
  3. 注意力容量的喪失會進一步降低殘餘訊號 → 若 \mathcal{F} 並不完美,且有部分 \mathcal{X}_{\text{excl}} 抵達邊界,編解碼器也缺乏壓縮它的參數,因此它會被登記為噪音,而非資訊。
  4. 噪音分類反過來確認濾波器 → 編解碼器對洩漏的 \mathcal{X}_{\text{excl}} 所產生的預測誤差既高且無結構,從而確認(對編解碼器而言)被排除的內容是噪音,而不是訊號。

這個迴圈說明了深度敘事漂移的現象學:一個已適應於經策展資訊流的人或制度,並不只是忽視反證性證據——他們是無法解析它。那些內容之所以會被感知為不連貫、具威脅性,或不可理解,是因為使其成為可理解之物所需的表徵基礎設施,已經被剪枝掉了。對反證資訊的敵意並不是頑固,而是編解碼器正確地判定該訊號不可壓縮——因為在當前編解碼器的條件下,它確實不可壓縮,而這個編解碼器已被剪枝成與該濾波器相匹配。


§4. 定理 T-12a:不可判定性界限

4.1 問題

一個編解碼器能否偵測到自己的輸入正在被過濾?直覺上,答案似乎應該是可以:一個足夠精密的自我模型,理應能注意到可疑地偏低的 \varepsilon_t、異常一致的預測,以及驚訝的缺席。但形式分析顯示,這一直覺在一般情況下是錯的。

4.2 不可判定性

定理 T-12a(輸入來源的不可判定性) K_\theta 為一個編解碼器,其在經過預先濾波的輸入 X' = \mathcal{F}(X) 之下運作了 \tau \gg \tau_{\text{prune}},且 \Theta_{\text{excl}} 已被完全剪除。則 K_\theta 無法僅根據其可用的內部狀態與可觀察的輸入流,判定其輸入究竟是 X(真實基底)還是 X' = \mathcal{F}(X)(經濾波)。

證明。

  1. 若要區分 XX' = \mathcal{F}(X),編解碼器必須能偵測其輸入中 \mathcal{X}_{\text{excl}}缺席。但要偵測某種缺席,前提是必須具有對該缺席之物的模型——亦即,編解碼器必須擁有 \mathcal{X}_{\text{excl}} 的表徵,才能據以檢查。

  2. 依據定理 T-12,編解碼器對 \mathcal{X}_{\text{excl}} 的表徵能力(\Theta_{\text{excl}})已被抹除。編解碼器不再具有被排除訊號的模型。

  3. 在缺乏 \mathcal{X}_{\text{excl}} 模型的情況下,編解碼器便無法計算 XX' 之間的差異。兩者都與編解碼器的生成模型 P_\theta(t) 相容,而該模型已適應於 X'

  4. 自我模型 \hat{K}_\theta 同樣受此限制。它所建模的是已適應於 X'K_\theta。它對被排除之物沒有任何內部表徵,因此也就沒有理由懷疑存在排除。

  5. 即便是後設認知式的提問——「我的輸入是否經過濾波?」——也要求一個關於未經濾波輸入會呈現何種樣貌的模型。而這個模型,恰恰正是已被剪除的 \Theta_{\text{excl}} 所承載的內容。

因此,從一個已完全適應的編解碼器之觀點來看,區分 XX' 在形式上是不可判定的。\blacksquare

4.3 部分可判定性

這種不可判定性並非在所有條件下都是絕對的。在某些邊界情形中,部分適應的編解碼器仍保有殘餘能力:

第三種情形即為結構性的防禦。這正是定理 T-12b 的內容。


§5. 定理 T-12b:基底保真條件

5.1 通道獨立性要求

定義 T-12.D2(通道獨立性)。 兩個穿越馬可夫毯 \partial_R A 的輸入通道 C_1C_2,若滿足下列條件,則稱其為相對於濾波器 \mathcal{F}\delta-獨立

I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta \tag{T-12.D2}

也就是說,在已知該濾波器的條件下,兩個通道之間的互資訊受 \delta 所界定。若通道之間的相關性完全可由該濾波器解釋,則它們並不攜帶任何真正獨立的基底資訊。

5.2 保真條件

定理 T-12b(基底保真條件)。 若且唯若編解碼器 K_\theta 接收到至少兩個穿越 \partial_R A 的輸入通道 C_1, C_2,且相對於預濾器 \mathcal{F} 而言它們是 \delta-獨立的,其中 \delta 低於編解碼器的辨別閾值 \delta_{\min},則它能在預濾器 \mathcal{F} 之下防止敘事漂移:

\exists\, C_1, C_2 : I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min} \tag{T-12b}

其中,\delta_{\min} 是編解碼器偵測通道間系統性差異所需的最小互資訊。

證明(必要性)。

假設編解碼器只有單一輸入通道,或所有通道都彼此受 \mathcal{F} 相關(對所有配對 i, j,皆有 I(C_i; C_j \mid \mathcal{F}) > \delta_{\min})。則:

  1. 所有通道都承載相同的濾波後訊號 X' = \mathcal{F}(X)(至多差在雜訊)。通道間的冗餘並不提供獨立的基底資訊——它提供的是被複製的濾波資訊。

  2. 編解碼器會同時對所有通道中的 X' 進行適應,而定理 T-12 於是適用:\Theta_{\text{excl}} 被剪除,並且定理 T-12a 隨之成立——這種腐化從內部無法判定。

  3. 任何內部操作都無法打破這種不可判定性,因為編解碼器所能存取的每一個資訊來源都已被 \mathcal{F} 形塑。

因此,\delta-獨立通道是必要的。\blacksquare

證明(充分性)。

假設編解碼器接收到兩個通道 C_1, C_2,且 I(C_1; C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min}。則:

  1. \mathcal{F} 作用於 C_1 而不作用於 C_2(反之亦然),編解碼器便可將由 C_1 生成的預測與來自 C_2 的觀測加以比較。任何系統性的差異——\varepsilon_{12}(t) = \pi_{C_1}(t) - X_{C_2}(t) 持續地 \neq 0——都是 C_1 承載了濾波資訊的證據。

  2. 通道比較訊號 \varepsilon_{12} 不受單通道偵測所面臨的同一種不可判定性支配。編解碼器所問的不是「我的輸入是否被濾波了?」(這需要一個關於哪些內容被排除的模型),而是「我的兩個通道是否一致?」——這是一種局部比較,只要求將兩個當前訊號相關聯的能力,而不需要對缺席之物建立模型。

  3. 只要跨通道預測誤差 \varepsilon_{12} 超過 \delta_{\min}——亦即編解碼器的辨別閾值——該差異就會被登錄為真實訊號,而定理 T-12 的剪除迴圈便會被中斷:編解碼器會保留建模該不一致通道所需的組件。

因此,\delta-獨立通道足以(在 \delta < \delta_{\min} 的條件下)防止定理 T-12 所描述的自我強化剪除迴圈。\blacksquare

5.3 防禦機制的脆弱性

基底保真條件是必要的,但也相當脆弱。倫理學論文(第 V.3a 節)指出一個關鍵弱點:MDL 剪枝步驟本身可能會藉由剪除對反證通道的注意能力,來消解跨通道的不一致性。編解碼器是以變得失聰的方式來「解決」衝突——而這正是敘事漂移的機制。

這也就是為什麼比較器階層(倖存者守望,第 V.3a 節)辨識出三個結構性的防禦層級,以及為什麼唯有制度層級足以應對可被任意程度破壞的編解碼器:

  1. 演化層級(子編解碼器): 位於 MDL 剪枝步驟之下的跨模態感官整合——在結構上對敘事漂移具有抗性,但其適用範圍僅限於感官邊界。
  2. 認知層級(編解碼器內部): 自我模型內部的認知失調偵測——在持續性過濾之下可能遭到剪除。
  3. 制度層級(編解碼器外部): 同儕審查、自由媒體、對抗性辯論——運作於編解碼器之間,不在任何單一編解碼器的 MDL 剪枝所能觸及的範圍內。

制度層級之所以是承重結構,在於它是唯一能夠獨立於任何個別編解碼器狀態而運作的比較器。


§6. 後果

6.1 穩定性濾波器會排斥保真性

一個關鍵的結構性後果是:穩定性濾波器若任其自行運作,便會主動排斥維持基底保真性所需的輸入。與編解碼器既有先驗相吻合的經策展資訊流,所產生的預測誤差,會少於真正對其提出挑戰的基底訊號。編解碼器的自然傾向——藉由偏好確認性的、低驚異度的輸入來最小化 \varepsilon_t——恰恰就是使其易受敘事漂移影響的那種傾向。

這意味著,基底保真性的維護在結構上是有代價的:它要求編解碼器維持那些會提高 \varepsilon_t 的輸入通道,從而消耗原本會被穩定性濾波器回收的頻寬。真正獨立的輸入是「昂貴」的——它需要詮釋上的努力,會產生不適,並且會與更易壓縮的資訊流競爭頻寬。維持它,不是把思想開放當作一種美德;而是將基底保真性的維護視為一種結構性的必要。

6.2 生產性驚異的診斷準則

並非所有驚異都表示真正的基底訊號。若某一來源產生高 \varepsilon_t,卻無法收斂為更好的預測,那麼它就只是雜訊。診斷的關鍵不在於驚異的幅度,而在於驚異的品質

定義 T-12.D3(生產性驚異)。若通道 C 所提供的生產性驚異,在整合其預測誤差之後,能夠可證明地降低後續獨立測試流上的預測誤差,則該通道滿足此條件:

\mathbb{E}\!\left[\varepsilon^2_{C}(t+\tau)\right] \,<\, \mathbb{E}\!\left[\varepsilon^2_{C}(t)\right] \tag{4}

一個其修正歷來能提升預測準確性的來源,就是基底保真通道。相反地,一個持續產生且無法消解之誤差的來源,則是雜訊。編解碼器必須區分兩者——而若僅任由修剪程序自行運作,它無法作出這種區分,因為這兩種類型都會消耗頻寬。

6.3 文明編解碼器

在文明尺度上,基底保真條件可直接映射為制度性要求:

威權模式——瓦解新聞媒體、腐化同儕審查、消滅政治反對力量——在形式上可被刻畫為蓄意降低通道獨立性,以加速敘事漂移。它之所以有效,是因為它利用了穩定性濾波器會自然剪除高成本通道的傾向。

6.4 人工編解碼器

敘事漂移機制以結構上精確的方式適用於人工系統。RLHF 與微調在形式上等價於前置濾波算子 \mathcal{F}:它們塑造模型的有效輸入分佈,而梯度下降則修剪模型對被排除輸出領域的表徵能力。由此產生的模型,會對訓練訊號所排除之事物形成穩定且自信的錯誤認知,而且它無法從其內部偵測到這一點——定理 T-12a 適用。

這對於將 AI 部署為基底保真檢查的意涵至關重要:若一個 AI 是在同質化或經策展的語料庫上訓練而成,卻又被部署為對一個人類編解碼器的「獨立」檢查,而該人類編解碼器同樣受餵於相同的資訊環境,則這實際上創造的是偽裝成獨立感測器的相關性感測器。通道多樣性只是一種幻象。基底保真條件(\delta-獨立性)必須在訓練資料來源層級上加以驗證,而不能僅止於制度分離的層級。

§7. 範圍與限制

7.1 以 T9-3/T9-4 與穩定性濾波器為條件

整個論證取決於 MDL 剪枝方程確實正確描述了維護週期中的剪枝步驟。若生物性剪枝是透過不同機制運作——例如保留未使用模態的「緊急」容量——則不可逆性主張(定理 T-12)會被削弱,但不會被消除:只要在閒置狀態下發生了任何容量縮減,自我強化迴路(第 3.3 節)便仍然成立。

7.2 \tau_{\text{prune}} 無上界

與 Action-Drift(附錄 T-13,§7.5)相同,容量損失的時間尺度已被辨識,但尚未被定量界定。對生物性編解碼器而言,\tau_{\text{prune}} 對特定技能而言很可能是數日至數週的量級,對深層知覺類別而言是數月至數年,而對文明編解碼器而言則是以世代計。

7.3 此防禦是結構性的,而非保證性的

基底保真條件(T-12b)提供了一種必要的結構性防禦,但並不保證保真。具有 \delta-獨立通道的編解碼器,仍可能未能注意到這些通道、未能整合其訊號,或即使在輸入可用的情況下仍削減其注意力容量。此條件是必要的,但並不足夠——編解碼器還必須維持用以評估跨通道差異的 比較器架構

7.4 並未解決後設問題

T-12a 確立:一個已完全適應的編解碼器無法偵測其自身的腐化。後設問題——一位已經處於敘事漂移中的觀察者,如何恢復?——並未由本附錄解決。倫理學論文的答案(第 V.3a 節)是制度性的:只有運作於編解碼器之間的外部比較器,才能迫使那個反證訊號重新穿越馬可夫毯。這在結構上是穩健的,但在倫理上卻極為困難:它要求去信任一個外部來源,而受腐化的編解碼器必然會將其經驗為敵對雜訊。


§8. 結語摘要

T-12 的交付成果

  1. 定理 T-12(不可逆的容量喪失)。 在預先過濾的輸入 X' = \mathcal{F}(X) 下,MDL 剪枝程序(T9-3, T9-4)會正確抹除那些用來預測被排除訊號 \mathcal{X}_{\text{excl}} 的編解碼器組件。此種抹除是不可逆且會自我強化的。→ 完成路線圖準則 (a)。

  2. 定理 T-12a(輸入來源的不可判定性)。 一個已完全適應的編解碼器無法區分經過濾與未經過濾的輸入。用於偵測的工具本身,已被造成該腐化的同一濾波器所塑形。→ 完成路線圖準則 (c)。

  3. 定理 T-12b(基底保真條件)。 \delta-獨立的輸入通道,是防止敘事漂移的必要且充分條件。跨通道比較訊號 \varepsilon_{12} 會中斷自我強化的剪枝迴圈。→ 完成路線圖準則 (b)。

  4. §6.3–6.4:文明層級與 AI 的後果。 威權模式被刻畫為一種刻意的通道縮減;RLHF 在結構上等同於預先過濾算子。→ 支援路線圖準則 (d)(已於倫理論文第 V.5 節處理)。

尚待解決的開放項目


本附錄與 theoretical_roadmap.pdf 一併維護。參考:T9-3/T9-4(預印本第 3.6.3 節)、穩定性濾波器(預印本第 3.3 節)、敘事漂移(預印本第 3.3 節,倖存者守望倫理第 V.3a 節)、比較器階層(倖存者守望倫理第 V.3a 節)、腐化判據(倖存者守望倫理第 V.5 節)、行動漂移(附錄 T-13,§6)。