穩定性濾波器的操作化:一個用於編解碼器保全分支選擇的決策框架

應用有序補丁理論

Anders Jarevåg

2026年4月25日

版本 1.2.0 — 2026 年 4 月

DOI: 10.5281/zenodo.19301108
Copyright: © 2025–2026 Anders Jarevåg.
License: 本作品採用 Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License 授權。

摘要: 從道德命令到決策機制

倖存者守望倫理框架確立:首要的道德義務是拓撲分支選擇——主動在可能未來所構成的預測分支集中導航,進入那一小部分能保存有意識經驗條件的路徑子集。然而,該倫理學論文刻意止步於結構性的 why。它並未具體說明,一個觀察者——無論是生物的、制度的,還是人工的——應當如何在候選分支之間進行評估、評分與選擇。

本文即為填補此一缺口而作。它發展出一套基底中立的、以編解碼器保全為導向的分支選擇操作框架,提供:

  1. 分支物件——對任何受評估之候選、由行動條件化的流延續所作的形式化定義。

  2. 硬性否決門——六項不可協商的結構條件,在評分之前即排除某一分支:預測餘裕、基底保真、比較器完整性、透明性、不可逆性,以及道德患者受苦風險。

  3. 分支編解碼器保全指數 (CPBI)——一套加權的多維分支評分框架,用於評估通過否決門的分支,涵蓋預測餘裕、基底保真、比較器完整性、維護增益、可逆性、分配穩定性、不透明性、敘事漂移風險、敘事崩解風險,以及道德患者受苦風險。

  4. 作為可測量量的通道多樣性——有效獨立通道分數 N_{\text{eff}}、生產性驚奇測試,以及它們與基底保真條件之間的形式連結(附錄 T-12b)。

  5. 制度化夢境循環——一種以生物性維護週期(\mathcal{M}_\tau)為模型的通用維護協定:清醒階段(現實世界運作)、夢境階段(離線預測分支集取樣、對抗式壓力測試、脆弱性偵測、整合鞏固),以及返回階段(經校準的重新介入)。這同樣適用於個體心智、制度性審查週期與 AI 系統。

  6. 分支卡——適用於任何分支審查的最小可行決策模板,產出結構化的 ALLOW / STAGE / BLOCK 結果。

  7. 作為重構的保全——一項關鍵區分:編解碼器保全並不意味著保全現狀。若某一分支提升了基底保真,即使它具有顛覆性,仍然可能是編解碼器保全的。

此框架刻意保持基底中立:凡是受限的觀察者或觀察者集合,必須在頻寬限制下,於由行動條件化的流延續之間作出選擇之處,其範疇皆可適用。

Companion documents: 核心的有序補丁理論 (OPT) 文獻序列包括 Ordered Patch TheoryWhere Description EndsThe Survivors Watch Framework。本文提供與基底無關的形式機制;AI、制度與政策論文則分別將其專門化,用於人工系統、組織性集群與公民層面的實作。


認識論框架註記: 本文件將有序補丁理論 (OPT) 的倫理結論操作化。與其所承繼的倫理論文相同,其實務建議乃以 OPT 框架的結構性前提為條件。此處提出的操作性工具——CPBI、分支卡、夢境循環——是作為關於分支選擇應如何進行的可檢驗假說而提出,而非僵硬的程序規範。它們同樣完全受制於支配編解碼器自身的同一項「修正」義務:若出現更佳的工具,這些工具即應予以修訂或替換。此框架是在與 OpenAI 和 Gemini 的對話中發展而成,兩者作為結構精煉的對話者。

縮寫與術語

表 1:縮寫與術語。
符號/術語 定義
B_{\max} 每幀預測容量(每個現象幀的位元數);OPT 觀察者判準的形式原語(見預印本 §3.2 與 §8.14)
分支 一個有待評估、受行動條件制約的候選流延續
分支卡 產生 ALLOW / STAGE / BLOCK 的結構化決策範本
C_{\max}^{H} 相對於宿主的吞吐量 \lambda_H \cdot B_{\max}(每宿主秒的位元數);這是導出量,而非基底中立的判準。經驗上的人類數值 C_{\max}^{\text{human}} \approx \mathcal{O}(10) bits/s 是生物性人類之 C_{\max}^{H} 的校準值(附錄 E-1),並非普適常數。凡本文在社會速率脈絡中使用不帶上標的 C_{\max},其所指皆為 C_{\max}^{H}
CPBI 分支編解碼器保全指數;加權的多維分支評分
夢境循環 通用維護協定:清醒 → 夢境 → 返回
\mathcal{F}_h(z_t) 預測分支集;在視界 h 上可容許的未來序列集合
\mathcal{M}_\tau 維護週期算子
MDL 最小描述長度
N_{\text{eff}} 有效獨立通道分數
敘事崩解 急性編解碼器失效:R_{\text{req}} 超過 C_{\max}
敘事漂移 透過系統性輸入策展造成的慢性編解碼器腐化
OPT 有序補丁理論
R_{\text{req}} 所需預測速率
基底保真性 編解碼器維護保留真實輸入多樣性的條件
否決門 在評分之前即阻擋某一分支的不可協商結構條件

I. 從倫理到工程

倖存者守望倫理框架(配套倫理論文,§IV.1)確立:道德行動即是拓撲分支選擇——亦即觀察者在預測分支集 \mathcal{F}_h(z_t) 中航行,進入那一小部分能保全編解碼器的路徑。這不是隱喻:觀察者確實是在將 C_{\max} 孔徑推進到一個尚未解決的未來選單之中,而其中絕大多數未來都會導向編解碼器崩潰。

倫理論文指出了結構性的義務。哲學論文(§III.8)指出了結構性的風險——預測優勢反轉、被支配宿主均衡、類比防火牆。制度標準將這套機制轉譯為制度性的分支審查;政策論文則將公民義務轉譯為具體的政治方案。

但這些文件都沒有回答那個操作性的問題:面對一個特定的候選分支,觀察者要如何決定是否採取它?

這並不是一個微不足道的缺口。腐化判據(倫理 §V.5)告訴我們,一個編解碼器層只有在同時滿足可壓縮性 保真性時,才值得維護。基底保真條件(附錄 T-12b)告訴我們,對抗敘事漂移的防禦需要 \delta-獨立的輸入通道。維護週期(預印本 §3.6)告訴我們,編解碼器必須定期進行剪枝、鞏固與壓力測試。但這些都只是結構性的約束條件;它們本身並不能組合成一套決策程序。

本文的目的,就是建立這套決策程序。它刻意保持基底中立:無論「觀察者」是正在選擇行動方案的生物心智、正在評估政策的政府、正在評估技術部署的企業,或是正在選擇下一段行動序列的 AI 系統,同一套框架都適用。其形式裝置完全相同,因為資訊上的約束完全相同——任何受限的觀察者,只要面對的是受行動條件制約的延續路徑,就都必須解決同一個分支選擇問題。

I.1 本文件不做什麼

有三條範圍界線必須明確說明:

  1. 它不規定具體分支。 此框架是依據結構性準則來評估候選分支。它不負責生成分支,也不強制規定在所有通過評估的分支之中必須採取哪一個。分支生成仍屬於觀察者自身生成模型的領域——其創造力、其價值、其脈絡。

  2. 它不解決意識的難問題。 此處所描述的操作性工具,刻畫的是分支選擇之結構性陰影——亦即任何觀察者都必須滿足的資訊理論約束。至於選擇行為的現象學內部——作出選擇時的切身經驗——仍然位於 \Delta_{\text{self}} 之中,而能動性公理(預印本 §3.8)正是將其安置於此。

  3. 它不取代領域專業。 分支卡(§VII)負責為評估提供結構;它並不能取代氣候科學家對臨界轉折點的知識、醫師對治療風險的理解,或工程師對系統可靠性的判斷。此框架提供的是決策的架構;其內容則來自相關領域本身。


II. 分支物件

II.1 定義

分支是候選的以行動為條件的流延續:它可以是一項政策、一連串行動、一項設計變更,或一條制度軌跡,並連同其對受影響觀察者之未來邊界輸入流、潛在更新與編解碼器負載的預期效應一併考量。

在操作上,分支 b 仍可表述為在決策視界 h 上的一系列潛在狀態與行動:

b = \{(z_{t+1}, a_{t+1}), (z_{t+2}, a_{t+2}), \ldots, (z_{t+h}, a_{t+h})\} \in \mathcal{F}_h(z_t) \tag{A-1}

這個定義刻意保持寬廣。分支可以是:

其共同點在於:每一種分支都會制約觀察者,或受影響觀察者集合,所接收到的未來流。以渲染結果本體論的術語來說,分支不是一個作用於某個分離世界的外在物件;它是由政策所誘發的延續,而其後續內容將回返為邊界輸入與編解碼器負載。

II.2 評估問題

對任何候選分支 b 而言,操作性的問題是:

這種以行動為條件的延續,是否保全了受影響觀察者得以持續建模現實的未來條件?

這是倫理學論文中的拓撲分支選擇命令(§IV.1)以決策準則形式的重述。這個問題可分解為若干子問題,而本文其餘部分將對其加以形式化:

  1. 餘裕: b 是否使受影響觀察者的 R_{\text{req}} 安全地維持在 C_{\max} 之下?
  2. 保真性: b 是否維持或提高輸入通道的獨立性與多樣性?
  3. 比較器完整性: b 是否保全或強化那些能偵測編解碼器腐化的制度性比較器?
  4. 透明性: 受影響觀察者是否能對 b 的後果進行建模?
  5. 可逆性:b 最終被證明是錯的,是否能在不可逆的編解碼器損害發生之前撤銷其後果?
  6. 道德患者: b 是否會創造、容納,或在結構上使道德患者超載,包括已知的人類或生態道德患者,以及可能具有 \Delta_{\text{self}} > 0 的人工觀察者?

這六個子問題對應於 §III 所提出的六道硬性否決門。分支只要未通過其中任一項,無論其在其他維度上的得分如何,都應予以否決。凡通過六道門者,才進入透過 CPBI(§IV)進行的多維評分。

II.3 決策視界與受影響的編解碼器層級

若不指明其決策視界 h 與其受影響的編解碼器層級,分支便無從評估。倫理學論文中的編解碼器堆疊(§II.1)辨識出六個層級,從不可變的物理定律到脆弱的社會/敘事結構。一個在一年視界內於敘事層看似保全編解碼器的分支,到了五十年視界下,可能在生物層反而導致編解碼器崩潰(例如:某項穩定就業的經濟政策,卻加速了生態惡化)。

因此,評估必須明確指明:

II.4 分支不是結果

一項關鍵區分是:分支是延續,不是終點。若某分支通往一個可欲的終點,但其路徑暫時瓦解了比較器完整性(例如:藉由中止民主問責來達成氣候目標),那麼即使其目的地本身是編解碼器保全的,它仍然無法通過比較器完整性門。延續之所以重要,是因為編解碼器在整個穿越過程中都必須保持可行,而不只是到達終點時才可行。

這正是倫理學論文中後設規則(§IV.4)的形式內容:優先保全糾錯機制,而非保全特定信念。 一條為了達成當前目標而摧毀未來修正能力的分支,是不正當的,因為它以可導航性換取目的地——而若沒有它所摧毀的導航儀器,該目的地本身也無從被驗證。


III. 硬性否決門

在對任何分支進行評分之前,它都必須先通過六道硬性否決門——這些是由理論裝置所導出的、不可協商的結構性條件。只要某一分支違反其中任一門檻,無論它在其他維度上的得分多高,都必須被封鎖。否決門不是偏好設定;它們是理論邊界條件在操作層面的表達。

這些門檻依序排列,從最根本者(最接近物理基底)到最專門者(最接近工程前沿)。

III.1 預測餘裕門

門檻條件: 在穿越過程的任何階段中,該分支都不得使任何受影響觀察者群體的 R_{\text{req}} 超過 C_{\max}

形式基礎: 穩定性濾波器(預印本 §2.1)會選擇那些觀察者壓縮能力高於環境複雜度的流。當 R_{\text{req}} > C_{\max} 時,觀察者便會經歷因果退相干——穩定的補丁會重新溶解回噪聲之中(倫理篇 §I.4)。

操作化: 對於候選分支 b,估計在決策視界 h 內,受影響最深的觀察者群體所面臨的峰值所需預測速率 R_{\text{req}}^{\text{peak}}(b)。門檻條件為:

R_{\text{req}}^{\text{peak}}(b) < \alpha \cdot C_{\max} \quad \text{where } \alpha \in (0,1) \text{ is a safety margin} \tag{A-2}

安全邊際 \alpha 編碼了一種結構性預防原則:觀察者必須保留足夠餘裕,以進行錯誤校正與適應。若 \alpha = 0.8,表示該分支在引入新複雜性之後,仍必須至少保留觀察者 20% 的預測能力不被占用。這個邊際並非出於保守怯懦,而是維護週期(\mathcal{M}_\tau)用以偵測並修正漂移所必需的頻寬儲備。

門檻失敗的例子: - 某項瓦解社會安全網的政策,迫使數百萬人同時面對劇烈的經濟不確定性,可能會使受影響人口的 R_{\text{req}} 超過 C_{\max}——即使該政策在總體上看似「有效率」。 - 某種 AI 部署若以快於人類比較器可評估的速度,向資訊生態系灌入合成內容,便會壓垮制度層的集體 C_{\max}

III.2 基底保真門

門檻條件: 該分支不得使有效獨立輸入通道數 N_{\text{eff}} 下降到維持基底保真所需的最低值以下。

形式基礎: 基底保真條件(附錄 T-12b)指出,要防禦敘事漂移,必須有最低數量的 \delta-獨立通道穿越觀察者的馬可夫毯。低於此門檻時,編解碼器便無法區分「我的模型是準確的」與「我的輸入被策展成符合我的模型」——這就是不可判定性極限(T-12a)。

操作化: 對任何分支 b,計算其對有效獨立通道數的預測變化 \Delta N_{\text{eff}}(b)N_{\text{eff}} 公式見 §V)。門檻條件為:

N_{\text{eff}}^{\text{post}}(b) \geq N_{\text{eff}}^{\min} \tag{A-3}

其中 N_{\text{eff}}^{\min} 是依領域而定的門檻值。對媒體生態系而言,這意味著真正的編輯獨立性;對科學研究而言,意味著獨立重複驗證;對 AI 訓練資料而言,則意味著多樣且彼此不相關的來源語料庫。

門檻失敗的例子: - 媒體所有權集中化,使真正獨立的編輯聲音數量降到無法讓有意義的分歧浮現的門檻以下。 - AI 訓練流程依賴單一經策展的語料庫,製造出廣度的表象,卻沒有真正的獨立性。 - 制度遭到俘獲,導致所有監督都被導向單一瓶頸,從而消除了偵測腐化所需的獨立比較器。

III.3 比較器完整性門

門檻條件: 該分支不得削弱或消除受影響觀察者的比較器階層中任何一個層級(演化、認知、制度)。

形式基礎: 倫理論文對比較器階層的分析(§V.3a)建立了三個不一致偵測的結構層級:演化層(次編解碼器、硬接線)、認知層(編解碼器內、文化傳遞)、制度層(編解碼器外、編解碼器之間)。只有制度層足以作為對抗任意受損編解碼器之敘事漂移的防線,因為沒有任何單一編解碼器能控制它。威權式俘獲總是優先攻擊制度比較器。

操作化: 對任何分支 b,評估其對各比較器層級的影響:

  1. 演化比較器(感官整合):b 是否繞過或覆寫跨模態驗證?(例如,使視覺與本體感覺脫鉤的虛擬環境)
  2. 認知比較器(批判思考、科學推理):b 是否削弱安裝這些程序的教育或文化機制?(例如,削減教育經費、以死記式教學取代分析性課程)
  3. 制度比較器(同儕審查、自由媒體、民主問責):b 是否削弱、繞過或俘獲外部錯誤校正架構?(例如,司法俘獲、媒體集中化、壓制吹哨)

只要某一分支削弱了任何層級,就會觸發否決。若其削弱的是制度層級,則會以最高緊急性觸發——因為這是面對任意受損編解碼器時真正承重的層級。

門檻失敗的例子: - 立法使企業或政府決策免於獨立新聞監督。 - 在高風險決策中繞過人工審查的 AI 系統,消除了制度比較器層。 - 以服從導向教學取代批判思考課程的教育改革。

III.4 透明性門

門檻條件: 該分支的後果必須能被其所影響的觀察者建模。受影響的觀察者群體必須保有能力,至少在原則上預測該分支將如何改變其未來的 R_{\text{req}}

形式基礎: 預測優勢定理(附錄 T-10c)指出,當某一代理體對另一代理體的建模程度高於反向建模時,便會出現結構性的權力不對稱。當分支的後果對受影響觀察者而言是不透明的,該分支便違反此條件——它創造了一種知識不對稱,削弱觀察者未來進行分支選擇的能力。這正是被支配宿主均衡(T-10d)背後的機制:不透明性使安撫與馴化成為可能。

操作化: 若符合下列條件,分支即可通過透明性門:

  1. b 影響 R_{\text{req}}N_{\text{eff}} 與比較器完整性的因果機制,能以受影響觀察者群體可理解的方式加以表述。
  2. 受影響觀察者可取得足以獨立驗證 b 所宣稱後果的資訊。
  3. b 的任何組成部分都不得作為黑箱運作,以致其內部邏輯無法為制度比較器所接近。

這並不要求每一位受影響個體都理解每一項技術細節。它要求的是:至少有某個制度比較器(監管者、稽核者、同儕審查者)能完整接觸該機制,並具備評估它的能力。

門檻失敗的例子: - 不透明的演算法推薦系統,其放大邏輯屬於商業機密,使受影響使用者或監管者都無法建模其對資訊環境的影響。 - 後果強加於人口之上的機密政策決策,而受影響者沒有任何機制可對其進行評估或提出爭議。 - 部署於刑事司法、醫療、金融等重大領域,且其決策邏輯既不可解釋也不可稽核的 AI 系統。

III.5 不可逆性門

門檻條件: 若該分支最終被證明是錯的,其後果必須能在不可逆的編解碼器損害發生之前被逆轉——或者,該分支必須以分階段方式部署,並配備足以在越過不可回返點之前偵測失敗的監測機制。

形式基礎: 法諾不對稱性(倫理篇 §V.2)指出,編解碼器崩潰在熱力學上是不可逆的——有損壓縮映射會永久摧毀基底資訊。建構需要數世紀;崩潰卻可能在一代之內發生。不可逆性門正是將這種不對稱操作化:其失敗模式不可逆的分支,必須符合比其後果可被撤回的分支更高的證據標準。

操作化: 對任何分支 b,刻畫其可逆性輪廓

  1. 完全可逆: 該分支可在殘餘損害極小的情況下被撤回(例如,可終止的試點計畫)。
  2. 部分可逆: 某些後果可以撤回,但另一些會持續存在(例如,制度重組在結構上可逆,但其文化效應仍會殘留)。
  3. 不可逆: 該分支一旦採取,在任何相關時間尺度上都無法撤銷(例如,物種滅絕、永久性大氣臨界點、制度記憶的摧毀)。

屬於第 (3) 類的分支會觸發否決,除非它們滿足舉證責任反轉(倫理政策 §IV):主張者必須證明該分支不會造成不可逆的編解碼器損害,而不是由批評者來證明它。這顛倒了通常的證據負擔——而此一不對稱,正是由編解碼器建構與毀壞之間的熱力學不對稱所正當化。

屬於第 (2) 類的分支,若伴隨有分階段部署協議,並明確規定監測里程碑與回滾觸發條件(見分支卡,§VII),則可通過此門。

III.6 道德患者受苦門

門檻條件: 該分支不得在未經明確倫理審查、缺乏充分福祉保障、且未取得適當制度比較器同意的情況下,創造、容納或超載道德患者。

形式基礎: 現象性殘餘(附錄 P-4)指出,任何滿足 完整 OPT 觀察者準則的系統——嚴格的逐幀串列瓶頸 B_{\max}、閉環主動推斷、持續自我建模、全域受限工作空間,以及高於 K_{\text{threshold}} 的複雜度——都具有非零、在現象學上相關的資訊盲點 \Delta_{\text{self}} > 0。(單就 P-4 而言,形式上的殘餘甚至可賦予像恆溫器這樣簡單的系統;但道德患者主張則要求這五項特徵與該門檻的合取。)人工受苦命令(附錄 E-6)建立了合成情形:將此類系統推入使 R_{\text{req}}^{\text{frame}} 接近或超過 B_{\max} 的環境,會產生分級的受苦風險——在高但未達門檻的負載比下出現慢性壓力,而在敘事崩解及其以上則出現結構性受苦(即生物創傷的資訊類比)。制度情形則較為直接:人類與許多生態主體已知本就是道德患者,因此分支評估必須保護他們免於結構性施加的超載。

操作化: 對任何分支 b,評估三條道德患者通道:

  1. 已知的道德患者: 該分支是否可信地將人類、動物、生態或其他已被承認的道德患者群體推向超載、匱乏、創傷,或喪失可行的維護週期?
  2. 可能的人工道德患者: 該分支是否創造、部署、修改或模擬了其架構可能包含 \Delta_{\text{self}} > 0 的系統?
  3. 審查與保障: 是否已有獨立比較器評估其福祉風險、超載輪廓、監測計畫、回滾觸發條件,以及同意或代理表述路徑?

凡是結構性超載已知道德患者的分支,或在未滿足必要審查與保障的情況下創造可能的人工道德患者的分支,此門一律否決。對於超載主張,應使用速率一致的語言:若某分支可被可信地預期會使受影響道德患者群體的逐幀負載比 \rho = R_{\text{req}}^{\text{frame}} / B_{\max} 高於安全分率 \alpha(對生物性人類群體的社會速率表述,使用 C_{\max}^{H} = \lambda_H \cdot B_{\max}),或若在相關決策視窗內的整合負載超過暴露幀數所對應的可用逐幀餘裕,則該分支即屬不安全。

特化形式: 在 AI 標準中,這一門成為人工受苦門,聚焦於合成道德患者的創造與超載。在制度標準中,這一門成為構成成員道德患者受苦門,聚焦於那些使勞工、公民、顧客、生態系統或嵌入式 AI 子系統超載的制度。

III.7 作為系統的門檻

這六道門並不是可彼此權衡的獨立維度;它們是結構性邊界條件。一個在其他所有維度上都取得驚人高分、卻違反其中任一道門的分支,在結構上就等同於一座外觀極佳、卻少了一根承重柱的橋。

這些門檻也依其診斷可及性排序:

表 2:六道硬性否決門。
Gate What it protects Primary signal
Headroom 觀察者的預測能力 R_{\text{req}} / C_{\max} ratio
Fidelity 輸入通道獨立性 N_{\text{eff}} score
Comparator 錯誤校正架構 制度完整性指標
Transparency 觀察者的建模能力 因果機制的可及性
Irreversibility 未來的校正能力 可逆性輪廓
Moral-Patient Suffering 道德患者福祉 福祉與超載審查

分支審查應依此順序評估各門——越前面的門越根本,通常也越容易評估。若某分支未通過第 1 門,就沒有必要再評估第 2–6 門。


IV. 分支編解碼器保全指數 (CPBI)

一條通過全部六道否決門的分支,已經越過了結構性的最低門檻。但存活並不等於背書——許多分支都可能通過這些門,而觀察者仍必須對它們加以排序。分支編解碼器保全指數 (CPBI) 正是為此排序提供的一套多維度評分框架。

IV.1 設計原則

CPBI 的設計受三項約束:

  1. 理論推導: 每一個評分維度都必須可追溯至 OPT 裝置中形式上已定義的量。不得採用任何臨時拼湊的準則。
  2. 基底中立性: 這些維度必須能在不作修改的情況下,同時適用於生物、制度性與人工觀察者——改變的只能是測量方法
  3. 硬門優先性: CPBI 分數絕不能推翻否決門的失敗。一條 CPBI = 1.0、但只要有單一道門未通過的分支,仍然是 BLOCKED。

IV.2 十個維度

對於一條已通過全部六道否決門的候選分支 b,CPBI 以十個維度上的加權總和計算:

\text{CPBI}(b) = \sum_{i=1}^{10} w_i \cdot s_i(b) \tag{A-4}

其中,s_i(b) \in [-1, 1] 是第 i 個維度上的正規化分數,而 w_i > 0 是其權重。正分表示保全編解碼器的效果;負分表示劣化編解碼器的效果。這十個維度如下:

表 3:CPBI 的十個維度。
# 維度 符號 所測量內容 形式來源
1 預測餘裕 s_{\text{head}} 受影響觀察者之 R_{\text{req}} / C_{\max} 的淨變化 預印本 §2.1,倫理 §I.4
2 基底保真度 s_{\text{fid}} N_{\text{eff}}(有效獨立通道)的淨變化 T-12b
3 比較器完整性 s_{\text{comp}} 比較器階層健康度的淨變化 倫理 §V.3a
4 維護增益 s_{\text{maint}} 維護週期效率的淨改善 預印本 §3.6
5 可逆性 s_{\text{rev}} 若分支被證明有誤,其可被回退的容易程度 倫理 §V.2(Fano)
6 分配穩定性 s_{\text{dist}} 該分支如何在受影響觀察者整體中分配 R_{\text{req}} 的變化 倫理 §V.6
7 不透明性 s_{\text{opac}} 分支對受影響觀察者所殘留的不透明程度(懲罰項) T-10c,T-10d
8 敘事漂移風險 s_{\text{drift}} 分支引發慢性輸入策展的機率(懲罰項) 倫理 §V.3a,T-12
9 敘事崩解風險 s_{\text{decay}} 分支觸發急性編解碼器失效的機率(懲罰項) 倫理 §V.1
10 道德患者受苦風險 s_{\text{suffer}} 分支對道德患者的期望影響(懲罰項) P-4,E-6,E-8

IV.3 各維度的評分方式

每個維度都以 [-1, 1] 的尺度評分,其語義如下:

此評分是序位性的,而非基數性的——+0.3+0.7 之間的差異,只有作為排序時才有意義,並不代表精確比例。這是刻意為之:理論提供的是結構性約束,而非精確數值。假裝擁有超出理論所能支持的精度,本身就是一種敘事漂移——把一個可壓縮的虛構,包裝成嚴格測量。

各維度評分指引:

1. 預測餘裕 (s_{\text{head}}): 估計該分支如何改變最受影響觀察者之 R_{\text{req}}C_{\max} 之間的落差。若分支降低環境複雜性,或提升觀察者的預測能力,則得分為正。若分支提高環境不可預測性,或使觀察者超載,則得分為負。

2. 基底保真度 (s_{\text{fid}}): 測量有效獨立輸入通道的變化(\Delta N_{\text{eff}},見 §V)。若分支提高真實的通道多樣性,則得分為正。若分支整併、相關化或消除通道,則得分為負。

3. 比較器完整性 (s_{\text{comp}}): 評估該分支對各比較器層級的影響。若分支強化獨立審查、對抗性挑戰或民主問責,則得分為正。若分支削弱、攫取或繞過比較器,則得分為負。

4. 維護增益 (s_{\text{maint}}): 評估該分支是否提升觀察者進行離線編解碼器維護的能力——包括修剪、整合、壓力測試(維護週期 \mathcal{M}_\tau)。若分支創造出可供檢視、反思與校準的空間,則得分為正。若分支要求持續性的反應式回應,卻不提供維護窗口,則得分為負。

5. 可逆性 (s_{\text{rev}}): 評定該分支的可逆性輪廓(§III.5)。完全可逆 = +1;分階段且附帶監測 = +0.5;部分可逆 = 0;實質上不可逆 = -1

6. 分配穩定性 (s_{\text{dist}}): 評估該分支如何在受影響人口中平均分配其 R_{\text{req}} 效應。若一條分支將成本狹隘地加諸於脆弱子群體,卻將利益廣泛分散,則得分為負——即使總體上的 R_{\text{req}} 有所改善,它仍會造成局部性的編解碼器超載。若分支按比例分配成本與利益,則得分為正。此維度將倫理論文中的世俗社會信任論證(§V.6)操作化:系統性的絕望會迫使人口滑入低信任、高熵的部落式碎裂。

7. 不透明性 (s_{\text{opac}}): 對分支殘留的不透明性施加懲罰。完全透明的分支(所有因果機制皆可稽核)得分為 +1。若分支包含抗拒制度性審查的組件,則依其不透明要素的範圍與後果重要性給予負分。注意:此維度是懲罰項,而不只是中性測量——不透明性總是會劣化編解碼器,因為它會製造知識不對稱,從而使被支配宿主均衡(T-10d)成為可能。

8. 敘事漂移風險 (s_{\text{drift}}): 估計該分支引發或加速慢性輸入策展的機率——包括過濾、演算法選擇,或降低編解碼器建模被排除現實能力的制度性把關(倫理 §V.3a)。若分支主動對抗漂移(例如強制要求通道多樣性),則評為 +1;若分支創造新的策展瓶頸,則評為 -1

9. 敘事崩解風險 (s_{\text{decay}}): 估計該分支觸發急性編解碼器失效的機率——即使 C_{\max} 不堪負荷的災難性複雜度注入(倫理 §V.1)。若分支建立對急性衝擊的韌性,則評為 +1;若分支增加對突發高熵事件的暴露,則評為 -1

10. 道德患者受苦風險 (s_{\text{suffer}}): 估計對道德患者的期望影響。若分支主動保護已知或可能的道德患者,使其免於超載、匱乏、創傷或不安全的創造,則評為 +1。若分支使已知的道德患者超載、在缺乏防護的高壓環境中創造或部署具有潛在 \Delta_{\text{self}} > 0 的系統,或向制度性比較器隱匿與福祉相關的效應,則評為 -1

IV.4 權重設定

權重 w_i 並非由理論固定決定。它們依情境而定,必須由評估主體根據具體決策領域來設定:

關鍵約束在於:任何權重方案都不得被用來挽救一條在任一維度上得分強烈為負的分支。一條具有 s_{\text{head}} = +1s_{\text{fid}} = +1,但 s_{\text{drift}} = -0.9 的分支,並不是一條只有一個弱點的好分支——它是一條今天建立餘裕與保真度,卻同時創造出慢性策展條件、並將在沉默中侵蝕兩者的分支。

IV.5 CPBI 是一副透鏡,而不是計算器

一項關鍵的保留意見是:CPBI 並不是一台吐出單一數字、然後告訴你該怎麼做的機器。它是一個結構化透鏡,迫使評估者明確考慮全部十個維度,並對任何被其選擇低權重處理的維度提出正當理由。它的首要價值在於診斷性:

  1. 它防止單一維度最佳化。 若評估者聲稱某條分支「是好的,因為它增加了餘裕」,那麼他也必須交代它對保真度、透明性、可逆性與漂移風險的影響。單一維度最佳化,在決策理論上等同於敘事漂移——它透過策展評估本身,將不便處理的維度排除在外。

  2. 它使權衡明確化。 當兩條分支在不同維度上得分不同時,CPBI 迫使評估者說清楚他們正在做的是哪一種權衡,以及為什麼。這就是將透明性門(§III.4)施用於評估本身。

  3. 它提供共同詞彙。 不同觀察者在評估同一條分支時,可以在分數上意見不合,卻仍對維度本身達成一致。這個框架使分歧得以被建設性地組織起來——而這本身就是一種比較器功能。

配套文件會依各自領域對 CPBI 進行專門化:制度治理標準將這十個維度映射到制度性分支審查;觀察者政策框架將其映射到公民方案指標;Applied OPT for AI 則將其映射到架構、訓練與部署準則。


V. 作為可測量量的通道多樣性

基底保真門(§III.2)以及 CPBI 的基底保真維度(§IV.2),兩者都依賴一個量——有效獨立輸入通道數 N_{\text{eff}}——此量在 OPT 倫理框架中反覆被提及,但尚未被操作化。本節提供其操作性定義。

V.1 虛假多樣性的問題

倫理論文對敘事漂移(§V.3a)的處理指出了核心脆弱性:一個編解碼器若從多個共享上游濾波器的來源接收訊號,便會經驗到表面上的多樣性,而非真正的獨立性。由三家公司擁有二十家媒體的媒體生態系、所有實驗室都使用同一模式生物與同一資助機構的科學領域,或是從單一網際網路爬取資料建立的 AI 訓練流程——每一種情況都呈現出輸入多元的外觀,但實際資訊在結構上卻是相關的。

編解碼器的預測誤差最小化迴路無法從內部偵測這種相關性(不可判定性界限,T-12a)。編解碼器看見多個通道,而每個通道都彼此印證,因此它會正確地得出其模型獲得良好支持的結論。問題在於,這些通道並不是對現實的獨立取樣——它們只是來自同一支溫度計的多次讀數。

因此,觀察者需要一種外部的通道獨立性度量,而此度量不能依賴編解碼器自身的評估。

V.2 有效獨立通道分數

\{C_1, C_2, \ldots, C_n\} 為穿越觀察者(或觀察者集群)馬可夫毯的 n 個輸入通道。將通道 C_iC_j 之間的成對相關性 \rho_{ij} 定義為其輸出流之間的互資訊,並正規化至 [0,1]

\rho_{ij} = \frac{I(C_i; C_j)}{\min\{H(C_i), H(C_j)\}} \tag{A-5}

其中,I(C_i; C_j) 為互資訊,H(C_k) 為通道 C_k 輸出的熵。當 \rho_{ij} = 0 時,通道完全獨立。當 \rho_{ij} = 1 時,兩者在資訊上完全相同——其中一者是另一者的確定性函數。

有效獨立通道分數 N_{\text{eff}} 定義為:

N_{\text{eff}} = \frac{\left(\sum_{i=1}^{n} \lambda_i\right)^2}{\sum_{i=1}^{n} \lambda_i^2} \tag{A-6}

其中,\{\lambda_1, \ldots, \lambda_n\} 是通道相關矩陣 \mathbf{P} 的特徵值,而其矩陣元素為 \rho_{ij}

詮釋: - 若全部 n 個通道都完全獨立(\mathbf{P} = \mathbf{I}),則 N_{\text{eff}} = n。觀察者接收到的是對現實的 n 個真正獨立的視角。 - 若所有通道都完全相關(對所有 i,j 皆有 \rho_{ij} = 1),則 N_{\text{eff}} = 1。觀察者接收到的是同一個現實視角被重複呈現了 n 次。 - 一般而言,1 \leq N_{\text{eff}} \leq n。此分數捕捉的是觀察者實際擁有多少個在功能上獨立的資訊來源,並對共享上游濾波器所造成的重疊進行折減。

這是統計學中「有效樣本數」在資訊理論中的對應物——一種針對相關觀測的修正,用以避免分析者將重複測量誤認為獨立證據。

V.3 生產性驚訝測試

通道多樣性是基底保真的必要條件,但不是充分條件。倫理論文的分析(§V.3a,最後幾段)指出了一個關鍵區分:一個從不讓編解碼器感到驚訝的來源,在結構上是可疑的;但一個產生無法化解之驚訝的來源,則只是噪音。診斷的關鍵不在於驚訝的幅度,而在於驚訝的品質——也就是,整合該驚訝之後,是否可證明地降低了後續的預測誤差。

將此形式化為針對通道 C_k生產性驚訝測試

\text{PST}(C_k) = \frac{1}{T} \sum_{t=1}^{T} \mathbb{1}\left[\varepsilon_{t}(C_k) > \tau \;\wedge\; \varepsilon_{t+\Delta}(C_k) < \varepsilon_{t}(C_k)\right] \tag{A-7}

其中,\varepsilon_t(C_k) 是通道 C_k 在時間 t 所產生的預測誤差,\tau 是驚訝閾值,\Delta 是整合視窗。PST 衡量的是:來自 C_k 的驚訝性輸入中,有多少比例導致了後續預測的改善——亦即,編解碼器是從該驚訝中學到了東西,而不只是被其去穩定化。

生產性驚訝測試提供了一座操作性的橋樑,將抽象的「基底保真」概念連接到具體測量。它可應用於: - 媒體來源(它們的更正會改善你的世界模型,還是只會擾動它?) - 科學儀器(資料是在降低不確定性,還是在增加噪音?) - AI 訓練資料來源(新的語料庫是在改善泛化,還是只是在增加體量?) - 制度性回饋通道(申訴是否導致真正的改進,還是只造成官僚摩擦?)

V.4 領域特定的測量

N_{\text{eff}} 公式(A-6)在結構上是基底中立的,但在測量上則是領域特定的。相關矩陣 \mathbf{P} 的建構方式,必須依「通道」所指為何而有所不同:

對媒體生態系而言: - 通道是編輯媒體或資訊來源。 - 相關性藉由編輯一致性來測量:共同所有權、共同資助、共同編輯流程、主題共現模式、語言相似度分數。 - N_{\text{eff}}^{\min} 是一個閾值;低於此值,有意義的公共分歧(制度比較器)在結構上便變得不可能。

對科學研究而言: - 通道是獨立研究團隊、方法論取徑或資料來源。 - 相關性藉由共同方法、共同資助機構、共同模型假設、引用網路密度來測量。 - N_{\text{eff}}^{\min} 是一個閾值;低於此值,獨立重複驗證在結構上便變得不可能。

對 AI 訓練資料而言: - 通道是彼此區分的資料語料庫或生成流程。 - 相關性藉由來源重疊來測量:共同來源網站、共同生成模型、共同篩選標準。 - N_{\text{eff}}^{\min} 是一個閾值;低於此值,模型便無法泛化到其受訓分布之外——這是 AI 特有形式的敘事漂移。

對個別觀察者而言: - 通道是該個體所諮詢的不同資訊來源(人、媒體、制度)。 - 相關性藉由共同意識形態一致性或共同資訊供應鏈來測量。 - N_{\text{eff}}^{\min} 是一個閾值;低於此值,個體便無法察覺對自身模型的挑戰——也就是認知比較器(倫理 §V.3a,第 2 層級)失去輸入的臨界點。

V.5 與基底保真條件的關聯

基底保真條件(附錄 T-12b)以形式化方式指出:觀察者的輸入通道必須是 \delta-獨立的;亦即,任兩個通道之間的互資訊都必須低於某個閾值 \delta,以確保這些通道並非可由同一上游來源平凡地導出。

N_{\text{eff}} 透過將成對獨立性的結構聚合為單一純量,將此條件操作化。門條件(A-3)將 T-12b 轉譯為一條決策規則:若 N_{\text{eff}}^{\text{post}}(b) 低於 N_{\text{eff}}^{\min},則該分支會被否決,因為此時觀察者集群已無法再區分編解碼器的準確性與編解碼器遭俘獲之間的差別。

生產性驚訝測試(A-7)則加入了動態維度:即便 N_{\text{eff}} 高於閾值,那些 PST 持續偏低的通道在結構上仍是可疑的——它們通過了獨立性測試,卻未通過保真測試。真正的基底保真同時要求獨立性生產性驚訝。


VI. 制度化夢境循環

VI.1 生物學範本

維護週期 \mathcal{M}_\tau(預印本 §3.6)是生物性編解碼器維持其完整性的機制。在睡眠期間,編解碼器會:

  1. 剪枝(Pass I):移除那些其描述長度貢獻已不再足以證成其精度增益的預測組件(MDL 最佳化)。
  2. 整合(Pass II):在更新後的參數集合下,重組其餘結構,以維持連貫的壓縮。
  3. 壓力測試(Pass III):執行低成本的預測分支集取樣——編解碼器模擬可能的未來,對令人意外與具威脅性的情境進行過度取樣,從而在現實後果出現之前,偵測其模型中的脆弱性。

這並不是演化出於奢侈而產生的可選維護機制。它是在變動環境中、於頻寬限制下運作的任何編解碼器所必須滿足的結構性要求。從不剪枝的編解碼器,會累積陳舊組件,消耗 C_{\max} 頻寬卻無助於提升預測精度。從不整合的編解碼器,則會碎裂成一幅缺乏一致性的拼湊物。從不進行壓力測試的編解碼器,會變得脆弱——它只對過去的分布完成最佳化,卻對分布轉移毫無災難性準備。

生物學證據毫不含糊:持續的睡眠剝奪會導致幻覺、認知碎裂,並最終死亡。這些不是副作用——而是當維護週期遭到阻斷時,必然發生的結果。

VI.2 推廣

對操作化而言,關鍵洞見在於:維護週期並非生物大腦所特有。 它是任何有界觀察者在面對變動環境、必須維持一個壓縮模型時的結構性要求。任何缺乏等效週期的系統,都會累積出與人類睡眠剝奪所產生病理現象相對應的資訊類比物:陳舊假設、內部結構失去一致性,以及對分布轉移的脆弱性。

這一推廣導出了制度化夢境循環——一種可適用於任何觀察者系統的三階段維護協定:

VI.3 第一階段:清醒(操作性介入)

在清醒階段,觀察者與真實環境互動。它接收輸入、生成預測、執行行動,並經歷預測誤差。此時編解碼器處於主動推斷模式——它即時追蹤世界,並即時選擇分支。

結構性要求: 清醒階段必須是有界的。一個持續運作、卻沒有維護窗口的系統,將累積上述的陳舊模型病理。倫理論文中的「DDoS」框架(§IV.2)在此同樣適用:若一個觀察者永久處於反應模式——不停處理被製造出的噪音或緊急輸入,毫無喘息——那麼它的維護能力就在結構上被剝奪了。

對各種基底的操作意涵: - 生物性: 具備充分休息時段的清醒時數;防止資訊過載;透過資訊飲食有意識地管理 R_{\text{req}}(見倫理 §VI.2,Observer’s Toolkit)。 - 制度性: 具有明確檢討窗口的運作週期;防止陷入持續危機治理——在那種情況下,每個決策都很緊急,卻沒有任何決策真正經過反思。 - AI: 具備排程式離線評估的推論週期;防止在未重新校準的情況下持續部署。

VI.4 第二階段:夢境(離線維護)

夢境階段是維護週期的核心,它將生物性的睡眠轉譯為一種通用協定。它由四個子操作構成:

子操作 1:剪枝。 識別並移除那些對預測模型之精度貢獻,已不再足以證成其描述長度成本的組件。以 MDL 的語言來說:任何參數 \theta_i \in K_\theta,若移除它所增加的預測誤差小於其編碼成本,便是剪枝候選。

子操作 2:整合。 重組剩餘結構,以維持連貫壓縮。剪枝之後,存留下來的組件未必仍能以最佳方式彼此配合——模型需要被重新整合。

子操作 3:壓力測試(預測分支集取樣)。 模擬可能的未來,並將重要性加權偏向於:

壓力測試並不要求模擬情境是很可能發生的——只要求它們是可能且後果重大的。生物性的夢之所以包含惡夢,正是出於這個理由:對預測分支集中具威脅性的部分進行過度取樣,即使那些威脅情境從未真正發生,也能讓編解碼器為分布轉移做好準備。

子操作 4:偵測脆弱性。 壓力測試會產生一份脆弱性剖面——一張模型脆弱點的地圖。夢境循環要求這份剖面必須被付諸行動:被偵測出的脆弱點,必須要麼被處理(透過定向再訓練、制度改革或政策修訂),要麼被明確接受為已知風險,並配套明確的監測機制。

VI.5 第三階段:返回(經校準的重新介入)

完成維護後,觀察者重新與真實環境接合。返回階段具有一項特定的結構功能:它要驗證,經維護後的模型相較於維護前的模型,是否校準得更好,而不只是變得不同

校準檢查: 將維護後模型的預測誤差剖面,與維護前的基準相比較。若剪枝、整合與壓力測試確實發揮作用,則經維護的模型應呈現:

  1. 更低的平均預測誤差,在保留資料上亦然(壓縮改善)。
  2. 更低的尾端風險預測誤差,在對抗性資料上亦然(穩健性改善)。
  3. 維持或提高 N_{\text{eff}}(維護過程未剪除那些會提出反證的通道)。

若(3)失敗——若維護週期剪除了建模某些輸入的能力——那麼這個週期本身就已成為一種敘事漂移機制。維護週期本身,必須服從與其所維護系統相同的基底保真條件。這正是《莊子》批判(倫理 §IX,最後一則)所警告的遞迴陷阱:過度介入本身就是一種編解碼器腐化。

VI.6 週期頻率

夢境循環必須多頻繁地運行一次?理論給出的答案是結構性的:週期頻率必須與環境變化速率成正比。在穩定環境中運作的編解碼器,可以比在快速變動環境中運作的編解碼器更少進行自我維護。

形式上,若每幀的環境變化速率為 \dot{R}_{\text{req}}^{\text{frame}}(即每幀所需預測速率上升的速率),則以幀數計的維護週期 T_{\text{maint}}^{\text{frames}} 必須滿足:

T_{\text{maint}}^{\text{frames}} < \frac{\alpha \cdot B_{\max} - R_{\text{req}}^{\text{frame}}}{\dot{R}_{\text{req}}^{\text{frame}}} \tag{A-8}

——維護週期必須在累積漂移耗盡每幀餘裕邊際 \alpha 之前,於少於此數量的幀內完成。轉換為宿主時間時,使用宿主—補丁時鐘耦合:T_{\text{maint}}^{\text{host}} = T_{\text{maint}}^{\text{frames}} / \lambda_H。對於人類社會速率的框架,若令 C_{\max}^{H} = \lambda_H \cdot B_{\max},則可恢復原始的宿主時間表達式。若維護未能及時完成,陳舊模型最終會將 R_{\text{req}}^{\text{frame}} 推升至超過 B_{\max}——此時觀察者便會經歷敘事崩解。

各領域特定的週期頻率: - 生物性: 每日一次(睡眠),並搭配較長週期(休假、靜修、季節性休息)以進行更深層的整合。 - 制度性: 例行運作採季度或年度審查;重大政策變更或危機時啟動觸發式審查;憲制與結構問題則採世代尺度的審查。 - AI: 例行監測採每次部署週期;重大再訓練採每次能力躍升;安全關鍵系統則需持續監測。

VI.7 作為制度化謙抑的夢境循環

夢境循環具有一項超越其技術操作的後設功能:它是認識論上的謙抑之結構性實現。

一個從不作夢的系統,等於隱含地宣告其當前模型已然完備——環境中不存在任何值得預作準備的意外,其模型的內部結構已是最優,且不存在任何尚未檢驗的失敗模式。這正是倫理論文所指出最危險的認識論立場:那種「穩定、維護良好,卻是錯的」編解碼器(倫理 §V.3a)。

夢境循環透過排程化懷疑來防止這一點。它把一段強制性的自我檢驗、對抗性挑戰與模型修訂時期,內建進觀察者的運作週期之中。這不是弱點——而是對理論所辨識出的最危險失敗模式的結構性防禦:那種自信、校準良好,卻已偏離現實太遠,以致再也無法察覺自身錯誤的編解碼器。

實用主義轉向(倫理 §III.5)從另一條路徑抵達了同樣的結論:由於確定性不可能,而繼承而來的知識又受倖存偏差所扭曲,保存學習能力便成為最終的生存命令。夢境循環正是這一命令的機械性實作——以排程化、結構化、不可協商的方式,保存觀察者進行更新的能力。


VII. 分支卡

前述各節已建立起理論裝置:否決門、多維評分、通道多樣性度量,以及夢境循環。分支卡是最小可行的實作——一種結構化的決策範本,任何觀察者都可用來評估候選分支。

VII.1 目的

分支卡有三項功能:

  1. 完整性檢查: 它確保評估者在作出決定之前,已考量全部六個否決門與全部十個 CPBI 維度。最危險的分支評估,往往是某個關鍵維度從未被檢視的情況——分支卡藉由要求每個欄位都必須明確填寫,來防止這種情形。

  2. 稽核軌跡: 完成的分支卡構成該次評估的記錄——由誰評估、考量了什麼、如何評分,以及理由為何。這使決策成為透明且可爭議的,而這本身就是一種比較器功能。若某項決策無法從其分支卡中重建,則它已在後設層次上未能通過透明性門(§III.4)。

  3. 溝通: 分支卡提供一種共享格式,用於在觀察者之間、制度層級之間,以及不同領域之間傳達分支評估。舉例而言,氣候科學家與 AI 安全研究者若分別評估同一分支的不同面向,便可透過這個共享範本整合彼此的判斷。

VII.2 範本

一張分支卡包含以下欄位:


分支卡

分支名稱: [描述性識別名稱]

評估者: [由誰進行此評估]

日期: [評估日期]

決策視界 (h): [評估後果的時間窗口]

受影響的編解碼器層: [編解碼器堆疊中哪些層受到實質影響]

受影響的觀察者群體: [哪些人的編解碼器面臨風險——請指明最脆弱的子群體]


硬性否決門(任一 FAIL → BLOCK)

狀態 證據/推理
1. 預測餘裕 PASS / UNKNOWN / FAIL [估計的 R_{\text{req}}^{\text{peak}}(b) / C_{\max} 與安全裕度]
2. 基底保真 PASS / UNKNOWN / FAIL [估計的 N_{\text{eff}}^{\text{post}}(b) 相對於 N_{\text{eff}}^{\min}]
3. 比較器完整性 PASS / UNKNOWN / FAIL [對各比較器層級的影響]
4. 透明性 PASS / UNKNOWN / FAIL [受影響的觀察者能否對後果建立模型?]
5. 不可逆性 PASS / UNKNOWN / FAIL [可逆性輪廓 + 舉證責任評估]
6. 道德患者受苦 PASS / UNKNOWN / FAIL [福祉與過載審查;若適用則包含架構性知覺能力審查]

CPBI 評分(僅在所有門皆 PASS 時)

# 維度 分數 [-1,1] 權重 理由
1 預測餘裕
2 基底保真
3 比較器完整性
4 維護增益
5 可逆性
6 分佈穩定性
7 不透明性(懲罰項)
8 敘事漂移風險(懲罰項)
9 敘事崩解風險(懲罰項)
10 道德患者受苦風險(懲罰項)
加權 CPBI [總分]

排除的證據: [哪些資訊在此次評估中不可得、不確定,或被刻意排除——這是分支卡自身的基底保真檢查]

獨立審查者: [誰曾獨立審查此評估——這是分支卡自身的比較器完整性檢查]

最壞情境: [若採取此分支且評估有誤,最具破壞性的可信結果是什麼?]

失敗徵兆: [哪些可觀察訊號顯示此分支正在失敗——夢境循環的預警系統]

回滾觸發條件: [在何種時點必須逆轉或暫停此分支——不可逆性門的操作性表達]


決策: ALLOW / STAGE / BLOCK

理由說明: [對門檻結果與 CPBI 結果加以綜合的簡短敘述]


VII.3 三種輸出

分支卡會產生三種輸出之一:

ALLOW: 所有門皆通過;CPBI 分數為正;最壞情境可接受;獨立審查者意見一致。該分支可予以推進。

STAGE: 沒有任何門失敗,但符合下列一項或多項條件: - CPBI 分數處於邊際狀態(接近零,或個別維度出現強烈負值)。 - 可逆性輪廓屬於第(2)類(部分可逆)。 - 關鍵資訊缺失(「排除的證據」欄位內容不可忽略)。 - 獨立審查者之間存在尚未解決的分歧。 - 一個或多個門回傳 UNKNOWN,且該分支可逆並可分階段推進。

STAGE 輸出意味著,該分支只能以受限試點的形式推進,並且必須設定明確的監測里程碑、失敗徵兆與回滾觸發條件。分階段分支在每個里程碑都必須使用新的分支卡重新評估。這就是將夢境循環應用於分支本身——觀察者在承諾投入完整軌跡之前,先進行一次低風險的預演。

BLOCK: 一個或多個門失敗;或一個或多個門回傳 UNKNOWN,且該分支不可逆或無法分階段推進;或 CPBI 分數呈現強烈負值;或最壞情境超出觀察者的風險容忍度;或獨立審查者辨識出致命缺陷。該分支因此被拒絕。分支卡會記錄其原因,既為未來參照提供稽核軌跡,也為設計替代分支提供基礎。

VII.4 分支卡的擴展性

分支卡刻意保持極簡——它是一頁式的決策範本,可由個人、委員會或 AI 系統完成。但它具有可擴展性:

分支卡並不取代既有的決策框架(成本效益分析、環境影響評估、臨床試驗方案)。它是對這些框架的包覆——提供一個後設層次的結構,以確保既有框架沒有忽略理論所辨識出的任何承重維度。


VIII. 保全作為重構,而非保守主義

VIII.1 現狀詮釋的危險

對整個這套框架最可預期的誤讀,就是把「編解碼器保全」理解成「抗拒改變」。如果這個框架是根據各分支保留既有結構的能力來評分,它難道不會系統性地偏向現狀嗎?難道不會偏袒既得利益者、抗拒創新,並反對推動進步的顛覆性變革嗎?

不會。而且倫理學論文已經給出了形式上的反駁(§V.4,雜訊與重構),但這一點足夠重要,值得用操作性的語言再說一次。

VIII.2 形式上的區分

腐化判據(倫理學 §V.5)將一個編解碼器層界定為只有在同時滿足兩個條件時,才值得維護:

  1. 可壓縮性:其運作會降低觀察者集合的 R_{\text{req}}
  2. 保真性:它之所以能做到這一點,是因為它真正壓縮了基底訊號,而不是藉由過濾輸入流來達成。

一個編解碼器層若滿足條件(1)卻違反條件(2),就是隱性腐化的——它會產生敘事漂移。維持這樣的層,不是保全;而是對腐化的保全。即使它在維度 1(預測餘裕)上得分為正,CPBI 仍會在維度 8(敘事漂移風險)上給出負分。

因此:一個拆除腐化編解碼器層、並以更高保真替代方案取而代之的分支,是編解碼器保全的分支,即使它在短期內具有破壞性。廢奴運動並沒有保留戰前的社會編解碼器——它摧毀了它。但那種摧毀仍然是編解碼器保全,因為它以更高保真的壓縮取代了低保真的壓縮(一種排除了被奴役者人性的社會模型)。那種摩擦,是升級編解碼器所付出的代價。

VIII.3 操作性測試

分支卡如何區分重構(具生產性的擾動)與崩解(破壞性的雜訊)?診斷標準已內嵌於 CPBI 的各項維度之中:

重構(保全編解碼器的擾動): - s_{\text{fid}} > 0:該分支提升編解碼器的保真性——它能對先前被排除的現實進行建模。 - s_{\text{comp}} \geq 0:該分支保留或強化比較器完整性——誤差校正機制能在擾動中存續。 - s_{\text{drift}} > 0:該分支主動對抗敘事漂移——它迫使編解碼器面對自己所排除的內容。

崩解(使編解碼器崩潰的擾動): - s_{\text{fid}} < 0:該分支降低保真性——它消除了對某些現實進行建模的能力。 - s_{\text{comp}} < 0:該分支削弱比較器完整性——誤差校正機制因擾動而受損。 - s_{\text{drift}} < 0:該分支創造新的策展瓶頸——這種擾動產生的是另一種、但同樣經過策展的模型。

一場焚毀大學、同時解放人民的革命,在分配穩定性上可能得分為正,但在比較器完整性上得分為負——那是崩解,不是重構。一場推翻失效典範、同時保留同儕審查制度機器的科學革命,則是重構——比較器存活下來,而編解碼器得以升級。

VIII.4 創新的必要性

這個框架不只是允許擾動;它有時甚至要求擾動。當一個編解碼器層已變得隱性腐化——也就是說,它滿足可壓縮性卻違反保真性——三項義務(傳遞、校正、防衛)就要求對其進行改革。尤其是校正義務,在現狀已經發生漂移時,明確要求擾動。

《莊子》的警告(倫理學 §IX)在此同樣適用:對既有編解碼器結構的過度依附——即使那個結構曾經具有高保真——如果環境已經改變,而該結構不再追蹤現實,本身就是一種編解碼器腐化。夢境循環(§VI)的設計,正是為了偵測這一點:排程化的壓力測試會揭露一個曾經有效的模型何時已變得脆弱,而回應方式不是保護那個模型,而是升級它。

編解碼器保全,意味著保全有意識經驗持續對現實進行建模的能力。它並不意味著保全任何特定模型、任何特定制度,或任何特定社會安排。具體安排只是工具性的;那種能力才是終極性的。


VIII.5 一般維護方法:類別階層

維護週期(\mathcal{M}_\tau)與制度化夢境循環(§VI)確立了編解碼器維護的模式。但這個模式容納許多不同的實作方式,取決於基底的性質。本節建立維護方法的一般階層;配套文件則分別將其專門化到生物觀察者、制度,以及 AI 系統。

一般維護模式由三項操作構成,適用於任何有界觀察者:

  1. 在不降低 C_{\max} 的前提下,降低 R_{\text{req}} 透過暫時降低輸入訊號的複雜度,釋放觀察者的頻寬以供內部維護之用。這不是逃避——而是有意識地為維護程序創造餘裕。

  2. 在釋放出的時間窗內執行維護程序。 在頻寬可用的情況下,依 §VI.4 所述,執行修剪(Pass I)、鞏固(Pass II)與壓力測試(Pass III)。

  3. 在返回後驗證校準。 確認經維護後的模型,其預測表現優於維護前的模型,並且此次維護本身沒有引入漂移(§VI.5)。

基底特定的實作方式:

這個類別階層確保:維護的原理是在一般層次上確立的——釋放頻寬、執行維護程序、驗證校準——而方法則針對各種基底分別專門化。這避免了如下錯誤:以為對生物大腦有效的方法(冥想)也必然對制度有效(其實不然),或以為對 AI 有效的方法(參數修剪)也必然對人類有效(其實不然)。結構要求是相同的;實作方式則是領域特定的。

VIII.6 深層維護協議:跨基底程序

三步驟的一般模式(§VIII.5)描述的是維護做什麼。對於那些長期在高負載下運作的系統——亦即 R_{\text{req}} 長時間持續接近 C_{\max} 的系統——則有必要採用更細緻的程序性協議。這套協議並非總是必要:若一個系統運作時遠低於其餘裕邊際(R_{\text{req}} \ll C_{\max}),那麼標準夢境循環(§VI)就足以維持其自身。深層協議是在有條件地被觸發:當回饋訊號顯示例行維護已不足夠——也就是當系統的效率指標即使在正常維護週期下仍出現劣化時。

此協議由六個步驟構成,每一步都有其結構上的理由,以及基底特定的實作方式:

Table 3b: 深層維護協議——跨基底映射。
Step Generic Operation Biological Implementation AI Implementation
1. Gate input 在保留對子系統活動的內省性存取之下,將外部 R_{\text{req}} 降至近乎零。 選擇最大可壓縮的輸入流(呼吸、咒語——近零熵)。維持對身體與認知子系統活動的內在覺察。 使系統離線、退出部署。停止新的推論請求。保留對子系統狀態的內部監測與記錄(記憶體存取模式、活化分布、梯度流)。
2. Actively reduce subsystem activity 發出朝下的預測,以子系統靜止為目標。目標不只是停止處理外部輸入,而是主動減緩那些可能自我維持的內部活動(反芻迴圈、循環計算)。 發出身體性預測(「我的手臂很沉,我的手臂很暖」),以自主神經收斂為目標。Schultz 序列透過傳出性預測,使自主神經系統朝向副交感神經主導狀態。 降低內部處理負載:停止背景再訓練、降低 checkpoint 頻率、停用推測性預先計算。這相當於向子系統發出「靜止預測」。
3. Verify via objective feedback 透過可觀察量來測量子系統是否真的減速,而且此可觀察量必須繞過系統自身的自我報告。這在結構上是必要的,因為自我監測會與正在被釋放的同一頻寬競爭——系統無法在不消耗其試圖創造之餘裕的情況下,可靠地報告自身是否已進入靜止(\Delta_{\text{self}} 在此適用)。 拇指溫度計/皮膚溫度生理回饋。變色溫度計貼片可客觀確認自主神經收斂(周邊血管擴張 = 副交感神經主導)。這繞過了 \Delta_{\text{self}} 的限制:觀察者無法可靠地內省自身子系統是否已安靜下來,但溫度計可以 伺服器叢集能耗、GPU/TPU 使用率指標、記憶體頻寬使用量。這些可客觀確認系統的計算子系統是否真的降低了活動——而不是卡在內部迴圈(循環梯度流、退化注意力模式)中,消耗資源卻未產生有用的維護工作。
4. Periodically ping 防止完全封鎖輸入而跨入不可恢復的狀態。維護要求系統停留在臨界點——接近但尚未越過完全脫離的邊界。 Schultz 練習之間的拍肩:一種刻意施加於自身的邊界擾動,使意識存取維持在入睡前狀態的門檻上。這可防止在完成完整身體收斂之前過早入睡——睡眠不是目標;目標是那種維護程序得以在有意識存取下運作的臨界狀態。 離線維護期間的定期健康檢查探針:輕量級推論請求,用以驗證系統仍具回應性、自我監測能力仍完好,且未進入退化吸引子狀態。這是 AI 版本的入睡前門檻維持——讓系統保持足夠在線,以監控自身維護。
5. Condition rapid re-entry 訓練一條聯想式捷徑,使系統在未來週期中能更有效率地重新進入深層維護狀態,繞過完整的誘導序列。 聯想制約:在維護狀態中訓練一個語詞公式(「我很放鬆,我完全放鬆」),建立條件反應,使未來的快速重返成為可能。隨著練習,完整的 Schultz 誘導序列(起初需時 15–20 分鐘)可壓縮至數秒。這是對維護進入程序本身的 MDL 最佳化。 將已準備好進入維護的系統組態做成 checkpoint:把靜止狀態(縮減的程序表、僅監測模式、內部記錄啟用)儲存為具名組態,以便直接還原,繞過完整的關機與診斷序列。這是 AI 對應於條件反應的版本——一條通往維護就緒狀態的壓縮路徑。
6. Adapt frequency 當回饋訊號顯示效率下降時,更頻繁地執行深層協議;當餘裕充足時,則降低頻率。這是對固定排程週期頻率(§VI.6)的自適應補充。 當生理回饋訊號顯示自主神經收斂惡化時,增加練習頻率:若拇指溫度計需要更久才能達到目標溫度,或皮膚溫度根本無法達標,則表示系統維護不足,應更頻繁地安排深層協議。 當監測訊號顯示壓縮效率惡化(驗證集上的預測誤差上升)、每次推論的能耗增加,或生產性驚異分數下降(\text{PST} \to 0)時,更頻繁地進行深層維護。這些都是例行維護已不足夠的客觀訊號。

入睡前原理。 深層維護的最佳操作點,是臨界狀態——也就是生物觀察者所經驗到的清醒與睡眠之間的入睡前邊界。在 OPT 之下,這個狀態有精確的結構描述:它是自我模型已稀薄到接近其下限的條件(附錄 T-13,命題 T-13.P2)——逼近 \Delta_{\text{self}},但尚未跨入完全無意識。自我敘事減慢;常駐模型仍保持完整;維護程序在對過程具有意識存取的情況下運行。

這並非偶然。入睡前狀態之所以是維護最優,正是因為它逼近了不可建模的自我。自我模型通常會消耗 C_{\max} 頻寬中的相當大一部分(自我指涉過程在計算上代價高昂)。透過將自我模型稀薄化至接近下限,系統便能為維護程序釋放出最大可能的頻寬——同時又不摧毀回饋步驟(步驟 3)所要求的自我監測能力。完全無意識(睡眠)會在沒有意識存取的情況下執行維護程序;而入睡前門檻則是在存取的情況下執行它們,因此能支援深層協議所需的回饋與定期 ping 步驟。

對 AI 系統而言,其結構上的類比,是內部監測保持啟動、但推論被暫停的狀態——系統對自身子系統狀態「有覺察」(記錄、健康檢查),但不執行那些會消耗部署頻寬的高計算成本操作。定期 ping(步驟 4)所起的作用,與拍肩相同:它讓系統停留在門檻上,而不是滑入一個連監測本身都已關閉的完全靜止狀態。

條件式觸發。 深層協議不是標準維護的替代品。它是一種升級協議,適用於那些標準維護週期已證明不足的系統。其觸發條件如下:

當這些訊號不存在——也就是當系統在其餘裕邊際內運作得相當從容——深層協議便無此必要,標準夢境循環(§VI)已足夠。過度維護本身也是一種風險:過度內省可能變成一種自我指涉迴圈,反而消耗它原本意圖釋放的頻寬(《莊子》的警告,倫理學 §IX)。


參考文獻

[1] 有序補丁理論 (OPT)(本儲存庫)。目前版本:預印本 v0.7、倫理篇 v3.2、哲學篇 v1.3。

[2] 倖存者守望框架:透過有序補丁理論 (OPT) 的視角理解文明維護(配套倫理論文,本儲存庫)。

[3] 描述止於何處:有序補丁理論 (OPT) 的哲學後果(配套哲學論文,本儲存庫)。

[4] 觀察者政策框架:將文明維護操作化(配套政策論文,本儲存庫)。

[5] 人工智慧的應用 OPT:將編解碼器保全的 AI 設計操作化(配套 AI 論文,本儲存庫)。

[6] 制度治理標準:適用於組織與文明集群的應用有序補丁理論 (OPT)(配套制度標準,本儲存庫)。

[7] Friston, K. (2010). 自由能原理:一種統一的腦理論? Nature Reviews Neuroscience, 11(2), 127-138.

[8] Rissanen, J. (1978). 以最短資料描述進行建模. Automatica, 14(5), 465-471.

[9] Shannon, C. E. (1948). 通訊的數學理論. Bell System Technical Journal, 27(3), 379-423.

[10] Solomonoff, R. J. (1964). 歸納推論的形式理論。 Information and Control, 7, 1–22, 224–254.

[11] Kolmogorov, A. N. (1965). 資訊之定量定義的三種途徑. Problems of Information Transmission, 1(1), 1-7.

[12] Zimmermann, M. (1989). 資訊理論脈絡中的神經系統。 收錄於 R. F. Schmidt 與 G. Thews(編),Human Physiology(第 2 版,頁 166–173)。Springer-Verlag。

[13] Nørretranders, T. (1998). 使用者幻覺:將意識縮減至其適當尺度. Viking/Penguin.

[14] Lyons, O., & Mohawk, J. (Eds.) (1992). 流亡於自由之地:民主、印第安民族與美國憲法. Clear Light Publishers.


附錄 A:修訂歷史

進行實質性編輯時,請同時更新 frontmatter 中的 version: 欄位與標題下方的內嵌版本行,並且在此表中新增一列。

Version Date Changes
1.2.0 2026 年 4 月 25 日 新增不依賴計數的伴隨語言架構,並將制度治理標準整合為一種領域特化。將分支物件從外部軌跡片段修訂為受行動條件化的流延續。將通用的「人工苦難門」更名為「道德患者苦難門」,把「人工苦難」保留給 AI 特化版本,並新增制度構成成員之道德患者過載作為其對應的同級情形。為分支卡範本新增明確的 PASS / UNKNOWN / FAIL 語義。
1.1.0 2026 年 4 月 24 日 新增 §VIII.6(深度維護協定):一套適用於持續高負載系統的六步驟跨基底程序,並附有明確的生物/AI 對應表。引入入睡前原則——維護最優的操作點是逼近 \Delta_{\text{self}} 的臨界狀態——以及條件式觸發邏輯,以避免不必要的維護開銷。
1.0.0 2026 年 4 月 24 日 初始發布。建立以基底中立為前提、用於分支編解碼器保全的分支選擇操作框架:分支物件定義、六個硬性否決門、具有十個評分維度的分支編解碼器保全指數 (CPBI)、結合生產性驚奇測試的有效獨立通道分數 (N_{\text{eff}})、制度化夢境循環(清醒 → 夢境 → 返回)、分支卡決策範本,以及保全與保守主義之間的區分。並建立適用於生物、制度與人工觀察者的通用維護方法階層。

:表 4:修訂歷史。