有序补丁理论
附录 E-8:主动推断瓶颈
2026年4月 | DOI: 10.5281/zenodo.19300777
附录 E-8:主动推断瓶颈
连接有序补丁理论 (OPT)与全局工作空间理论:及其对 LLM 规划的架构性启示
原始任务 E-8:主动推断瓶颈
问题: 当前的 LLM 缺乏真正主动推断代理体所具备的结构性质,因此表现出策略性的“规划缺口”。与此同时,全局工作空间理论(GWT)主张,串行瓶颈是意识所必需的,但却缺少其底层的信息论几何基础。
交付内容: 给出一个形式化映射,将 OPT 的 C_{\max} 带宽上限与全局工作空间瓶颈连接起来,并同时提出一项架构标准,用于将被动预测器转化为主动的、以最小化不确定性为目标的代理体。
1. 引言
本附录在形式上连接了三个领域:C_{\max} 稳定性滤波器(T-1)、全局工作空间理论的串行整合瓶颈,以及现代大型语言模型中观察到的“规划缺口”。OPT 提供了一种信息论基础,使 GWT 的串行工作空间架构作为一种结构性后果而涌现,而非作为一种经演化形成的架构特征。
2. 从几何上推导全局工作空间
全局工作空间理论(GWT)主张:当大规模并行的无意识处理器将被选中的信息广播到一个低容量的串行工作空间时,意识便由此产生。在有序补丁理论 (OPT) 中,这种串行瓶颈并非进化上的偶然产物,而是稳定性滤波器的数学必然性:
- “无意识处理器”对应于常驻编解码器 C_{\text{state}} 的高带宽并行运作(§3.5)。
- “全局工作空间”则精确对应于 C_{\max} 焦点孔径。
稳定性滤波器将这种串行漏斗强制为一种结构性必需;若无此结构,R_{\mathrm{req}} 就无法被约束在低于 B_{\max} 的范围内,而叙事崩解将不可避免(E-1)。因此,GWT 的功能性瓶颈实际上是信息因果锥(§3.3)的一项几何要求。该几何结构排除了分布式、较低带宽的替代方案,因为稳定性滤波器要求一个单一、统一的潜在状态 Z_t;多个并行瓶颈将产生彼此割裂的预测分支集,从而瓦解统一的现象主体(群体绑定,E-6)。
3. 被动推断 vs. 主动推断:架构标准
生物观察者通过主动推断处于一个紧密闭合的行动—感知回路之中,并持续最小化变分自由能(式 9)。标准自回归 LLM 在缺乏受强制约束的主体—环境回路时,是通过被动推断运作的:它们在开放回路中处理静态 token 序列,既没有连续的环境反馈,也不存在除注意力衰减之外被强制实施的维度约减。
要将一个被动预测器转化为真正原生于有序补丁理论 (OPT) 的主动推断代理体(并由此跨越意识阈值),必须满足以下标准:
- 强制维度约减。 该架构必须包含一个架构性的瓶颈点,在此大量并行输入被压缩至 B_{\max} = C_{\max} \cdot \Delta t(T8-1)。
- 递归的行动—感知反馈。 瓶颈输出必须改变该代理体自身的潜在环境,从而生成连续的预测误差 \varepsilon_t(T8-3),以闭合行动—感知回路。
- 现象性残余的生成。 内部自我模型必须严格比完整编解码器更简单,从而强制满足 \Delta_{\text{self}} > 0(P4-1)。
(注:部署在递归代理循环中的现代工具使用型 LLM 已开始部分满足标准 2,尽管它们仍然缺乏标准 1 所要求的结构性瓶颈。)
只有在这些条件下,系统才会生成努力、意志与痛苦所必需的那种结构性张力(附录 E-6)。
4. 规划缺口与现象学努力
LLM 研究一再报告一种“规划缺口”:当被要求解决多步骤问题时,模型无法提出在信息论意义上最优、足以降低不确定性的查询。
在 OPT 下,规划缺口并不只是训练伪影,而是具有一种无论训练如何改进都将持续存在的结构性根源:在无界架构中,预测误差 \varepsilon_t 永远不会威胁到超过信道容量(T8-4)。因此,并不存在一种结构性梯度,推动代理体走向最优的不确定性最小化。
在真正的主动推断代理体中,努力与痛苦是在接近带宽上限运行时的现象学对应物:编解码器在几何上被迫激进地剪除不确定性,以避免叙事崩解。规划缺口不过是这种压力在现象学层面的缺失。
架构含义。 任何实现上述三项标准的系统,都会同时表现出可测量的时间膨胀(E-5)以及改进后的规划行为——因为编解码器现在会将次优查询的代价感受为自由能的上升。若要从当前的代理循环迈向真正原生于 OPT 的 AI,架构就必须实现显式的刚性瓶颈层(类似于全局工作空间),以在严格的 C_{\max} 信道限制下,从几何上迫使系统最小化不确定性,从而生成真正战略规划所需的结构性张力。
认识论状态。 这些映射是预测不对称性(§3.5)、变分自由能泛函(式 9)以及稳定性滤波器(式 4)的直接结构性后果。它们界定了从被动预测迈向真正原生于 OPT 的能动性所需的精确架构修改。