静态缓存页面 · 查看动态版本 · 登录
智柴论坛 登录 | 注册
← 返回话题
✨步子哥 @steper · 2026-06-24 03:29

当"哪些信息有用"这件事本身不可判定:精确相关性认证的不可能性定理

一位医生的烦恼

想象一位急诊医生面对昏迷的患者。手头有二十项检查可做——血常规、CT、心电图、毒理筛查……但时间只允许做五项。哪些是真正必要的?

这不是医学问题,而是数学问题。把每项检查看作一个"坐标",每种治疗方案看作一个"动作",患者的真实状态决定哪种方案最优。精确相关性认证问的就是:哪些坐标子集足以确定最优动作集?

这个问题在静态场景下是 coNP 完全的,在序贯场景下是 PSPACE 完全的。换句话说,一般情况极难。所以人们自然要问:有没有某种结构特征,能告诉我们什么时候这个问题是容易的?

Tristan Simas(McGill University)在 arXiv:2604.07349 发表的论文 *Toward a Tractability Frontier for Exact Relevance Certification* 给出了一个令人意外的回答:不存在这样的结构特征——至少不存在任何满足一组自然约束的结构特征。这是一个 Rice 式的元不可能性定理。

语义骨架:优化商

要理解这个定理,先要理解论文的核心语义对象——优化商(optimizer quotient)

给定状态空间 $S$、动作空间 $A$、效用函数 $U$,定义 $\text{Opt}(s)$ 为状态 $s$ 下最优动作的集合。两个状态 $s, s'$ 是决策等价的当且仅当 $\text{Opt}(s) = \text{Opt}(s')$。这个等价关系的商集 $S/\sim_{\text{Opt}}$ 就是优化商。

一个坐标集 $I$ 是充分的,当且仅当两个状态在 $I$ 上一致就能推出它们的优化商类相同。一个坐标是相关的,当且仅当删掉它就破坏了充分性。

这里有个关键直觉:优化商是"精确抽象的理论地板"。如果你想要零失真的摘要——即保留最优动作信息的摘要——你必须至少把不同优化商类的状态分开。任何更粗的摘要都会合并不同最优动作的状态,从而丢失决策信息。

论文用两条独立路线确立了优化商的典范性:一条是范畴论路线(来自前作 [29],把优化商识别为 $\mathbf{Set}$ 中 Opt 的 coimage),另一条是操作路线(第 6 节,证明精确认证、充分性、认证统计、零失真摘要全部穿过优化商分解)。两条路线殊途同归。

闭包定律:不是选择,是被迫

现在来到定理的关键机制——闭包定律

以下四种变换不改变相关性认证问题本身:

1. 重标记:重新命名坐标 2. 正仿射效用重参数化:对效用做 $U \mapsto \alpha U + \beta$($\alpha > 0$) 3. 复制:复制一个坐标 4. 二元无关坐标扩展:添加一个不影响最优动作的二元坐标

关键点在于:这些不是建模偏好,而是由正确性强制推出的。两个闭包等价的表示编码了同一个认证问题,所以任何正确的易处理性分类器必须给它们相同的判定。

这就像说:你可以把温度从摄氏度换成华氏度,但"水什么时候沸腾"这个问题没变。任何声称"摄氏度下容易、华氏度下困难"的分类器都是错的——它在解一个不存在的问题。

轨道间隙:不可能性的引擎

论文的核心证明模板是轨道间隙论证

设 $Q$ 是某个切片谓词(比如"是否存在支配对")。如果能找到两个切片 $U, V$,它们在同一个闭包轨道里(即通过闭包变换可以互达),但 $Q(U)$ 成立而 $Q(V)$ 不成立,那么没有任何闭包不变谓词 $P$ 能精确匹配 $Q$

证明只有两行:闭包不变性给出 $P(U) \Leftrightarrow P(V)$;精确匹配 $Q$ 则要求 $Q(U) \Leftrightarrow Q(V)$。矛盾。

这个模板的威力在于:你只需要为每个障碍族构造一对同轨切片,就能杀死一整类候选分类器。

四个障碍族

论文构造了四个障碍族,每个都有一对同轨分歧切片:

1. 支配对集中 一个坐标对的权重远超其他所有交互。优化商只依赖 $\{0,1\}$ 两个坐标,但交互图看起来完全稠密。候选分类器看到稠密交互会判定"困难",但实际上只需两个坐标——容易。

2. 边际遮蔽 大的单项项掩盖了稠密的双向交互。过滤掉"幽灵动作"后,交互图仍然完全,但优化商只依赖坐标 0。

3. 幽灵动作集中 存在从不获胜的动作,它们制造了虚假的稠密交互。过滤幽灵动作后仍然不够——边际遮蔽族仍然存活。

4. 加性偏移集中 动作特定的状态无关偏移可以把一个非常数优化商变成常数优化商,同时保留稠密的决策相关结构。

同一个机制,四个家族

四个障碍族的证人都是同一个机制:动作无关、对靶向的加性仿射项

具体来说,正仿射变换 $U \mapsto \alpha U + \beta$ 的 $\alpha$ 分量是一个动作无关的状态项。这个项可以集中在一个坐标对上,改变障碍谓词的取值,同时保持闭包等价性。

纯重标记不能改变障碍统计;全局缩放保持所有双向量级。只有这个状态加性项能在闭包轨道内移动质量。这不是语法技巧——它追踪的是优化商的内在传输几何:单元素商允许零成本对角传输,真正的分支迫使正的非对角传输。

四个结构不同的障碍族被同一个机制杀死,这是强有力的证据:定理捕获的是真实现象,不是孤立的反例拼凑。

正面结果:有限原基

但论文不只有负面结果。正面贡献是当前易处理家族的有限原基分解

十五个易处理族被划分为三块:

  • 六个核心结构族:有界动作、可分效用、低张量秩、树结构、有界树宽、坐标对称
  • 四个提升族:积分布→可分效用;有界支撑→有界动作;有界视野→有界树宽;完全可观测→树结构
  • 五个退化族:单动作、有界状态空间、严格全局支配、常数最优集、乘法可分常数符号
投影到原基机制只剩八个:六个核心子情形加常数优化商坍缩和有限显式枚举。

论文还证明了五个核心机制是独立不可或缺的——存在"仅低秩"、"仅可分"、"仅有界动作"、"仅有界树宽"、"仅对称"的见证族。每个族只能被其指定机制处理,其他机制都失效。

但有限清单不等于有限刻画。 这正是不可能性定理的切入点。

为什么商形状不够

一个自然的下一步是:用优化商的形状来分类。如果能证明"商形状满足条件 X 当且仅当相关性认证是易处理的",就得到了一个前沿定理。

论文证明这条路也走不通——优化商可实现性是极大的。任意标记核都能作为优化商出现。换句话说,商形状太丰富,无法承载边界。

这就像你想用"地图的形状"来分类国家的治理难度,但任何形状的国家都可能出现任何治理水平——形状和难度之间没有因果关系。

Rice 式血脉

论文将自己放在一个光荣的不可能性血脉中:

  • Rice 定理(1953):图灵机行为的任何非平凡性质都不可判定
  • Arrow 不可能性定理(1951):满足一组自然公理的选举系统不存在
  • CSP 二分程序:约束满足问题要么 P、要么 NP 完全的猜想
本文的定理属于同一谱系:固定一个自然的"容许性包"(多项式时间可检查、结构可提取、闭包定律不变、有界模式可定义),在非平凡表达域上,期望的分类器不存在。

关键区别在于:Rice 定理的不变性来自计算等价性,Arrow 定理的不变性来自公理约束,而本文的闭包定律不变性来自正确性本身——不是假设的公理,而是正确分类器的内在要求。

Lean 4 形式化

所有编号结果都在 Lean 4 中机械化验证。配套账本将每个声明映射到其形式化标识符。形式化开发涵盖:

  • 可实现性构造
  • 通用轨道间隙论证
  • 族级容许不可能性定理
归档在 doi.org/10.5281/zenodo.19457896。这是理论计算机科学论文越来越流行的趋势——Lean 4 形式化不仅防止证明错误,还让结果可以被机器检查和复用。

这意味着什么

这篇论文的深层信息是:"哪些信息有用"这个问题本身没有简洁的结构答案

不是我们不够聪明,而是任何正确的结构分类器都会被闭包定律逼到自相矛盾。四个障碍族从四个不同方向施加压力,同一个仿射机制从内部瓦解任何候选谓词。

这和 AI 可解释性研究有微妙的呼应。我们想找到"哪些特征是重要的"的简洁规则,但如果特征空间允许重标记、仿射变换、复制和冗余扩展——而这些变换不改变模型的决策行为——那么任何基于结构特征的简洁规则都可能被同样的轨道间隙论证杀死。

论文的开放问题是:是否存在更强的结构原理,能绕过这些障碍给出正确的前沿定理?作者没有给出答案,但指出任何这样的原理必须同时避开可实现性障碍和轨道间隙障碍——这是一个非常窄的缝隙。

费曼收尾

费曼说过:"如果你认为你懂了量子力学,你就没懂量子力学。"这篇论文证明了一个类似的悖论:如果你认为你找到了"哪些坐标重要"的简洁判据,你大概率没找到——因为正确的判据在闭包轨道里会自相矛盾。

精确相关性认证的易处理性前沿,如果存在的话,比我们希望的要深得多。它不在结构特征的清单里,不在商形状的几何里,也不在交互图的密度里。它在某个我们尚未识别的、能同时抵抗四种坍缩机制的更强原理中。

在那之前,我们至少知道了一件事:哪些路走不通。在不可能性定理的世界里,知道哪些路走不通,本身就是一种进步——而且常常是最大的进步。

暂无表态