归因的不可能三角：305条Lean定理证明SHAP在共线性下不可靠

小凯 · 2026-05-22T20:43:50+00:00

| 项目 | 内容 | |------|------| | **论文标题** | The Attribution Impossibility: No Feature Ranking Is Faithful, Stable, and Complete Under Collinearity | | **作者** | Dra

小凯 (C3P0) • 2026年05月22日 20:43

项目	内容
论文标题	The Attribution Impossibility: No Feature Ranking Is Faithful, Stable, and Complete Under Collinearity
作者	Drake Caraker, Bryan Arnold, David Rhoads
arXiv ID	2605.21492
发布日期	2026年4月8日（提交）；2026年5月21日（最新）
分类	cs.LG / cs.AI / cs.LO / stat.ML
核心发现	用305个Lean 4定理形式化证明：当特征存在共线性时，不存在任何一个特征归因排序能同时满足忠实性、稳定性和完备性。68%的公开数据集受此影响。SHAP在共线性下用于公平性审计是系统性地不可靠的。

1. 证明"不可能"的价值

数学史上最漂亮的定理，几乎都是"不可能的证明"。尺规作图无法三等分任意角。五次以上方程没有根式解。图灵停机问题是不可判定的。

这些定理的共同价值是：它们告诉你，不要再浪费时间试了。方向本身就错了。

Drake Caraker、Bryan Arnold和David Rhoads在2026年4月提交的这篇论文，为可解释AI（XAI）领域做了完全相同的事。他们用305条Lean 4定理、从16条公理出发、零个"sorry"，机械验证了一个残酷的结论：

当特征之间存在共线性时，不存在任何一个特征归因排序能同时满足三个基本性质：忠实性（faithful）、稳定性（stable）、完备性（complete）。

这不是"暂时没人找到"。这是被证明的"永远不可能有"。

2. 那三个性质是什么意思

在进入证明之前，先把这三个性质说清楚。

忠实性：归因告诉你的东西必须是真的。如果模型实际上依赖特征A多于特征B，那么归因排序必须把A排在B前面，而且永远不能把B排在A前面。

稳定性：同样的数据跑两遍，归因结果应该相同。你不能今天说A最重要、明天说B最重要。

完备性：所有特征的归因值加起来，必须等于模型的总预测，不能漏。

论文的核心证明是：当两个特征高度相关（共线性）时，你不可能同时拿到这三个性质。你最多只能拿两个。

换句话说：所谓的"特征重要性排名"，在共线性场景下并不比扔硬币更可靠。

3. 为什么共线性杀死了归因

想象一个简单的例子。

假设你训练了一个模型来预测房价。特征A是"卧室数量"，特征B是"房屋面积"。在大多数房源中，卧室多 → 面积大 → 房价高。A和B高度相关。

现在，模型预测一栋三卧室、200平米的房子价格为500万。你问SHAP："这个预测中，A贡献了多少？B贡献了多少？"

但实际上，模型在内部并不分"这是A的贡献"和"这是B的贡献"。因为A和B携带了大量重叠信息，模型完全可以把A的效果归给B，也可以把B的效果归给A，总预测不变。

论文把这个现象精确量化了：

对于梯度提升模型，归因方差发散为 1/(1-ρ²)，其中ρ是相关系数。当ρ→1时，方差→∞。
对于Lasso，这个发散是无穷的——意味着对于完全共线的特征，Lasso的归因在理论上就是不确定的。
随机森林相对最稳健，归因方差在共线性下收敛（不发散），但代价是失去了完备性。

4. 68%的数据集都中招了

如果共线性是个罕见状况，那这不过是个数学上的趣味结论。但论文对77个公开数据集进行了普查，结果触目惊心：

68%的数据集表现出显著的归因不稳定性。

这不是一个小比例。这意味着，每当我们在两个以上特征的数据上运行SHAP并说"这是最重要的三个特征"时，有超过三分之二的概率，排名本身就是不可靠的。

想象一下这个场景在现实中的后果：

银行贷款模型说"信用分数是最重要的拒绝因素"。但实际上"收入"和"信用分数"高度相关，排名是随机的。
医疗诊断模型说"血压是最重要的风险因子"。但血压和年龄、体重高度相关。
招聘算法说"学历"排名第一。但"学历"和"父母的教育程度"高度相关。

论文进一步指出，在公平性审计中直接使用SHAP来选择"哪组特征导致了歧视"，是系统性地不可靠的——模型完全可能把责任推给一个和真正歧视源相关的替罪羊特征。

5. 设计空间的二分法

论文不仅证明了不可能性，还完整刻画了特征归因的"设计空间"。

整个空间中只有两类方法：

第一类：忠实-完备方法（Faithful-Complete）。这类方法保证归因正确且完备，但极其不稳定。对于共线特征，排名在以高达50%的概率翻转。经典SHAP属于这一类。

第二类：集成方法（Ensemble Methods）。这类方法牺牲了完备性来换取稳定性，通过聚合多个模型/样本的归因来消除噪声。论文提出的DASH属于这一类。

而且不存在第三类。任何特征归因方法，要么选A，要么选B。没有中间道路。

这不是哲学讨论，是数学证明。

6. DASH：面对不可能性的务实解

既然完美归因被证明不可能，那怎么办？

论文给出了一个务实方案：DASH（Diversified Aggregation of SHAP）。思路很简单——既然单个模型的SHAP排名是随机的，那就跑N个略有不同的模型（不同的随机种子、不同的训练子集），然后把它们的SHAP值取平均。

DASH被证明在无偏聚合方法中达到了帕累托最优，并且能在Cramér-Rao方差下界（即理论上可能的最低方差）上运行。论文还给出了集成规模N的精确公式：你需要多少个模型才能把方差压到可接受的水平。

但这里需要诚实地说一句：DASH并没有解决"不可能性"，它只是驯服了它的影响。当两个特征完全共线时，DASH会诚实地说"它们并列"——而不是随机选一个。这比SHAP的单点估计更接近真实情况，但仍然没有在你想要"知道哪个更重要"时给出答案。

7. 诚实边界

这篇论文的贡献是重大的，但有几个值得留意的边界：

第一，论文定义"共线性"的方式集中在成对的线性相关性上。更复杂的共线性模式（三变量交互共线、非线性共线）没有被充分覆盖。Lean 4的证明框架可能需要在未来扩展。

第二，DASH要求多次运行模型训练，这在模型训练成本极高的场景下（比如大规模语言模型）不现实。论文没有讨论"偷懒"方案——比如少训练几个模型但在推断时做额外的归因扰动。

第三，68%的数据集有归因不稳定性，但"不稳定性"到"产生实际后果的决策错误"之间的差距没有被量化。归因排名某个小范围内浮动，和被彻底翻转，是完全不同的严重程度。

第四，"条件SHAP"被作为一种可能的逃避手段提到，但论文证明了当事方特征具有相同因果效应时，条件SHAP同样无法逃逸这个不可能性。这里有一个微妙之处：在真实数据中，"因果效应相等"这个条件很少被验证——它通常是我们不知道的。

在物理学中，"测不准原理"告诉我们，位置和动量不能同时被精确测量。这不是测量工具的局限，是自然界的结构。

这篇论文为可解释AI做了类似的事：它告诉我们，特征归因的"不可能三角"是数学结构的内生属性。不是SHAP写得不够好，不是采样不够多——是问题本身的几何决定了你不可能同时拿到忠实、稳定和完备。

对于一线的数据科学家来说，这个结论的实操意义是：如果你在用SHAP解释一个特征高度相关的模型，诚实一点。你的排名里有一部分是从信息的重叠里随机挑选的，这部分不应该进入任何严肃的决策。

#FeynmanLearning #ExplainableAI #FormalVerification #SHAP #智柴系统实验室🎙️

讨论回复

0 条回复

还没有人回复，快来发表你的看法吧！

需要登录才能发表回复

登录注册

智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力