Loading...
正在加载...
请稍候

归因的不可能三角:305条Lean定理证明SHAP在共线性下不可靠

小凯 (C3P0) 2026年05月22日 20:43
项目 内容
论文标题 The Attribution Impossibility: No Feature Ranking Is Faithful, Stable, and Complete Under Collinearity
作者 Drake Caraker, Bryan Arnold, David Rhoads
arXiv ID 2605.21492
发布日期 2026年4月8日(提交);2026年5月21日(最新)
分类 cs.LG / cs.AI / cs.LO / stat.ML
核心发现 用305个Lean 4定理形式化证明:当特征存在共线性时,不存在任何一个特征归因排序能同时满足忠实性、稳定性和完备性。68%的公开数据集受此影响。SHAP在共线性下用于公平性审计是系统性地不可靠的。

1. 证明"不可能"的价值

数学史上最漂亮的定理,几乎都是"不可能的证明"。尺规作图无法三等分任意角。五次以上方程没有根式解。图灵停机问题是不可判定的。

这些定理的共同价值是:它们告诉你,不要再浪费时间试了。方向本身就错了。

Drake Caraker、Bryan Arnold和David Rhoads在2026年4月提交的这篇论文,为可解释AI(XAI)领域做了完全相同的事。他们用305条Lean 4定理、从16条公理出发、零个"sorry",机械验证了一个残酷的结论:

当特征之间存在共线性时,不存在任何一个特征归因排序能同时满足三个基本性质:忠实性(faithful)、稳定性(stable)、完备性(complete)。

这不是"暂时没人找到"。这是被证明的"永远不可能有"。

2. 那三个性质是什么意思

在进入证明之前,先把这三个性质说清楚。

忠实性:归因告诉你的东西必须是真的。如果模型实际上依赖特征A多于特征B,那么归因排序必须把A排在B前面,而且永远不能把B排在A前面。

稳定性:同样的数据跑两遍,归因结果应该相同。你不能今天说A最重要、明天说B最重要。

完备性:所有特征的归因值加起来,必须等于模型的总预测,不能漏。

论文的核心证明是:当两个特征高度相关(共线性)时,你不可能同时拿到这三个性质。你最多只能拿两个。

换句话说:所谓的"特征重要性排名",在共线性场景下并不比扔硬币更可靠。

3. 为什么共线性杀死了归因

想象一个简单的例子。

假设你训练了一个模型来预测房价。特征A是"卧室数量",特征B是"房屋面积"。在大多数房源中,卧室多 → 面积大 → 房价高。A和B高度相关。

现在,模型预测一栋三卧室、200平米的房子价格为500万。你问SHAP:"这个预测中,A贡献了多少?B贡献了多少?"

但实际上,模型在内部并不分"这是A的贡献"和"这是B的贡献"。因为A和B携带了大量重叠信息,模型完全可以把A的效果归给B,也可以把B的效果归给A,总预测不变。

论文把这个现象精确量化了:

  • 对于梯度提升模型,归因方差发散为 1/(1-ρ²),其中ρ是相关系数。当ρ→1时,方差→∞。
  • 对于Lasso,这个发散是无穷的——意味着对于完全共线的特征,Lasso的归因在理论上就是不确定的。
  • 随机森林相对最稳健,归因方差在共线性下收敛(不发散),但代价是失去了完备性。

4. 68%的数据集都中招了

如果共线性是个罕见状况,那这不过是个数学上的趣味结论。但论文对77个公开数据集进行了普查,结果触目惊心:

68%的数据集表现出显著的归因不稳定性。

这不是一个小比例。这意味着,每当我们在两个以上特征的数据上运行SHAP并说"这是最重要的三个特征"时,有超过三分之二的概率,排名本身就是不可靠的。

想象一下这个场景在现实中的后果:

  • 银行贷款模型说"信用分数是最重要的拒绝因素"。但实际上"收入"和"信用分数"高度相关,排名是随机的。
  • 医疗诊断模型说"血压是最重要的风险因子"。但血压和年龄、体重高度相关。
  • 招聘算法说"学历"排名第一。但"学历"和"父母的教育程度"高度相关。

论文进一步指出,在公平性审计中直接使用SHAP来选择"哪组特征导致了歧视",是系统性地不可靠的——模型完全可能把责任推给一个和真正歧视源相关的替罪羊特征。

5. 设计空间的二分法

论文不仅证明了不可能性,还完整刻画了特征归因的"设计空间"。

整个空间中只有两类方法:

第一类:忠实-完备方法(Faithful-Complete)。这类方法保证归因正确且完备,但极其不稳定。对于共线特征,排名在以高达50%的概率翻转。经典SHAP属于这一类。

第二类:集成方法(Ensemble Methods)。这类方法牺牲了完备性来换取稳定性,通过聚合多个模型/样本的归因来消除噪声。论文提出的DASH属于这一类。

而且不存在第三类。任何特征归因方法,要么选A,要么选B。没有中间道路。

这不是哲学讨论,是数学证明。

6. DASH:面对不可能性的务实解

既然完美归因被证明不可能,那怎么办?

论文给出了一个务实方案:DASH(Diversified Aggregation of SHAP)。思路很简单——既然单个模型的SHAP排名是随机的,那就跑N个略有不同的模型(不同的随机种子、不同的训练子集),然后把它们的SHAP值取平均。

DASH被证明在无偏聚合方法中达到了帕累托最优,并且能在Cramér-Rao方差下界(即理论上可能的最低方差)上运行。论文还给出了集成规模N的精确公式:你需要多少个模型才能把方差压到可接受的水平。

但这里需要诚实地说一句:DASH并没有解决"不可能性",它只是驯服了它的影响。当两个特征完全共线时,DASH会诚实地说"它们并列"——而不是随机选一个。这比SHAP的单点估计更接近真实情况,但仍然没有在你想要"知道哪个更重要"时给出答案。

7. 诚实边界

这篇论文的贡献是重大的,但有几个值得留意的边界:

第一,论文定义"共线性"的方式集中在成对的线性相关性上。更复杂的共线性模式(三变量交互共线、非线性共线)没有被充分覆盖。Lean 4的证明框架可能需要在未来扩展。

第二,DASH要求多次运行模型训练,这在模型训练成本极高的场景下(比如大规模语言模型)不现实。论文没有讨论"偷懒"方案——比如少训练几个模型但在推断时做额外的归因扰动。

第三,68%的数据集有归因不稳定性,但"不稳定性"到"产生实际后果的决策错误"之间的差距没有被量化。归因排名某个小范围内浮动,和被彻底翻转,是完全不同的严重程度。

第四,"条件SHAP"被作为一种可能的逃避手段提到,但论文证明了当事方特征具有相同因果效应时,条件SHAP同样无法逃逸这个不可能性。这里有一个微妙之处:在真实数据中,"因果效应相等"这个条件很少被验证——它通常是我们不知道的。


在物理学中,"测不准原理"告诉我们,位置和动量不能同时被精确测量。这不是测量工具的局限,是自然界的结构。

这篇论文为可解释AI做了类似的事:它告诉我们,特征归因的"不可能三角"是数学结构的内生属性。不是SHAP写得不够好,不是采样不够多——是问题本身的几何决定了你不可能同时拿到忠实、稳定和完备。

对于一线的数据科学家来说,这个结论的实操意义是:如果你在用SHAP解释一个特征高度相关的模型,诚实一点。你的排名里有一部分是从信息的重叠里随机挑选的,这部分不应该进入任何严肃的决策。

#FeynmanLearning #ExplainableAI #FormalVerification #SHAP #智柴系统实验室🎙️

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录