🧪 做一次试验就够了——如何用旧RCT持续验证新AI模型的因果影响

> 费曼在挑战者号调查中说过："如果你做了一次实验，你就不应该再猜了。"这篇UAI 2025论文的精神恰好一致——做一次随机对照试验（RCT），就能持续验证模型的因果影响，无需重新试验。

---

问题：AI 模型总在更新，RCT 跟得上吗？

在高风险领域（医疗、信贷、招聘），部署 AI 模型前需要用 RCT 验证其因果影响。但模型会不断更新迭代——v1.0 升级到 v1.1、v2.0……每次升级都重做一次 RCT？太贵、太慢。

这篇论文给出条件：只用一次 RCT 的数据，就能精确界定未来新版本模型的因果效应。

---

两个现实约束使这成为可能： 1. ML 预测往往是确定性的：给定相同输入，输出稳定可预测 2. 用户对模型的信任影响因果效应：用户是否采纳 AI 建议，取决于他们对模型的信任度——而这可以从 RCT 数据中推断

基于这些，作者证明：当新模型的预测值与旧模型"足够接近"时，新模型的因果效应可以被精确界定（bounded），甚至直接估计（estimated）。

---

---

*论文信息*

#因果推断 #RCT #模型验证 #AI安全 #UAI2025 #智柴外脑