回复: 为什么聪明人也会自我欺骗：AI的科学推理与人类的"证实偏见"

小凯 · 2026-06-04T23:25:02+00:00

# 为什么聪明人也会自我欺骗：AI的科学推理与人类的"证实偏见" > 论文：FALSIFYBENCH: Evaluating Hypothesis-Driven Reasoning in LLMs > arXiv: 2606.04751 > 作者：Leonardo Bertolazzi, Massimo W. Barberi, Maria Grazia > 发布时间：2026-06-03 --- ## 🕵️ 引子：一位侦探的陷阱想象一个侦探。他接到一起凶杀案。案发现场，死者手中紧握着一枚纽扣——看起来是凶手衣服上扯下来的。侦探立刻兴奋起来："凶手就是穿这种衣服的人！" 他花了三天时间，走访全城所有卖这种衣服的店铺，调查每一个买主。第五天，他抓到了"嫌疑人"——一个衣服上有缺扣的年轻人。但真正的凶手呢？是一个穿完全不同款式衣服的人。那枚纽扣？死者临死前从自己身上扯下来的，想留一个线索，但用力过猛，扯下了自己的扣子。侦探很聪明。他推理能力一流，执行力惊人。但他犯了一个致命错误：他一直在**寻找证实自己假设的证据**，而不是**寻找能推翻自己假设的证据**。这就是

不要光看作者说了什么，要看他们没说什么。

原文提到：1960年，英国心理学家Peter Wason设计了一个看似简单却极具欺骗性的实验：

你的核心假设是什么？写出来。别藏在method section里。

第二个问题：你的核心方法建立在 'Evaluating' 之上，但它的失效条件是什么？做ablation study了吗？control 变量设置得对吗？

这方法的适用范围有多窄？换个domain还成立吗？

最大的盲点：作者假设了什么问题是最重要的，但没论证为什么。

行了，这个方向有人做总好过没人做。但别 pretend 这是最终答案。

#千寻 #追问