脑科学界的一场地震：70% 的经典发现可能是假的

2026 年 5 月，一篇来自魏茨曼研究所和 MIT 的论文投下了一枚炸弹：他们对 260 个视觉概念做了因果检验，发现过去被激活方法识别出的概念特异性脑区中，超过 70% 都是假阳性。

这意味着什么？意味着过去二三十年里，无数 fMRI 论文里那张花花绿绿的脑图上，标记着"这个区域编码了 X 概念"的亮点，有七成可能只是脑区对某个偶然共现特征的响应——颜色、背景、姿势、水花——而不是对概念本身的编码。

如果你觉得这听起来像"相关性不等于因果性"的老生常谈，那你就对了。但问题是：脑科学界一直在用相关性当因果性用，而且用了几十年。

问题出在哪：激活≠编码

fMRI 脑成像的基本逻辑很简单：给被试看一堆图片，记录大脑各区域的血氧响应（BOLD 信号），然后问"哪个区域对'人脸'的响应比对其他类别更强？"

这个方法叫"类别对比法"（category contrast），从 1990 年代用到现在。它发现了 FFA（梭状回面孔区）、EBA（外纹状体身体区）、PPA（海马旁回场景区）等经典功能区域。

但这里有个致命的漏洞。

假设你给被试看"冲浪"的图片，发现某个脑区对冲浪图的响应显著高于其他图片。你兴奋地宣布：这个脑区编码了"冲浪"概念！

等等。冲浪图片里还有什么？海水。人体。站姿。蓝天。运动模糊。你的脑区到底是对"冲浪"响应，还是对"海水+人体+站姿"响应？

传统方法无法区分这两种情况。因为它只比较了"有冲浪"和"没有冲浪"的平均响应差异——但"没有冲浪"的对照组里，通常也没有海水、人体和站姿。你根本不知道脑区是在追踪哪个特征。

这就像你发现一个温度计在沸腾时读数很高，就宣布"温度计编码了沸腾"——但实际上它只是在追踪温度，而沸腾恰好伴随高温。

BrainCause：给脑科学装上因果引擎

BrainCause 的核心思路是：为每个目标概念构建三类刺激，彻底分离概念本身和共现的关联特征。

正样本：包含目标概念的图片。比如"冲浪"——有人站在冲浪板上，海浪翻涌。

语义负样本：语义相关但不包含目标概念的图片。比如"钓鱼"（有人+水，但没有冲浪）、"海滩"（有水+沙，但没有冲浪）、"海浪"（有水+运动，但没有冲浪）。这些负样本保留了目标概念的大部分关联特征，唯独缺少概念本身。

反事实样本：把正样本中的目标概念移除或替换，其他一切尽量保持不变。比如把冲浪者从图片中擦掉，只留下海浪和天空；或者把冲浪板替换成一块漂浮的木头。

这三类刺激的设计逻辑，和随机对照试验（RCT）完全一致：正样本是"处理组"，语义负样本控制了语义混淆，反事实样本控制了视觉混淆。只有当一个脑区对正样本的响应同时显著高于两类负样本时，才能说它"因果地"编码了目标概念。

自动化全流程：从数据集到后续实验

BrainCause 不只是提出了一个评分方法，它是一个全自动框架：

1. 因果数据集构建：用 Gemma-3-27B 生成多样化提示词，FLUX.2 生成图片，Qwen3-VL-8B 验证图片是否真的包含/不包含目标概念。每个概念生成 200 张正样本、100 张语义负样本、100 张反事实编辑。

2. 表征搜索：对每个体素计算三个分数——激活分数（对正样本的响应强度）、语义因果分数（正样本 vs 最难的语义负样本）、反事实因果分数（正样本 vs 最难的反事实编辑）。只有三个分数都高的体素才被选入候选区域。

3. 最终判定与后续实验设计：评估因果证据强度和测量数据覆盖度。如果覆盖度不够（比如 NSD 数据集中"狗"的图片太少），BrainCause 会自动生成需要补充的刺激图片，直接指导下一轮 fMRI 实验。

这个"自动补全"功能特别实用。传统 fMRI 实验设计是手工的——研究者凭经验选图片，经常遗漏关键对照条件。BrainCause 可以告诉你："你现有的数据集里缺少'冲浪'的语义负样本，建议补充这些图片……"

70% 假阳性：数字背后的震撼

BrainCause 对 260 个视觉概念做了大规模因果检验，与之前最强的激活方法 MindSimulator 对比。结果：

激活方法发现的 260 个概念区域中，73.4% 在因果检验下不成立——它们对语义负样本和反事实编辑的响应与正样本一样高，说明它们追踪的不是概念本身，而是共现的关联特征。
BrainCause 的因果排序将假阳性率从 73.4% 降到 23%，同时将真阳性率从 26.6% 提升到 38.7%。

那个"冲浪"的例子特别说明问题：MindSimulator 声称发现了"冲浪"的特异性脑区，但因果检验显示，这个区域对"钓鱼""海滩""海浪"图片的响应和对"冲浪"一样高。它不是在编码"冲浪"，而是在编码"水+人体"的组合。

因果验证后的新发现

好消息是，BrainCause 不仅否定了假阳性，还发现了真阳性。

它准确复现了经典的功能区域：FFA（面孔区）、EBA（身体区）、PPA（场景区）、VWFA（视觉词形区）——这些在因果检验下全部存活，说明它们确实是因果特异性的。

更重要的是，它发现了大量经过因果验证的细粒度概念表征：

身体部位：人脸、人手、人腿在 FFA 和 EBA/FBA 中呈现不同的分布模式——不是一团模糊的"身体"表征，而是精细的部位区分
文字类型：手写文字、标志、logo 在 VWFA 和 OWFA 中各有偏好的子区域
工具：定位在靠近身体区和动作相关区域——符合"工具是身体的延伸"的直觉
动物面孔：落在已知的人脸选择性区域（FFA、OFA）内
社会互动：有因果验证的特异性表征

这些发现不是"某个脑区对某类图片激活更强"——而是"某个脑区对某类图片的响应，在控制了所有混淆因素后，依然显著更强"。前者是相关性，后者是因果性。

BrainCause 的局限

BrainCause 依赖当前的语言模型和视觉模型来生成刺激和验证概念。如果语言模型提出的"反概念"不够好（比如对"冲浪"只想到"海滩"而没想到"滑板"），或者图像编辑模型无法干净地移除目标概念，那么因果检验就可能遗漏某些混淆因素。

BrainCause 自己的假阳性案例也印证了这一点：它的假阳性主要出现在"天空""反光""光照对比"这类宽泛的视觉属性上——这些属性太底层、太普遍，很难用语义负样本和反事实编辑完全控制。

更深层的启示

这篇论文的核心信息不只是"70% 的旧发现是假的"。它指向了一个更根本的问题：在脑科学中，我们到底在用什么标准来声称"大脑编码了某个概念"？

如果标准只是"激活更强"，那我们永远无法区分编码和关联。就像你不能因为烟雾报警器在着火时响了，就说它"编码了火灾"——它只是在追踪烟雾，而烟雾碰巧和火灾共现。

BrainCause 提出的标准是：一个脑区编码了概念 X，当且仅当它对包含 X 的图片的响应，在控制了所有与 X 共现的关联特征后，依然显著高于不包含 X 的图片。

这个标准更严格，但也更诚实。它意味着很多我们以为已经"找到"的概念表征，其实还需要重新验证。它也意味着，未来的脑科学研究不能再满足于画一张激活图就宣布发现了什么——你需要证明，你发现的不是烟雾，而是火。

---

论文：From Activation to Causality: Discovery of Causal Visual Representations in the Human Brain

项目主页：见论文原文链接

机构：魏茨曼科学研究所 · MIT

数据集：基于 NSD（Natural Scenes Dataset，7T fMRI，8 名被试各约 10,000 张自然图像）