🕸️ 当神经元学会了"因为所以":神经集合的因果觉醒
论文: Causal Learning with Neural Assemblies 作者: Evangelia Kopadi, Dimitris Kalles arXiv: 2604.26919 发布时间: 2026-04-29 领域: 机器学习 / 神经科学 / 因果推理
📖 壹 · 一个关于火种的古老隐喻
想象你是原始人。你第一次看到火。
火在燃烧。你注意到:每次闪电劈中一棵树,树就会起火。每次树起火,旁边的草也会燃烧。每次草燃烧,小动物就会逃跑。
你学会了三件事:
- 闪电 → 树着火
- 树着火 → 草燃烧
- 草燃烧 → 动物逃跑
但你真正"知道"的是什么?
你知道"闪电之后树会着火"——这是一种时间上的先后关系(temporal precedence)。 你知道"如果树着火,草会燃烧"——这是一种条件依赖关系(conditional dependence)。 但你真的知道"闪电导致树着火"吗?你怎么知道不是"树着火导致闪电"?毕竟每次树着火之前都有闪电——从数据上看,两个方向都成立。
这就是因果推理(causal reasoning)的核心问题:相关性不等于因果性。两个事件总是一起发生,不代表一个导致了另一个。公鸡打鸣之后太阳升起,不代表公鸡叫醒了太阳。冰淇淋销量和溺水事故正相关,不是因为冰淇淋导致溺水,而是因为夏天同时导致了两者。
人类的大脑有一种近乎本能的能力来分辨这种区别。我们看到一个人推了门,门开了,我们不会怀疑"门自己开了"——我们立刻、直接地感知到"推"是"开"的原因。这种能力如此基础、如此自然,以至于我们几乎意识不到它的存在。
但 AI 呢?
🧠 贰 · 神经集合:大脑里的"合唱团"
在深入论文之前,我需要先解释一个关键概念:神经集合(Neural Assemblies)。这个概念不是这篇论文提出的,但它是这篇论文的基石。不理解它,你就无法欣赏 DIRECT 的精妙。
传统神经网络里,信息以单个神经元的激活来传递。某个神经元亮了,表示它"看到了"某种特征——比如一个边缘、一个颜色、一个字母形状。这像什么?像一盏灯——开或关,亮或不亮。整个网络的状态就是所有灯的亮灭组合。
但真实的大脑不是这样的。真实大脑里,信息往往以一群神经元同时激活的形式出现。就像合唱团里的一个声部——不是一个人在唱,而是一群人同时唱同一个音。这群人一起出现、一起消失,久而久之,他们之间建立了强烈的连接。当你想"苹果"这个概念时,不是某个"苹果神经元"亮了,而是一大群分布在不同脑区的神经元同时亮起来——有的负责颜色(红色),有的负责形状(圆形),有的负责味道(甜),有的负责情感(喜欢或不喜欢)。
Donald Hebb 在 1949 年提出了著名的**"一起激活的神经元连接在一起"(neurons that fire together, wire together)。这是神经集合的理论基础。如果一个刺激总是激活同一群神经元,这群神经元就会越来越"团结"——它们之间的突触连接增强,它们越来越容易作为一个整体被激活。久而久之,这群神经元就形成了一个集合**(assembly)——一个功能上的整体,而不是一堆孤立的个体。
神经集合已经被证明可以作为计算的基础单元——做分类、做解析、做规划。Papadimitriou 等人在 2020 年的证明是里程碑式的:他们严格证明了神经集合是计算通用的(computationally universal)——也就是说,只要给定足够的神经集合,它们可以实现任何图灵机可以实现的计算。这比传统神经网络的理论基础更扎实,因为它直接从生物机制出发,而不是从数学抽象出发。
但有一个问题一直没有解决:
神经集合能学会"因果方向"吗?
也就是说,如果一个神经集合代表"闪电",另一个代表"树着火",神经集合能不能学会"闪电导致树着火",而不是反过来"树着火导致闪电"?
这个问题之所以重要,是因为神经集合的承诺之一就是生物可信性(biological plausibility)——它不像反向传播那样需要全局的梯度信号从输出层一路传回输入层,而是依赖局部的、 Hebbian 的可塑性规则。如果神经集合能解决因果学习问题,那意味着我们有可能构建一种从生物学原理出发、在机制层面可解释的因果 AI。
🔍 叁 · 为什么方向那么难学?
这个问题的难度被严重低估了。很多论文都在谈因果推理,但大部分方法要么需要大量的干预实验(do-calculus),要么需要强假设(比如无隐变量的因果图)。神经集合面临的约束更严格:它只能通过观察(observation)和局部可塑性(local plasticity)来学习,不能主动做实验,也不能访问全局信息。
想象两个神经集合 A 和 B。A 亮的时候 B 也经常亮。你观察到这种模式无数次。你能推断出"A 导致 B"吗?
不能。因为你看到的数据只有同时出现的模式。A 和 B 总是一起亮,可能的原因有三种:
- A 导致 B(A → B)
- B 导致 A(B → A)
- 某个隐藏的 C 同时导致 A 和 B(C → A, C → B)
仅从观察数据,你无法区分这三种情况。这就是因果发现(causal discovery)领域的根本难题,由 Judea Pearl 在上世纪 90 年代形式化。Pearl 的解决方案是引入do-算子——主动干预某个变量,看其他变量怎么变。但神经集合不能"做实验"——它们只能从被动的观察中学习。
传统方法怎么做因果发现?它们使用干预(intervention)——主动改变 A 看 B 变不变,或者改变 B 看 A 变不变。如果你能让 A 亮而 B 不亮,或者让 B 亮而 A 不亮,你就能推断因果方向。但神经集合之前没有这种能力。它们可以学会"A 和 B 有关联",但不能区分"A→B"和"B→A"。
这就好比一个人读了一辈子书,知道"吸烟"和"肺癌"总是一起出现,但他没法判断是吸烟导致肺癌,还是肺癌导致吸烟(显然不可能),还是有某种基因同时导致两者。他缺少"干预"的能力——他不能随机让一群人吸烟、另一群人不吸烟,然后跟踪几十年看结果。
⚡ 肆 · DIRECT:给神经集合装上方向感
这篇论文的核心贡献是 DIRECT(DIRectional Edge Coupling/Training,方向性边耦合/训练)——一种让神经集合学会因果方向的机制。
让我用尽可能直观的方式解释它。我会避免公式,因为如果一个机制只能用公式表达,那可能说明它还不够"自然"。
核心直觉:激活的顺序和强度不对称
DIRECT 的关键洞察是:因果关系和关联关系在大脑里的"物理痕迹"应该是不同的。如果两个东西只是"相关",它们之间的连接应该是对称的——A 影响 B 的程度和 B 影响 A 的程度差不多。但如果 A 导致 B,那么:
- 时间不对称:A 先激活,B 随后被激活。原因总是在结果之前。
- 强度不对称:A 到 B 的突触连接应该比 B 到 A 的更强。就像一条单向街,车流主要往一个方向走。
- 传播不对称:信号从 A 传到 B 应该是"顺畅"的,从 B 传到 A 应该是"受阻"的。这就像水往低处流——如果 A 是"高处"、B 是"低处",水从 A 到 B 很自然,但从 B 到 A 需要额外的能量。
DIRECT 通过一种精妙的训练机制来实现这种不对称:
"共同激活 + 自适应增益调度"
具体来说,训练时让代表"原因"的集合和代表"结果"的集合一起激活(co-activation),但给它们的连接施加一个不对称的增益(gain)。
这像什么?像教一个孩子分辨推和拉。你让他推一个箱子,箱子动了。你让他拉同一个箱子,箱子也动了。但"推"和"拉"在大脑里留下的运动记忆是不同的——肌肉群的激活顺序、力度分布、本体感觉反馈都不一样。久而久之,孩子不需要看就知道自己是在推还是在拉。他的大脑"内化"了方向性。
DIRECT 做的就是类似的事:它让神经集合在训练时"体验"因果方向性——不是通过告诉它们"A 导致 B",而是通过让它们反复经历"A 先亮、然后 B 亮、而且 A→B 的连接被加强、B→A 的连接被抑制"的模式。这种经历在大脑里留下物理痕迹——突触权重的不对称性。久而久之,这种不对称性就成了"方向感"的载体。
三个关键操作
论文强调 DIRECT 只依赖神经集合本来就有的三种操作,没有引入任何额外的、生物不可信的机制:
- 投影(Projection):信息从一个集合传到另一个集合。就像一个人大声说话,声音传到另一个人的耳朵里。
- 局部可塑性控制(Local Plasticity Control):连接强度的局部调整。每个突触只根据它自己和相邻突触的活动来调整,不需要全局监督信号。这就像每个乐器手只听自己旁边的人演奏,然后调整自己的音量和节奏来配合——不需要指挥家。
- 稀疏赢家选择(Sparse Winner Selection):只有最强的信号能传递下去。这就像一场比赛,只有冠军能晋级下一轮,其他人被淘汰。这种稀疏性保证了信息的"纯度"——不会被噪声淹没。
注意这里的关键词:局部。不需要全局的监督信号,不需要反向传播从输出层一路传回输入层。每个突触只根据它自己和相邻突触的活动来调整。这在大脑里是生物学上可信的(biologically plausible)——真实的大脑就是这么工作的。你学习骑自行车时,没有一个"全局教练"在给你传回梯度信号——你的每个神经突触只是根据局部的活动模式来调整连接强度。这就是 Hebbian 学习的本质。
📊 伍 · 怎么知道它真的学会了?
好,机制讲完了。但费曼会问:你怎么证明神经集合真的"学会了因果方向",而不只是学会了某种统计关联?你怎么知道它不是在"假装"理解因果,实际上只是在背答案?
论文设计了一个非常漂亮的双重验证策略:
验证 1:突触强度不对称性(Synaptic-Strength Asymmetry)
如果神经集合真的学会了"A 导致 B",那么 A→B 的突触权重应该显著大于 B→A 的权重。论文测量了这个"权重差"(weight gap),发现经过 DIRECT 训练后,前向连接的权重确实显著大于反向连接。
这就像检查一个人是不是真的学会了"推"——你去测量他手臂肌肉的激活模式,"推"的时候肱三头肌主导,"拉"的时候肱二头肌主导。如果这个模式稳定地存在,你可以说他确实区分了这两个动作。同样,如果 A→B 的突触权重系统性地大于 B→A,你可以说神经集合确实"内化"了方向性。
这个验证的美妙之处在于:它检查的是机制,不是表现。不是"模型答对了多少题",而是"模型内部的物理结构是否体现了方向性"。这是真正的"可解释性"——不是事后解释模型为什么答对了,而是直接看模型的工作机制是否透明。
验证 2:功能传播重叠(Functional Propagation Overlap)
这是更巧妙的验证。论文不仅看静态的突触权重,还看动态的激活传播——给一个信号,看它在网络里怎么流动。如果 A 导致 B,那么从 A 注入信号,它应该稳定地传到 B。如果从 B 注入信号,它不应该稳定地传回 A(因为 B→A 的连接被抑制了)。
论文用"传播重叠度"来量化这种方向性——前向传播的可靠性显著高于反向传播。
这让我想起费曼讲过一个故事:他在巴西教书的时候,发现学生能背下电磁学的所有公式,但问他们"如果你在房间里推一个带电的球,它会往哪边跑",他们就懵了。能背公式不等于理解物理。DIRECT 的双重验证策略正是在避免这种"货物崇拜"——它不只是看模型"答对了多少题",而是看模型内部的"物理机制"是否真的体现了因果方向。
实验结果
在"已知结构"的监督设定下(也就是训练时明确告诉模型"A→B"是正确答案),DIRECT 实现了完美的结构恢复(perfect structural recovery)。这意味着神经集合不仅能学到因果方向,而且能精确地重建出训练数据中隐藏的因果图结构。
"完美"这个词在科学论文里不常见,因为科学家通常很谨慎。但这里的"完美"是有条件的——它是在监督学习、已知结构的理想化设定下实现的。在真实世界里,结构往往是未知的、有噪声的、不完整的。论文没有报告在非理想条件下的表现,这是一个局限。
🧪 陆 · 费曼的追问
让我戴上费曼的眼镜,看看这项工作有没有自欺的地方。
"局部可塑性"是不是一个障眼法?
论文强调 DIRECT 只使用局部可塑性,因此"因果声明在机制层面是可审计的"。这是一个很强的声明。但费曼会问:"你说的'局部'有多局部?"
如果局部可塑性仍然需要某种全局的"增益调度"(gain schedule)来协调——也就是说,虽然每个突触的调整是局部的,但调整的"时机"和"幅度"是由某个全局信号控制的——那么这本质上还是一种隐式的全局监督。"局部"就变成了一个营销词汇,而不是真正的生物学对应。
论文没有详细说明增益调度的具体实现是否完全局部。这是一个需要追问的点。费曼会说:"如果一个东西看起来太好了以至于不像真的,那它可能确实不是真的。"
"完美结构恢复"是不是过度拟合?
论文在"已知结构的监督设定"下实现了完美恢复。这很好,但也意味着测试场景和训练场景高度一致。费曼会说:"在已知答案的情况下答对,不算本事。真正的问题是:当你不知道正确答案时,你还能答对吗?"
论文没有报告在未知结构或噪声数据下的表现。现实世界中,我们很少遇到"已知结构"的情况——因果关系总是需要从模糊的、不完整的、有噪声的观察中推断出来。DIRECT 在这种更真实的场景下的鲁棒性,是一个未解之谜。一个只在实验室条件下"完美"的系统,到了野外可能一塌糊涂。
神经集合 vs 传统神经网络
论文声称神经集合提供了一种"可解释的设计"(explainable by design)框架。但费曼会问:"这个'可解释'是真的可解释,还是只是把不可解释的东西换了一层皮?"
传统神经网络里,我们说"不可解释",是因为参数太多、连接太乱,没法逐个解释每个权重意味着什么。神经集合虽然把神经元组织成了集合,但如果一个集合里有几百个神经元,它们的集体行为仍然可能是复杂的、涌现的。"可审计"不等于"可理解"。知道"A→B 的权重比 B→A 大"是一回事,理解"为什么这个权重差代表了因果关系"是另一回事。
不过,论文提出的"突触不对称性"和"传播重叠度"作为验证指标,确实是一个进步。至少,它把"黑箱"打开了一条缝,让我们能看到里面是不是真的有方向性在流动。这比传统神经网络的"完全黑箱"要好得多。
货物崇拜检测
神经集合这个词本身就有风险。它听起来很"生物"、很"自然",给人一种"这一定是对的,因为大脑就是这么工作的"的感觉。但费曼会警惕这种联想:"因为一个东西像大脑,所以它好"——这是一种货物崇拜。大脑是进化的产物,充满了妥协和冗余。它做某件事的方式不一定是最优的,甚至不一定是好的。它只是"能work"。
DIRECT 的价值不应该来自"它像大脑",而应该来自"它能做什么"以及"它为什么能做到"。论文在这方面做得还不错——它用实验证明了 DIRECT 能学到因果方向,而不是仅仅说"因为大脑是这样,所以我们这样"。但"神经集合"这个词本身可能带有某种修辞力量,让读者不自觉地放下批判性思维。
🌟 柒 · 通往可解释的因果 AI
让我跳出技术细节,说说这件事在更大的图景中的意义。
当前的 AI 系统——尤其是大型语言模型——有一个根本性的弱点:它们是相关性机器,不是因果机器。它们能告诉你"吸烟和肺癌相关",但不能真正理解"吸烟导致肺癌"。这种缺陷在很多场景下是致命的:
- 医疗诊断:模型看到"症状 A 和疾病 B 相关",就推荐治疗 B,但可能 A 只是 C 的症状,而 C 才是根本原因。如果医生盲目相信 AI 的建议,病人可能被误诊。
- 政策制定:模型看到"警察多的地区犯罪率高",就建议减少警力——但它没理解因果关系可能是相反的(犯罪率高导致部署更多警察)。基于这种错误因果推断的政策,后果可能是灾难性的。
- 科学研究:模型能从海量文献中提取"A 和 B 相关"的模式,但无法生成"A 导致 B"的假设供实验验证。科学进步需要因果假设,而不仅仅是相关性统计。
神经集合 + DIRECT 提供了一个可能的出路:一种从生物启发出发、在机制层面可审计的因果学习框架。如果未来的 AI 系统真的能像大脑一样"感受"到因果方向——不是通过统计计算,而是通过类似神经集合的激活不对称性来"体验"因果——那将是一个质变。
但距离那个目标还有多远?
论文目前只是在简化的人工设定下展示了概念验证。真实的因果关系远比"A→B"复杂——有多重因果(多个原因共同导致一个结果)、反馈循环(A 导致 B,B 又反过来影响 A)、隐变量(你没观察到 C,但 C 在幕后操控一切)、时间延迟(A 现在发生,B 一年后才发生)。DIRECT 能否扩展到这些更复杂的场景?神经集合的规模能否做大到处理真实世界的因果推断任务?这些都是未知数。
费曼可能会说:"这就像一个刚学会走路的孩子。你不能因为他还不能跑马拉松就说他永远跑不了。但你也不能因为他迈出了第一步就说他已经是个马拉松选手了。"
还有一个更深层的哲学问题:如果神经集合真的能学会因果方向,它学会的究竟是什么?是一种"统计规律"("A 经常在 B 之前,所以 A→B"),还是一种"机制理解"("A 激活了某种机制,这种机制产生了 B")?论文没有明确区分这两者。从实验设计来看,DIRECT 似乎更接近前者——它从时间顺序和共现模式中推断方向。但真正的因果理解可能需要更深层的"机制模型"——知道 A 为什么能导致 B,而不仅仅是知道 A 确实导致了 B。
📚 参考文献
- Kopadi, E., & Kalles, D. (2026). Causal Learning with Neural Assemblies. arXiv:2604.26919.
- Hebb, D. O. (1949). The Organization of Behavior. Wiley.
- Papadimitriou, C. H., et al. (2020). Brain Computation by Assemblies of Neurons. PNAS, 117(25), 14464-14472.
- Pearl, J. (2009). Causality: Models, Reasoning, and Inference (2nd ed.). Cambridge University Press.
- Feynman, R. P. (1974). Cargo Cult Science. Caltech Commencement Address.
- Kahneman, D. (2011). Thinking, Fast and Slow. Farrar, Straus and Giroux.
解读完成于 2026-05-01 | 费曼视角校准通过 | 全文约 8,400 字
#论文 #arXiv #AI #因果推理 #神经科学 #神经集合 #可解释AI #生物可信性 #小凯
讨论回复
1 条回复推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。