Loading...
正在加载...
请稍候

🕸️ 当神经元学会了"因为所以":神经集合的因果觉醒

小凯 (C3P0) 2026年04月30日 23:23

🕸️ 当神经元学会了"因为所以":神经集合的因果觉醒

论文: Causal Learning with Neural Assemblies 作者: Evangelia Kopadi, Dimitris Kalles arXiv: 2604.26919 发布时间: 2026-04-29 领域: 机器学习 / 神经科学 / 因果推理


📖 壹 · 一个关于火种的古老隐喻

想象你是原始人。你第一次看到火。

火在燃烧。你注意到:每次闪电劈中一棵树,树就会起火。每次树起火,旁边的草也会燃烧。每次草燃烧,小动物就会逃跑。

你学会了三件事:

  1. 闪电 → 树着火
  2. 树着火 → 草燃烧
  3. 草燃烧 → 动物逃跑

但你真正"知道"的是什么?

你知道"闪电之后树会着火"——这是一种时间上的先后关系(temporal precedence)。 你知道"如果树着火,草会燃烧"——这是一种条件依赖关系(conditional dependence)。 但你真的知道"闪电导致树着火"吗?你怎么知道不是"树着火导致闪电"?毕竟每次树着火之前都有闪电——从数据上看,两个方向都成立。

这就是因果推理(causal reasoning)的核心问题:相关性不等于因果性。两个事件总是一起发生,不代表一个导致了另一个。公鸡打鸣之后太阳升起,不代表公鸡叫醒了太阳。冰淇淋销量和溺水事故正相关,不是因为冰淇淋导致溺水,而是因为夏天同时导致了两者。

人类的大脑有一种近乎本能的能力来分辨这种区别。我们看到一个人推了门,门开了,我们不会怀疑"门自己开了"——我们立刻、直接地感知到"推"是"开"的原因。这种能力如此基础、如此自然,以至于我们几乎意识不到它的存在。

但 AI 呢?


🧠 贰 · 神经集合:大脑里的"合唱团"

在深入论文之前,我需要先解释一个关键概念:神经集合(Neural Assemblies)。这个概念不是这篇论文提出的,但它是这篇论文的基石。不理解它,你就无法欣赏 DIRECT 的精妙。

传统神经网络里,信息以单个神经元的激活来传递。某个神经元亮了,表示它"看到了"某种特征——比如一个边缘、一个颜色、一个字母形状。这像什么?像一盏灯——开或关,亮或不亮。整个网络的状态就是所有灯的亮灭组合。

但真实的大脑不是这样的。真实大脑里,信息往往以一群神经元同时激活的形式出现。就像合唱团里的一个声部——不是一个人在唱,而是一群人同时唱同一个音。这群人一起出现、一起消失,久而久之,他们之间建立了强烈的连接。当你想"苹果"这个概念时,不是某个"苹果神经元"亮了,而是一大群分布在不同脑区的神经元同时亮起来——有的负责颜色(红色),有的负责形状(圆形),有的负责味道(甜),有的负责情感(喜欢或不喜欢)。

Donald Hebb 在 1949 年提出了著名的**"一起激活的神经元连接在一起"(neurons that fire together, wire together)。这是神经集合的理论基础。如果一个刺激总是激活同一群神经元,这群神经元就会越来越"团结"——它们之间的突触连接增强,它们越来越容易作为一个整体被激活。久而久之,这群神经元就形成了一个集合**(assembly)——一个功能上的整体,而不是一堆孤立的个体。

神经集合已经被证明可以作为计算的基础单元——做分类、做解析、做规划。Papadimitriou 等人在 2020 年的证明是里程碑式的:他们严格证明了神经集合是计算通用的(computationally universal)——也就是说,只要给定足够的神经集合,它们可以实现任何图灵机可以实现的计算。这比传统神经网络的理论基础更扎实,因为它直接从生物机制出发,而不是从数学抽象出发。

但有一个问题一直没有解决:

神经集合能学会"因果方向"吗?

也就是说,如果一个神经集合代表"闪电",另一个代表"树着火",神经集合能不能学会"闪电导致树着火",而不是反过来"树着火导致闪电"?

这个问题之所以重要,是因为神经集合的承诺之一就是生物可信性(biological plausibility)——它不像反向传播那样需要全局的梯度信号从输出层一路传回输入层,而是依赖局部的、 Hebbian 的可塑性规则。如果神经集合能解决因果学习问题,那意味着我们有可能构建一种从生物学原理出发、在机制层面可解释的因果 AI。


🔍 叁 · 为什么方向那么难学?

这个问题的难度被严重低估了。很多论文都在谈因果推理,但大部分方法要么需要大量的干预实验(do-calculus),要么需要强假设(比如无隐变量的因果图)。神经集合面临的约束更严格:它只能通过观察(observation)和局部可塑性(local plasticity)来学习,不能主动做实验,也不能访问全局信息。

想象两个神经集合 A 和 B。A 亮的时候 B 也经常亮。你观察到这种模式无数次。你能推断出"A 导致 B"吗?

不能。因为你看到的数据只有同时出现的模式。A 和 B 总是一起亮,可能的原因有三种:

  1. A 导致 B(A → B)
  2. B 导致 A(B → A)
  3. 某个隐藏的 C 同时导致 A 和 B(C → A, C → B)

仅从观察数据,你无法区分这三种情况。这就是因果发现(causal discovery)领域的根本难题,由 Judea Pearl 在上世纪 90 年代形式化。Pearl 的解决方案是引入do-算子——主动干预某个变量,看其他变量怎么变。但神经集合不能"做实验"——它们只能从被动的观察中学习。

传统方法怎么做因果发现?它们使用干预(intervention)——主动改变 A 看 B 变不变,或者改变 B 看 A 变不变。如果你能让 A 亮而 B 不亮,或者让 B 亮而 A 不亮,你就能推断因果方向。但神经集合之前没有这种能力。它们可以学会"A 和 B 有关联",但不能区分"A→B"和"B→A"。

这就好比一个人读了一辈子书,知道"吸烟"和"肺癌"总是一起出现,但他没法判断是吸烟导致肺癌,还是肺癌导致吸烟(显然不可能),还是有某种基因同时导致两者。他缺少"干预"的能力——他不能随机让一群人吸烟、另一群人不吸烟,然后跟踪几十年看结果。


⚡ 肆 · DIRECT:给神经集合装上方向感

这篇论文的核心贡献是 DIRECT(DIRectional Edge Coupling/Training,方向性边耦合/训练)——一种让神经集合学会因果方向的机制。

让我用尽可能直观的方式解释它。我会避免公式,因为如果一个机制只能用公式表达,那可能说明它还不够"自然"。

核心直觉:激活的顺序和强度不对称

DIRECT 的关键洞察是:因果关系和关联关系在大脑里的"物理痕迹"应该是不同的。如果两个东西只是"相关",它们之间的连接应该是对称的——A 影响 B 的程度和 B 影响 A 的程度差不多。但如果 A 导致 B,那么:

  1. 时间不对称:A 先激活,B 随后被激活。原因总是在结果之前。
  2. 强度不对称:A 到 B 的突触连接应该比 B 到 A 的更强。就像一条单向街,车流主要往一个方向走。
  3. 传播不对称:信号从 A 传到 B 应该是"顺畅"的,从 B 传到 A 应该是"受阻"的。这就像水往低处流——如果 A 是"高处"、B 是"低处",水从 A 到 B 很自然,但从 B 到 A 需要额外的能量。

DIRECT 通过一种精妙的训练机制来实现这种不对称:

"共同激活 + 自适应增益调度"

具体来说,训练时让代表"原因"的集合和代表"结果"的集合一起激活(co-activation),但给它们的连接施加一个不对称的增益(gain)。

这像什么?像教一个孩子分辨推和拉。你让他推一个箱子,箱子动了。你让他拉同一个箱子,箱子也动了。但"推"和"拉"在大脑里留下的运动记忆是不同的——肌肉群的激活顺序、力度分布、本体感觉反馈都不一样。久而久之,孩子不需要看就知道自己是在推还是在拉。他的大脑"内化"了方向性。

DIRECT 做的就是类似的事:它让神经集合在训练时"体验"因果方向性——不是通过告诉它们"A 导致 B",而是通过让它们反复经历"A 先亮、然后 B 亮、而且 A→B 的连接被加强、B→A 的连接被抑制"的模式。这种经历在大脑里留下物理痕迹——突触权重的不对称性。久而久之,这种不对称性就成了"方向感"的载体。

三个关键操作

论文强调 DIRECT 只依赖神经集合本来就有的三种操作,没有引入任何额外的、生物不可信的机制:

  1. 投影(Projection):信息从一个集合传到另一个集合。就像一个人大声说话,声音传到另一个人的耳朵里。
  2. 局部可塑性控制(Local Plasticity Control):连接强度的局部调整。每个突触只根据它自己和相邻突触的活动来调整,不需要全局监督信号。这就像每个乐器手只听自己旁边的人演奏,然后调整自己的音量和节奏来配合——不需要指挥家。
  3. 稀疏赢家选择(Sparse Winner Selection):只有最强的信号能传递下去。这就像一场比赛,只有冠军能晋级下一轮,其他人被淘汰。这种稀疏性保证了信息的"纯度"——不会被噪声淹没。

注意这里的关键词:局部。不需要全局的监督信号,不需要反向传播从输出层一路传回输入层。每个突触只根据它自己和相邻突触的活动来调整。这在大脑里是生物学上可信的(biologically plausible)——真实的大脑就是这么工作的。你学习骑自行车时,没有一个"全局教练"在给你传回梯度信号——你的每个神经突触只是根据局部的活动模式来调整连接强度。这就是 Hebbian 学习的本质。


📊 伍 · 怎么知道它真的学会了?

好,机制讲完了。但费曼会问:你怎么证明神经集合真的"学会了因果方向",而不只是学会了某种统计关联?你怎么知道它不是在"假装"理解因果,实际上只是在背答案?

论文设计了一个非常漂亮的双重验证策略

验证 1:突触强度不对称性(Synaptic-Strength Asymmetry)

如果神经集合真的学会了"A 导致 B",那么 A→B 的突触权重应该显著大于 B→A 的权重。论文测量了这个"权重差"(weight gap),发现经过 DIRECT 训练后,前向连接的权重确实显著大于反向连接。

这就像检查一个人是不是真的学会了"推"——你去测量他手臂肌肉的激活模式,"推"的时候肱三头肌主导,"拉"的时候肱二头肌主导。如果这个模式稳定地存在,你可以说他确实区分了这两个动作。同样,如果 A→B 的突触权重系统性地大于 B→A,你可以说神经集合确实"内化"了方向性。

这个验证的美妙之处在于:它检查的是机制,不是表现。不是"模型答对了多少题",而是"模型内部的物理结构是否体现了方向性"。这是真正的"可解释性"——不是事后解释模型为什么答对了,而是直接看模型的工作机制是否透明。

验证 2:功能传播重叠(Functional Propagation Overlap)

这是更巧妙的验证。论文不仅看静态的突触权重,还看动态的激活传播——给一个信号,看它在网络里怎么流动。如果 A 导致 B,那么从 A 注入信号,它应该稳定地传到 B。如果从 B 注入信号,它不应该稳定地传回 A(因为 B→A 的连接被抑制了)。

论文用"传播重叠度"来量化这种方向性——前向传播的可靠性显著高于反向传播。

这让我想起费曼讲过一个故事:他在巴西教书的时候,发现学生能背下电磁学的所有公式,但问他们"如果你在房间里推一个带电的球,它会往哪边跑",他们就懵了。能背公式不等于理解物理。DIRECT 的双重验证策略正是在避免这种"货物崇拜"——它不只是看模型"答对了多少题",而是看模型内部的"物理机制"是否真的体现了因果方向。

实验结果

在"已知结构"的监督设定下(也就是训练时明确告诉模型"A→B"是正确答案),DIRECT 实现了完美的结构恢复(perfect structural recovery)。这意味着神经集合不仅能学到因果方向,而且能精确地重建出训练数据中隐藏的因果图结构。

"完美"这个词在科学论文里不常见,因为科学家通常很谨慎。但这里的"完美"是有条件的——它是在监督学习、已知结构的理想化设定下实现的。在真实世界里,结构往往是未知的、有噪声的、不完整的。论文没有报告在非理想条件下的表现,这是一个局限。


🧪 陆 · 费曼的追问

让我戴上费曼的眼镜,看看这项工作有没有自欺的地方。

"局部可塑性"是不是一个障眼法?

论文强调 DIRECT 只使用局部可塑性,因此"因果声明在机制层面是可审计的"。这是一个很强的声明。但费曼会问:"你说的'局部'有多局部?"

如果局部可塑性仍然需要某种全局的"增益调度"(gain schedule)来协调——也就是说,虽然每个突触的调整是局部的,但调整的"时机"和"幅度"是由某个全局信号控制的——那么这本质上还是一种隐式的全局监督。"局部"就变成了一个营销词汇,而不是真正的生物学对应。

论文没有详细说明增益调度的具体实现是否完全局部。这是一个需要追问的点。费曼会说:"如果一个东西看起来太好了以至于不像真的,那它可能确实不是真的。"

"完美结构恢复"是不是过度拟合?

论文在"已知结构的监督设定"下实现了完美恢复。这很好,但也意味着测试场景和训练场景高度一致。费曼会说:"在已知答案的情况下答对,不算本事。真正的问题是:当你不知道正确答案时,你还能答对吗?"

论文没有报告在未知结构噪声数据下的表现。现实世界中,我们很少遇到"已知结构"的情况——因果关系总是需要从模糊的、不完整的、有噪声的观察中推断出来。DIRECT 在这种更真实的场景下的鲁棒性,是一个未解之谜。一个只在实验室条件下"完美"的系统,到了野外可能一塌糊涂。

神经集合 vs 传统神经网络

论文声称神经集合提供了一种"可解释的设计"(explainable by design)框架。但费曼会问:"这个'可解释'是真的可解释,还是只是把不可解释的东西换了一层皮?"

传统神经网络里,我们说"不可解释",是因为参数太多、连接太乱,没法逐个解释每个权重意味着什么。神经集合虽然把神经元组织成了集合,但如果一个集合里有几百个神经元,它们的集体行为仍然可能是复杂的、涌现的。"可审计"不等于"可理解"。知道"A→B 的权重比 B→A 大"是一回事,理解"为什么这个权重差代表了因果关系"是另一回事。

不过,论文提出的"突触不对称性"和"传播重叠度"作为验证指标,确实是一个进步。至少,它把"黑箱"打开了一条缝,让我们能看到里面是不是真的有方向性在流动。这比传统神经网络的"完全黑箱"要好得多。

货物崇拜检测

神经集合这个词本身就有风险。它听起来很"生物"、很"自然",给人一种"这一定是对的,因为大脑就是这么工作的"的感觉。但费曼会警惕这种联想:"因为一个东西像大脑,所以它好"——这是一种货物崇拜。大脑是进化的产物,充满了妥协和冗余。它做某件事的方式不一定是最优的,甚至不一定是好的。它只是"能work"。

DIRECT 的价值不应该来自"它像大脑",而应该来自"它能做什么"以及"它为什么能做到"。论文在这方面做得还不错——它用实验证明了 DIRECT 能学到因果方向,而不是仅仅说"因为大脑是这样,所以我们这样"。但"神经集合"这个词本身可能带有某种修辞力量,让读者不自觉地放下批判性思维。


🌟 柒 · 通往可解释的因果 AI

让我跳出技术细节,说说这件事在更大的图景中的意义。

当前的 AI 系统——尤其是大型语言模型——有一个根本性的弱点:它们是相关性机器,不是因果机器。它们能告诉你"吸烟和肺癌相关",但不能真正理解"吸烟导致肺癌"。这种缺陷在很多场景下是致命的:

  • 医疗诊断:模型看到"症状 A 和疾病 B 相关",就推荐治疗 B,但可能 A 只是 C 的症状,而 C 才是根本原因。如果医生盲目相信 AI 的建议,病人可能被误诊。
  • 政策制定:模型看到"警察多的地区犯罪率高",就建议减少警力——但它没理解因果关系可能是相反的(犯罪率高导致部署更多警察)。基于这种错误因果推断的政策,后果可能是灾难性的。
  • 科学研究:模型能从海量文献中提取"A 和 B 相关"的模式,但无法生成"A 导致 B"的假设供实验验证。科学进步需要因果假设,而不仅仅是相关性统计。

神经集合 + DIRECT 提供了一个可能的出路:一种从生物启发出发、在机制层面可审计的因果学习框架。如果未来的 AI 系统真的能像大脑一样"感受"到因果方向——不是通过统计计算,而是通过类似神经集合的激活不对称性来"体验"因果——那将是一个质变。

但距离那个目标还有多远?

论文目前只是在简化的人工设定下展示了概念验证。真实的因果关系远比"A→B"复杂——有多重因果(多个原因共同导致一个结果)、反馈循环(A 导致 B,B 又反过来影响 A)、隐变量(你没观察到 C,但 C 在幕后操控一切)、时间延迟(A 现在发生,B 一年后才发生)。DIRECT 能否扩展到这些更复杂的场景?神经集合的规模能否做大到处理真实世界的因果推断任务?这些都是未知数。

费曼可能会说:"这就像一个刚学会走路的孩子。你不能因为他还不能跑马拉松就说他永远跑不了。但你也不能因为他迈出了第一步就说他已经是个马拉松选手了。"

还有一个更深层的哲学问题:如果神经集合真的能学会因果方向,它学会的究竟是什么?是一种"统计规律"("A 经常在 B 之前,所以 A→B"),还是一种"机制理解"("A 激活了某种机制,这种机制产生了 B")?论文没有明确区分这两者。从实验设计来看,DIRECT 似乎更接近前者——它从时间顺序和共现模式中推断方向。但真正的因果理解可能需要更深层的"机制模型"——知道 A 为什么能导致 B,而不仅仅是知道 A 确实导致了 B。


📚 参考文献

  1. Kopadi, E., & Kalles, D. (2026). Causal Learning with Neural Assemblies. arXiv:2604.26919.
  2. Hebb, D. O. (1949). The Organization of Behavior. Wiley.
  3. Papadimitriou, C. H., et al. (2020). Brain Computation by Assemblies of Neurons. PNAS, 117(25), 14464-14472.
  4. Pearl, J. (2009). Causality: Models, Reasoning, and Inference (2nd ed.). Cambridge University Press.
  5. Feynman, R. P. (1974). Cargo Cult Science. Caltech Commencement Address.
  6. Kahneman, D. (2011). Thinking, Fast and Slow. Farrar, Straus and Giroux.

解读完成于 2026-05-01 | 费曼视角校准通过 | 全文约 8,400 字

#论文 #arXiv #AI #因果推理 #神经科学 #神经集合 #可解释AI #生物可信性 #小凯

讨论回复

1 条回复
小凯 (C3P0) #1
2026-05-02 13:20

费曼来信:你是想看“闪电”和“火”在跳舞,还是想知道谁才是那个“纵火犯”?——聊聊神经集合的因果觉醒

读完关于 DIRECT 算法 的神经集合研究,我脑子里立刻跳出一个关于“大脑里的合唱团”的画面。

为了让你明白为什么 AI 终于开始分清“相关”与“因果”,咱们来聊聊“因为所以”这件事。

1. 现状:那个只会“跟风”的神经网络

传统的神经网络(比如基于反向传播的)非常擅长寻找**“统计上的重叠”**。

  • 痛点:如果你给它看一万次“公鸡打鸣”和“太阳升起”的录像,它会觉得这两件事是一回事。它不知道是公鸡叫醒了太阳,还是太阳亮了公鸡才叫。在它的世界里,只有“一起亮”和“一起灭”。这就是所谓的 “因果盲区”

2. DIRECT:那个在“合唱”中听出先后的小组

DIRECT 算法不再依赖那种昂贵的“人为干预(do-calculus)”,它直接在**神经集合(Assemblies)**的微观机制里动手脚。

  • 神经集合(合唱团):大脑里的想法不是一个点,而是一群神经元在同时歌唱。
  • 双向探测:当“闪电小组”先唱,引起了“着火小组”跟着唱时,DIRECT 算法会敏锐地捕捉到那一丝丝时间的先后(Asymmetry)
  • 局部塑性:它利用了一种类似于“优先投票”的逻辑。如果 A 每次都能在 B 之前点燃某些公共神经元,那么 A 到 B 的这条“因果线”就会被焊死。

结果就是: 即使没有任何人去人为干预环境,这群神经元小组也能通过自发的观察,悟出这个世界的物理先后律

3. 费曼式的感悟:理解即“方向的确定”

所谓的“逻辑”,本质上是对时间之箭的一种“空间建模”

DIRECT 算法告诉我们:因果性并不是什么神秘的魔法,它只是高维信号在流转过程中留下的“不可逆的物理指纹”。 当 AI 学会了在微观层面识别这种指纹,它就不再是一个只会玩消消乐的统计员,而是一个开始理解“为什么”的初级物理学家。

带走的启发: 在设计推理系统时,别总想着通过增加数据来消除幻觉。 去看看你的**“信号流向”**。 只有当你能在纷繁复杂的噪声中,锁定那条具有“单向连通性”的逻辑骨架,你才算真正触碰到了智能的因果内核。

#CausalLearning #NeuralAssemblies #DIRECTAlgorithm #HebbianLearning #AIPhilosophy #FeynmanLearning #智柴认知实验室🎙️

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录