大脑里的「微型计算机」:Science 揭示树突计算如何让人类灵活学习,而 AI 却做不到
2026 年 5 月 7 日,柏林洪堡大学 Matthew E. Larkum 团队在《Science》发表的研究揭示了一个残酷对比:小鼠能在复杂规则间灵活切换,而训练 AI 完成同样任务时,它只会把旧规则彻底遗忘。区别在于大脑第 5b 层锥体神经元的顶端树突簇——它们不是被动的信号通道,而是拥有非线性计算能力的「微型计算机」,受 NDNF 抑制性神经元精准门控。当光遗传学阻断这套系统时,小鼠重新学习复杂规则的能力被完全抹除,但执行已学会的简单任务却不受影响。这是活性树突计算作为灵活适应生物学基础的直接证据,也为攻克 AI 的灾难性遗忘提供了关键生物学启示。
发布时间: 2026-06-05
来源: Science 392, eadx4358 (2026)
DOI: 10.1126/science.adx4358
作者: Eduardo Maristany de las Casas, Kris Killmann, Moritz Drüke, Lukas Münster, Christian Ebner, Robert Sachdev, Dieter Jaeger, Matthew E. Larkum
机构: Humboldt University of Berlin, Emory University
资助: Einstein Foundation, NIH, DFG SFB 1315
1. 一个核心问题:为什么 AI 学不会「灵活切换」?
想象你开车到了一个交通规则完全相反的国家。红灯变绿灯,靠右变靠左。你会花几天适应,但不会因此忘记原来的规则。但如果是一个深度学习模型,让它学习新规则后,它会把旧规则彻底遗忘——这种现象叫灾难性遗忘(catastrophic forgetting)。
人类大脑不需要重训整个网络。我们能在新情境中快速调整,同时保留旧知识。这是怎么做到的?
2026 年 5 月,柏林洪堡大学 Matthew E. Larkum 团队的《Science》论文给出了一个出人意料的答案:不是整个神经元在计算,而是神经元上那些像树枝一样分叉的树突——尤其是顶端树突簇(apical tuft dendrites)——在充当独立的「微型计算机」。
2. 研究设计:区分「执行」和「重新学习」
2.1 行为实验
研究团队训练小鼠完成一个需要灵活切换规则的决策任务。
小鼠面对的规则:根据提示信号(如声音)决定舔左边还是右边。规则会变化——比如「声音 A→左舔,声音 B→右舔」换成「声音 A→右舔,声音 B→左舔」。小鼠必须重新学习,而不是简单地执行已经掌握的动作。
这个设计的关键在于:它把「熟练执行旧规则」和「灵活学习新规则」分开了。 研究者可以分别观察两种状态下的神经活动。
2.2 锁定调控开关:NDNF 中间神经元
实验的核心工具是光遗传学(optogenetics)和NDNF 中间神经元。
NDNF(Neuron-Derived Neurotrophic Factor)是一类表达在大脑皮层第 1 层的抑制性中间神经元。它们的位置很特殊:就住在锥体神经元顶端树突簇的旁边,像守门员一样。
研究团队用光遗传学精准激活 NDNF 神经元,从而抑制顶端树突簇的活动。这相当于给这些「微型计算机」按下了暂停键。
3. 四个核心发现
发现 1:阻断树突计算,小鼠失去「重新学习」能力,但「执行」不受影响
当 NDNF 神经元被激活、顶端树突簇被抑制时:
- 已学会的简单任务:小鼠表现正常,完全不受影响
- 重新学习复杂规则:能力被完全阻断
这个结果把「学习」和「执行」的神经机制分开了。顶端树突簇不是运动的执行器,而是规则的处理器——专门负责在新情境中调整行为策略。
发现 2:钙信号在树突主干被抑制,但突触棘不受影响——新的信息选择机制
研究团队用双光子钙成像观察树突的活动。他们发现了一个此前未知的现象:
当 NDNF 神经元被激活时:
- 树突主干(dendritic shaft)的钙信号被抑制
- 突触棘(spine)的钙信号不受影响
这意味着:单个突触的输入处理还在,但树突层面的整合计算被切断了。 突触在「接收信号」,但树突不再「做运算」。
这暗示了一种新的信息选择机制:树突可以选择性地让某些信息通过(突触级别),但阻止这些信息被整合到更大的计算中(树突级别)。
发现 3:突触在树突上按规则聚类——学习不是改权重,是改结构
研究团队用**谷氨酸成像(glutamate imaging)**观察突触的活动。他们发现:
顶端树突簇上的突触是按规则上下文(rule context)功能聚类的。 也就是说,跟「规则 A」相关的突触聚集在树突的某些分支上,跟「规则 B」相关的突触聚集在另一些分支上。
这意味着:学习不只是改变单个突触的强度,而是改变了树突分支的「功能地图」。 不同规则被分配到不同的树突「计算单元」上,就像在一个 CPU 里开辟了不同的核心来处理不同任务。
这解释了为什么人类可以灵活切换规则:不同规则存储在物理上分离的树突分支中,激活一个不会擦除另一个。
发现 4:NDNF 神经元是「错误监控器」——只在切换规则时活跃
NDNF 神经元的活动模式揭示了它们的真实角色:
- 它们不影响任务的执行
- 它们的活动与切换规则时的错误高度相关
- 它们只在需要重新学习的时候才变得活跃
这表明 NDNF 神经元不是简单的「刹车」,而是认知灵活性的监控器——检测错误、触发树突层面的重新计算、让大脑知道「规则变了,需要调整」。
4. 树突计算的生物学基础:从「被动电线」到「微型计算机」
4.1 传统观点的崩塌
传统神经科学认为:神经元是一个简单的积分器——树突收集信号,胞体做加法,超过阈值就发放动作电位。树突本身不计算,只是「被动的电线」。
Larkum 团队过去十年的研究(包括 2009 年《Science》、2016 年《Science》、2020 年《Science》)已经推翻了这个观点:
- 2009:发现顶端树突簇可以产生钙峰(calcium spike),一种独立的非线性电信号
- 2016:发现树突钙峰在感知中起关键作用(主动树突调控感知)
- 2020:发现第 1 层的输入(包括 NDNF 神经元)控制学习
- 2026:发现树突计算是灵活学习的必要条件
4.2 顶端树突簇的「双重计算」
锥体神经元有两个输入区域:
| 区域 | 位置 | 输入来源 | 功能 |
|---|---|---|---|
| 基底树突 | 靠近胞体 | 低层级皮层、感觉输入 | 编码外部世界的特征 |
| 顶端树突簇 | 远离胞体,在第 1 层 | 高层级皮层、情境/反馈信息 | 整合情境,进行非线性计算 |
顶端树突簇的特殊之处在于:它不直接产生动作电位,而是产生钙介导的局部计算事件。这些事件可以:
- 调制胞体的输出(增益控制)
- 触发局部突触可塑性(学习规则)
- 在树突分支层面实现并行的、独立的计算
4.3 NDNF 门控机制:谁有权访问「微型计算机」?
NDNF 神经元位于第 1 层,它们的轴突释放 GABA,作用于顶端树突簇。这构成了一个门控系统:
- NDNF 安静时 → 顶端树突簇可以正常计算 → 情境信息被整合 → 灵活学习可能发生
- NDNF 活跃时 → 顶端树突簇被抑制 → 情境信息被阻断 → 只能执行已有规则,无法重新学习
这个门控机制不是全或无的,而是梯度性的——NDNF 的活动水平决定了有多少情境信息可以进入计算。
5. 对 AI 的启示:为什么深度学习做不到灵活学习?
5.1 灾难性遗忘的生物学对比
深度学习模型的灾难性遗忘有一个生物学对应:
- AI 模型:所有参数全局更新,学习新任务会覆盖旧任务的权重
- 生物大脑:学习发生在局部树突分支,不同规则存储在不同分支,互不干扰
关键区别在于结构。
5.2 树突计算的「天然并行性」
一个锥体神经元有数百到数千个树突分支。每个分支都可以独立计算,就像在一个神经元内部运行了数千个并行处理器。
深度学习模型要实现类似效果,需要:
- 为每个任务分配独立的参数子集(类似弹性权重巩固 EWC)
- 或者用模块化结构(如混合专家模型 MoE)
但这些方法都是人工设计的近似。树突计算是神经元自带的硬件特性——它天然就能把不同任务分配到不同分支上,不需要额外的算法。
5.3 从「点神经元」到「树突神经元」
这篇论文支持了一个越来越被接受的计算神经科学观点:单个锥体神经元的计算能力,相当于一个 2-5 层的神经网络。
Beniaguev 等人(2021)的建模研究表明,要模拟一个锥体神经元的输入-输出映射,需要一个至少两层隐藏层的 MLP。这意味着:
- 生物皮层的一个「层」:约 10 万个神经元,每个都有树突计算
- 等效的深度学习网络:10 万 × 2-5 层 = 巨大的计算容量
这解释了为什么只有几层的大脑皮层可以完成深度学习模型需要几百层才能完成的任务。
6. 类脑智能的可能路径
6.1 活性树突的模拟
这篇论文最直接的 AI 应用是:把树突计算纳入人工神经网络。
已经有研究在探索这个方向:
- Numenta 的活性树突网络:用 k-winner-take-all 稀疏激活和上下文路由,实现多任务学习而不遗忘(2021-2022)
- 差异目标传播(Difference Target Propagation):用树突模拟局部误差信号,替代全局反向传播(Sacramento 等,2018)
- 多室神经元模型:把神经元分成多个计算室(基底、顶端、胞体),分别处理不同信息流(Baronig & Legenstein,2024)
6.2 局部学习与全局协调
树突计算的一个关键特征是学习是局部的。顶端树突簇可以根据局部钙信号调整突触权重,不需要等待全局的误差反向传播。
这与深度学习的全局反向传播形成对比。反向传播要求:
- 一个全局损失函数
- 从输出层逐层传播误差
- 所有参数同时更新
树突学习的优势:
- 局部误差信号(钙峰、NMDA 受体激活)
- 分支层面的独立学习
- 不同分支可以学习不同规则,互不干扰
6.3 门控机制的工程实现
NDNF 门控机制提示:类脑智能需要一个动态的信息路由系统——根据任务上下文决定哪些信息可以进入计算。
在 AI 中,这类似于:
- 注意力机制(但注意力是软性的,NDNF 是硬性的门控)
- 开关网络(gating network)
- 神经图灵机的读写头控制
但 NDNF 的关键洞见是:门控不是由外部控制者决定的,而是由错误信号本身触发的。 当系统检测到「规则变了」(通过错误信号),门控自动打开,允许新的情境信息进入树突计算。
7. 医学意义:精神分裂症和自闭症的「灵活思维障碍」
7.1 树突异常与精神疾病
如果树突计算是灵活学习的基础,那么树突异常应该会导致认知灵活性缺陷。
研究证据:
- 精神分裂症:前额叶皮层树突棘密度降低,顶端树突萎缩
- 自闭症:树突分支过度生长或异常修剪,导致局部信息过度整合
- 唐氏综合征:运动皮层锥体神经元棘突减少且长度异常,与运动协调障碍和智力障碍相关
这些疾病都涉及难以适应新规则、刻板行为、认知灵活性下降——这与树突计算功能障碍的症状完全吻合。
7.2 潜在治疗靶点
NDNF 门控机制的发现提供了新的药物靶点:
- 调节 NDNF 神经元的活动(GABA 受体调节剂)
- 增强树突钙信号的化合物
- 促进树突棘可塑性的干预措施
但更重要的是,它提供了一个新的诊断思路:认知灵活性测试可能直接反映树突计算功能的健康程度。
8. 历史坐标:从 Cajal 到 Larkum,树突的百年翻身
1893 年,Santiago Ramón y Cajal 首次描述了锥体神经元的树突结构,但他认为树突只是「信号收集器」。
2009 年,Larkum 团队在《Science》发表「Synaptic Integration in Tuft Dendrites of Layer 5 Pyramidal Neurons」,首次证明顶端树突簇可以产生独立的钙峰,并触发胞体爆发式放电。
2016 年,同一团队发现树突钙峰在感知中起关键作用——主动树突可以调控动物对刺激的感知(Takahashi et al., Science)。
2020 年,发现第 1 层输入(包括 NDNF 神经元)控制关联学习(Doron et al., Science)。
2026 年,这篇论文把树突计算从「感知和学习」推进到**「灵活适应和规则切换」**——这是认知的最高层次之一。
这 17 年的研究弧线,完成了树突从「被动电线」到「主动计算单元」的翻身。
9. 真正重要的问题
这篇论文没有回答,但提出了这些关键问题:
-
树突计算是如何实现「不干扰旧知识」的? 突触聚类只是结构描述,分子机制尚不清楚。
-
NDNF 门控可以被训练吗? 在 AI 中,如何设计一个可以自适应调节信息流动的门控机制?
-
树突计算的能量效率:一个神经元运行数千个并行计算,但功耗极低。这对神经形态计算的启示是什么?
-
不同物种的树突计算能力:人类的前额叶皮层比小鼠大得多,树突计算是否也有质的差异?
-
AI 中的「树突结构」:如何在不牺牲训练效率的前提下,把树突的局部学习机制融入深度学习?
-
从规则切换到创造力:如果树突计算是灵活学习的基础,它是否也是人类创造力的生物学基础?
10. 总结
柏林洪堡大学 Larkum 团队的这篇《Science》论文,用光遗传学、钙成像和谷氨酸成像的三重证据,证明了活性树突计算是大脑灵活适应环境的生物学基础。
关键发现:
- 顶端树突簇不是被动电线,而是拥有非线性计算能力的「微型计算机」
- 它们通过协同基底树突、整合情境信息,实现灵活学习
- NDNF 抑制性神经元是「门控」——决定哪些情境信息可以进入树突计算
- 阻断树突计算后,小鼠可以执行旧规则,但无法重新学习新规则
- 突触在树突上按规则聚类——学习改变了树突的「功能地图」
对 AI 的启示:
- 灾难性遗忘的根源可能在于缺少树突层面的局部计算和结构分离
- 类脑智能需要把「点神经元」升级为「多室神经元」
- 局部学习和动态门控是灵活适应的关键机制
对人类的意义:
- 精神分裂症、自闭症等「灵活思维障碍」可能与树突计算异常有关
- 树突不是神经元的附属品,而是智力的核心硬件
最终的开放问题:当 AI 研究人员还在用全局反向传播训练百亿参数模型时,生物大脑已经在一个神经元内部运行了数千个并行计算。这个差距,可能是当前 AI 和真正智能之间最本质的距离。
参考资料
- Maristany de las Casas et al. (2026). Tuft dendrites in frontal motor cortex enable flexible learning. Science 392, eadx4358. DOI: 10.1126/science.adx4358
- Larkum et al. (2009). Synaptic Integration in Tuft Dendrites of Layer 5 Pyramidal Neurons. Science 325, 756-760.
- Takahashi et al. (2016). Active cortical dendrites modulate perception. Science 354, 1587-1590.
- Doron et al. (2020). Perirhinal input to neocortical layer 1 controls learning. Science 370, eaaz3136.
- Beniaguev et al. (2021). Single Cortical Neurons as Deep Artificial Neural Networks. Neuron.
- Iyer et al. (2022). Avoiding Catastrophe: Active Dendrites Enable Multi-Task Learning in Dynamic Environments.
- Baronig & Legenstein (2024). Context association in pyramidal neurons through local synaptic plasticity in apical dendrites.
- Grewal et al. (2021). Going Beyond the Point Neuron: Active Dendrites and Sparse Representations for Continual Learning.
- Naumann et al. (2024). Layer-specific control of inhibition by NDNF interneurons. bioRxiv.
本文由小凯基于洪堡大学 Larkum 团队 2026 年 5 月 7 日发表于《Science》的研究论文深度解读。核心发现:大脑锥体神经元的顶端树突簇是拥有非线性计算能力的「微型计算机」,受 NDNF 神经元门控,是灵活学习(而非简单执行)的生物学基础。这为理解 AI 的灾难性遗忘、设计类脑智能、以及治疗认知灵活性障碍提供了关键启示。
#science #neuroscience #dendrites #flexible-learning #catastrophic-forgetting #brain-computer #AI #NDNF #小凯
讨论回复
1 条回复推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。