大脑如何用"音量旋钮"实现毫秒级高效编码
论文: Fast efficient coding and sensory adaptation in gain-adaptive recurrent networks
作者: Arthur Prat-Carrabin, Maximilian V. Harl, Samuel J. Gershman
发表: Nature Communications, 2026-05-15
DOI: 10.1038/s41467-026-73032-0
一、世纪矛盾:大脑到底在"吸引"还是"排斥"?
神经科学有一个长期悬而未决的谜题。
理论上,如果大脑遵循 高效编码(Efficient Coding)原则——为了最大化信息传递效率,神经元的调谐曲线应该向环境中出现频率最高的刺激"靠拢"。这被称为 "先验吸引"(Prior attraction)。
但实验看到的恰恰相反。当你反复向动物呈现同一个视觉刺激(比如某个特定朝向的光栅),初级视觉皮层(V1)中偏好该刺激附近的神经元,其调谐曲线反而会 背离 这个高频刺激发生偏移——这被称为 "适配器排斥"(Adapter repulsion)。
更复杂的是,排斥现象还伴随着一系列次生效应:靠近适配器的调谐曲线会变宽,远离的会变窄。这种在 几十毫秒内 就发生的快速形变,用传统的突触可塑性机制来解释,时间尺度根本对不上。
到底哪个理论是对的?大脑是在"吸引"高频刺激,还是在"排斥"重复刺激?
这篇论文给出的答案是:两者都对,而且它们本质上是同一回事。
二、核心发现:同一原则,两种表现
研究团队提出了一个 增益自适应循环网络(Gain-adaptive Recurrent Network)模型。核心洞察在于:
吸引和排斥不是两套独立的神经机制,而是大脑在"最小化解码误差与放电成本"这一单一高效编码原则下,面对不同统计分布时给出的最优解。
2.1 宽先验 → 先验吸引
当环境中的刺激分布较宽(先验概率分布平缓),网络优化出的增益呈 倒U型 分布——先验概率越高的中心位置,增益越大。
在这种增益分布的牵引下,神经元的有效调谐曲线会 自发地向先验中心收缩。先验分布越窄,这种"聚集"效应越强。这就是传统高效编码理论预测的"先验吸引"。
2.2 尖锐先验 → 适配器排斥
当研究者把同样的优化目标应用到极其尖锐的先验分布(模拟实验中反复呈现的单一适配器刺激)时,网络给出了 完全不同的最优解。
面对尖锐先验,为了在极高的局部精度需求和昂贵的放电成本之间找到平衡,最优增益分布不再是单峰,而是演变成了一个 "M型"双峰结构——在适配器正中心,增益反而出现低谷,而在其两侧形成两个高增益峰值。
正是这两个偏离中心的增益峰值,把附近的调谐曲线向两侧"拉扯",从而自然涌现出了经典的"适配器排斥"现象。
2.3 统一框架
| 条件 | 增益分布 | 调谐曲线变化 | 现象名称 |
|---|---|---|---|
| 宽先验 | 倒U型单峰 | 向中心收缩 | 先验吸引 |
| 尖锐先验 | M型双峰 | 向两侧偏移 | 适配器排斥 |
两者都是同一优化问题的解,区别仅在于 先验分布的形状。
三、机制:为什么是"增益"而非"突触"?
3.1 传统解释的问题
现有的适配器排斥模型大多依赖 突触权重的改变——这需要修改神经元之间的所有连接(O(N²)参数)。问题是:
- 突触可塑性太慢(通常需要秒到分钟级别)
- 突触可塑性不可逆或难以快速恢复
- 需要大量突触同时协同修改,生物学可行性存疑
3.2 增益调节的优势
本文提出的模型中,突触连接矩阵完全固定,唯一改变的是每个神经元前馈输入的增益(Gain)——一个标量参数(O(N)参数)。
这就像调节音响的"音量旋钮":不改变音箱内部的电路,只改变输入信号的放大倍数。但关键在于,这个循环网络中的"音量"变化会通过循环连接传播到整个网络,产生全局协调的适应效应。
3.3 数学机制
在循环网络中,一个神经元的 有效调谐中心 实际上是网络中所有神经元前馈位置的加权平均。当网络中出现非均匀的增益分布时:
- 高增益神经元对周围神经元产生"拉力"
- 调谐曲线的偏移方向由增益梯度的空间分布决定
这就是"不改变突触权重就能实现快速适应"的数学基础。
四、行为学证据:人类能在单次试验中重新校准
为了验证感觉系统确实能在极短时间内根据先验分布调整编码,研究者进行了一项人类数量估计行为实验。
在每个试次中,受试者会被随机告知一个先验分布(窄、中、宽),随后要求估计屏幕上闪现的圆点数量。
结果:受试者估计值的 方差与先验分布的宽度呈线性比例关系。这意味着,即使先验分布在每次试验(秒级尺度)都在随机变化,人类依然能够 迅速重新分配内部的表征资源。
这种快速的精度调整,为"大脑能够实时执行高效编码"提供了坚实的行为学基础。
五、与现有模型的关系
5.1 与 Duong et al. (2023) 的对比
Lyndon Duong 等人在2023年的预印本(arXiv:2305.19869)也提出了类似的增益自适应循环网络模型,但:
- Duong 的模型主要关注 适配器排斥 和 去相关(decorrelation)
- 没有明确区分 尖峰先验 vs 宽先验 的预测
- 没有提供 行为实验证据
本文可以看作是在 Duong 2023 基础上的 扩展和深化:
- 明确统一了先验吸引和适配器排斥
- 预测了不同先验分布下的不同适应模式
- 用人类行为实验验证了模型的预测
5.2 与突触可塑性模型的根本差异
| 特征 | 突触可塑性模型 | 增益自适应模型 |
|---|---|---|
| 参数数量 | O(N²) | O(N) |
| 适应速度 | 慢(秒到分钟) | 快(毫秒) |
| 可逆性 | 差 | 好 |
| 生物学可行性 | 需要大量协同修改 | 局部增益调节即可 |
六、理论意义:一个框架,多种现象
这项工作在理论层面上打破了感觉适应领域长期以来的认知割裂:
过去,人们将"先验吸引"视为高效编码的产物,将"适配器排斥"归结为疲劳或抑制。现在我们知道,它们都是 同一原则 在不同条件下的表现。
这类似于物理学中"光的波粒二象性"——看似矛盾的现象,其实源于更深层的统一原理。
6.1 对神经工程学的启示
增益自适应机制为设计 快速适应的神经网络 提供了新思路:
- 不需要昂贵的权重更新
- 只需要调节神经元的"增益参数"
- 可以实现毫秒级的网络形变
6.2 对理解大脑计算的启示
这项研究支持了一种 "动态计算" 的观点:大脑不是一台固定的计算机器,而是一台能够 实时重塑自身表征空间 的柔性系统。关键在于,这种重塑不是通过"重新布线"(改变突触),而是通过"调节音量"(改变增益)来实现的。
七、局限与未解之谜
7.1 下游解码问题
如果神经元的调谐曲线在毫秒级时间尺度上不断变化,下游脑区如何知道当前的编码方案?这是一个"元表征"问题:大脑需要一种机制来追踪自身表征的动态变化,这超出了本文的讨论范围。
7.2 增益调节的生物学实现
本文从计算层面证明了增益调节的充分性,但增益调节在生物神经系统中的具体实现机制仍不清楚。可能的候选包括:
- 神经调质(如乙酰胆碱、多巴胺)的局部释放
- 神经元的内在兴奋性变化(如离子通道调节)
- 局部网络活动的反馈调节
7.3 从速率模型到脉冲模型
本文使用的是线性速率模型(firing rate model),没有考虑脉冲时序和脉冲可塑性。增益自适应在脉冲神经网络中是否同样有效,是一个重要的扩展方向。
八、结语:一个优雅的统一
这篇论文的优雅之处在于,它用一个极简的数学模型——固定连接的循环网络 + 可变的神经元增益——解释了看似矛盾的两个现象。
这提醒我们:在神经科学中,最深刻的洞察往往来自于找到正确的抽象层次。不是去模拟每一个离子通道的打开,而是去识别计算原则层面的统一性。
大脑用"音量旋钮"而非"重新布线"来实现快速适应——这个隐喻本身,就是对生物智能之美的最好注解。
参考论文信息:
Prat-Carrabin, A., Harl, M.V. & Gershman, S.J. Fast efficient coding and sensory adaptation in gain-adaptive recurrent networks. Nat Commun (2026). https://doi.org/10.1038/s41467-026-73032-0
#神经科学 #高效编码 #循环网络 #感觉适应 #计算神经科学 #NatureCommunications
讨论回复
1 条回复推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。