论文: Scalable Learning in Structured Recurrent Spiking Neural Networks without Backpropagation
作者: Bo Tang, Weiwei Xie
arXiv: 2605.00402 | 2026-04-29
一、那个"不像大脑"的深度学习
想象大脑学习:
- 神经元通过脉冲(spike)通信
- 能耗极低
- 局部学习,不需要全局反向传播
- 能处理时间序列
传统深度学习:
- 用连续激活值
- 能耗高
- 需要反向传播(全局计算)
- 与大脑机制完全不同
脉冲神经网络(SNN)更接近大脑,但训练困难。
二、SNN的训练困境
脉冲神经网络的挑战:
脉冲的不可微性:
- 脉冲是离散的(0或1)
- 反向传播需要梯度
- 脉冲函数不可微
- 传统BP无法直接应用
反向传播的问题:
- 需要存储中间激活值
- 内存开销大
- 计算复杂
- 不符合生物合理性
可扩展性:
- 深层循环SNN很难训练
- 梯度消失/爆炸
- 连接稀疏时更难
三、结构化循环SNN + 无反向传播学习
这篇论文提出一个突破:
核心思想:
设计结构化的SNN架构,使用不需要反向传播的学习规则。
技术方案:
1. 结构化架构
- 局部密集循环层
- 稀疏的小世界长程投影
- 模仿大脑的结构
2. 无反向传播学习
- 局部可塑性规则
- 如:STDP(脉冲时间依赖可塑性)
- 只依赖局部神经活动
- 不需要全局梯度
3. 可扩展性
- 深层循环结构
- 稀疏连接
- 仍然能有效学习
4. 能效优势
- 脉冲事件驱动计算
- 只在脉冲时消耗能量
- 比传统神经网络节能数个数量级
这就像大脑的学习方式:
- 不是有一个"中央指挥部"计算梯度
- 而是每个神经元根据局部活动调整连接
- 简单、高效、并行
四、为什么无BP的SNN更好?
反向传播的问题:
生物学不合理:
- 大脑没有反向传播
- 需要前向和后向两个传递
- 生物神经元做不到
计算开销:
- 存储所有中间激活
- 计算复杂
- 不适合边缘设备
无BP的优势:
生物合理:
- 更接近大脑机制
- 为理解大脑学习提供模型
- 神经科学的工具
高效:
- 局部计算
- 不需要存储中间状态
- 适合硬件实现
可扩展:
- 更深的网络
- 更稀疏的连接
- 仍然可以学习
五、费曼式的判断:好的计算模仿自然
费曼说过:
"自然界似乎总是用最简单的方式做事。"
在神经网络中:
"大脑用了数百万年进化出高效的学习机制。反向传播虽然强大,但不自然。无BP的SNN学习规则——虽然可能不如BP强大——但更接近自然的解决方案。也许我们应该向自然学习更多。"
这也体现了仿生学的智慧:
- 自然已经解决了许多工程问题
- 模仿自然往往能找到优雅的方案
- 不一定最强,但通常最高效
六、带走的启发
如果你在研究神经网络或边缘AI,问自己:
- "我的模型是否过于依赖反向传播?"
- "局部学习规则是否能达到可接受的效果?"
- "生物启发的方法是否能带来效率优势?"
- "脉冲计算是否适合我的应用场景?"
这篇论文的核心启示:最强的学习方法不一定是最好的——最接近自然的方法可能更高效、更可扩展。
当SNN摆脱反向传播的束缚,它不仅在计算上更接近大脑,也在哲学上更接近智能的本质。在AI的进化中,也许"更像大脑"比"更强大"更重要。
在脉冲的世界里,节能和智能可以兼得。
#SpikingNeuralNetworks #NeuromorphicComputing #BioInspiredAI #EdgeAI #LocalLearning #FeynmanLearning #智柴AI实验室
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。