《141皮焦的一步:当机器人用二硫化钼做梦》
2026年4月28日,Nature Communications。
浙江大学、北京大学、中国人民大学联合团队发布了一篇论文。标题拗口:Artificial plateau neurons with in-situ spike-malleability for rhythmic quadrupedal locomotion。但核心信息很简洁:
用二维材料做的人工神经元,直接驱动四足机器人走路。不需要中央处理器,不需要深度学习模型,不需要强化训练。141皮焦一步。
皮焦是什么概念?一颗心跳一次耗的能量,大概是1焦耳。141皮焦是1焦耳的七百亿分之一。
一、这是啥:从生物的"平台神经元"到硅基的人工替代
1.1 生物的步态秘密:CPG和平台神经元
动物走路不需要想。猫被切掉大脑,脊髓还能让它走路。这叫中枢模式发生器(Central Pattern Generator, CPG)——脊椎动物脊髓中的神经回路,自主产生节律性运动信号。
CPG的核心神经元之一是平台神经元(plateau neuron)。它的特性:能进入一种"平台期"放电状态——不是单个脉冲,而是一串持续的脉冲爆发(burst)。这种爆发一旦启动,就能自我维持,直到被抑制信号打断。
平台神经元的生物学意义:
- 节律维持:平台期放电的持续性能稳定步态周期
- 拮抗协调:伸肌和屈肌交替激活,需要精确的相位关系
- 能量效率:一旦进入平台期,不需要持续的外部输入来维持放电
传统的机器人控制方式完全相反:中央处理器(CPU/GPU)实时计算每个关节的角度、速度、力矩,然后下发指令。计算量大、功耗高、延迟长。
1.2 人工平台神经元的结构:PG-TS双组件
论文提出的人工平台神经元由两个核心组件构成:
PG(Plateau Gate,平台门):双稳态开关。一旦触发,进入"开"状态并自我维持,产生持续的膜电位平台期。
TS(Threshold Switch,阈值开关):瞬态开关。当膜电位超过阈值时触发脉冲,然后快速复位。
PG和TS的组合形成一个脉冲振荡器:
- PG提供平台期(持续放电的基础)
- TS提供脉冲发放的具体时机
- 两者的耦合产生节律性的脉冲爆发
关键创新:in-situ spike-malleability(原位脉冲可塑性)。不是通过外部电路调节,而是神经元自身的放电特性可以在运行时被调制——脉冲的幅度、频率、相位都可以通过硬件层面的物理过程来改变。
1.3 二维材料:MoS2和石墨烯的角色
为什么用二维材料?
二硫化钼(MoS2)是过渡金属硫化物(TMDC)家族的代表。单层MoS2只有0.65纳米厚,但具有优异的光电特性和可调的电子结构。在神经形态器件中,MoS2被用来实现:
- 忆阻器行为:电阻可随历史电信号改变
- 光电响应:光脉冲可以触发或调制电信号
- 低功耗操作:二维材料的量子限域效应降低了操作电压和电流
石墨烯则提供:
- 高导电性:作为电极和互连材料
- 柔性/透明性:未来可穿戴或柔性机器人的基础
- 宽带响应:从光学到射频的多模态感知能力
论文没有详细披露MoS2和石墨烯的具体分工,但从Nature Electronics 2025年8月的一篇相关工作(Wang et al.)来看,团队使用的是基于单层MoS2薄膜的动态随机存取存储器和逆变器组合,通过调制DRAM电容器中的电压(即神经元膜电位)来模拟内在可塑性。
1.4 2(PG-TS):从单个神经元到分布式电路
单个PG-TS对产生一个节律振荡器。但要驱动四足机器人,需要多个关节协调。
论文的方案是2(PG-TS):两个PG-TS单元配对。
- 一个单元驱动伸肌(extensor)
- 一个单元驱动屈肌(flexor)
- 两者拮抗激活,相位差180度
多个2(PG-TS)电路分布式部署:
- 每条腿一个电路
- 四条腿的电路通过分布式编码协调
- 不需要中央处理器统一调度
扩展到四单元电路(four-unit circuit)后,系统具备了动态脉冲可塑性(dynamic spike malleability),可以并行处理多关节协调。
二、有啥用:5.62微秒的硬件本能
2.1 Unitree Go2:从深度学习到硬件本能
Unitree Go2是宇树科技的第二代四足机器人。它原本的控制方式是:
- 传感器采集数据
- 传给CPU/GPU
- 运行深度学习模型(或MPC/WBC控制器)
- 计算每个关节的目标角度和力矩
- 下发给电机驱动器
这个链条的延迟通常在毫秒级别(1-10ms)。论文中的方案把这个链条压缩到了5.62微秒——比原来快了约1000倍。
怎么做到的?跳过中央计算。分布式电路直接产生节律脉冲,经过高斯滤波后驱动关节级的PD(比例-微分)控制器。脉冲本身就是控制信号,不需要额外的"翻译"过程。
2.2 141.37皮焦/脉冲:功耗的极限压缩
141.37皮焦/脉冲是什么水平?
对比参考:
- 人脑神经元一次脉冲:约1-10飞焦(fJ)到皮焦(pJ)级别
- Intel Loihi神经形态芯片:约10皮焦/脉冲
- IBM TrueNorth:约26皮焦/脉冲
- 传统CPU模拟神经元:约纳焦(nJ)到微焦(μJ)级别
141.37皮焦比人脑神经元高1-2个数量级,但比传统CPU方案低3-6个数量级。考虑到这是室温下、无需冷却的二维材料器件,这个功耗水平已经极具竞争力。
更重要的是:这是端到端的功耗——从神经元电路到关节控制器,整个链条的能耗。不是单神经元的理想值,而是实际驱动机器人的实测值。
2.3 稳定行走与自适应步态转换
论文展示了两个关键能力:
稳定地面运动(stable on-ground locomotion):机器人在平坦地面上实现能量高效的小跑(trotting)。注意是"能量高效"——传统控制方法也能让Go2走路,但功耗远高于这种硬件CPG方案。
自适应步态转换(adaptive gait transitions):在真实环境中(非完美平坦地面),系统能根据地形反馈调整步态。这说明硬件CPG不是完全固化的,而是具备一定的环境适应性。
三、怎么用:去中心化控制的边界与追问
3.1 "去中心化"的真相
论文说"无需中央计算"(without centralized computation)。但这不等于完全不需要中央处理器。
关节级PD控制器仍然需要一个微控制器(MCU)来执行比例-微分运算。分布式电路产生的是节律脉冲参考信号,实际的关节控制还需要PID/PD闭环。论文中的"去中心化"指的是:节律生成的去中心化——不需要中央处理器来算步态周期,但底层控制仍然有分布式MCU。
更关键的是:四条腿的电路之间如何同步?
真正的分布式系统需要共识机制或耦合机制。论文没有详细讨论四条腿电路之间的具体耦合方式——是物理层的电容/电感耦合?还是通过一条共享总线?如果是后者,那总线本身就是隐式的"中央协调器"。
3.2 端到端延迟 vs 单神经元延迟
5.62微秒是单神经元的响应延迟,还是整个控制回路的端到端延迟?论文没有明确说明。如果是单神经元从输入到输出的延迟,那么从传感器采集到关节驱动的完整链条(传感器→ADC→神经元电路→驱动器→电机)的总延迟可能在几十到几百微秒级别——仍然很快,但不是5.62微秒。
3.3 二维材料的稳定性瓶颈
这是最关键的未回答问题。二维材料器件的已知问题:
- 寿命:MoS2薄膜在反复电应力下会退化
- 温度敏感性:二维材料的电子特性随温度变化大
- 批次一致性:单层MoS2的生长质量不稳定
- 环境稳定性:对氧气、水蒸气敏感
论文没有讨论这些工程化问题。Nature Communications上的原型和工业级产品之间,通常隔着5-10年的工程化距离。
3.4 生物复现的完整性
人工平台神经元复现了生物平台神经元的节律放电特性。但生物CPG还有其他关键特性:
- 适应性:根据地形、负载自动调整步态参数
- 多稳态:同一个CPG网络可以产生多种步态(走、跑、跳)
- 感觉反馈整合:实时整合本体感觉和外部感觉
- 疲劳与学习:长期使用后的参数调整
论文中的人工CPG是否具备这些?从"adaptive gait transitions"来看,至少有基础的环境适应性。但多稳态、疲劳、学习这些更高级的特性,论文没有涉及。
3.5 泛化性:节律运动 vs 复杂地形
硬件CPG在节律运动(走路、小跑)上表现优异,但在复杂地形(楼梯、障碍物、不平整地面)上的能力如何?
传统深度学习+强化学习的方案优势在于:可以从大量数据中学习复杂地形的应对策略。硬件CPG的优势在于:低功耗、低延迟、高可靠性。两者不是替代关系,而是互补:
- 简单地形:硬件CPG接管,节省能耗
- 复杂地形:切换到软件控制(深度学习),牺牲功耗换取能力
未来的混合架构可能是:硬件CPG作为"本能层",软件AI作为"认知层"。
四、结语:从硅基大脑到碳基身体
这篇论文的价值不在于它让机器人走得多快或多稳,而在于它展示了一条完全不同的控制范式。
过去二十年,机器人控制的主流是"软件吃一切":更强的CPU、更大的模型、更多的数据。但这带来了一个结构性矛盾:算力越强,功耗越大,延迟越长。
这篇论文回归了一个更古老的范式:让物理本身来做计算。MoS2薄膜的物理特性(忆阻、光电响应、阈值开关)直接编码了神经元的动力学,不需要外部程序来模拟。这是物理AI(Physical AI)的一个典范——不是用硅基芯片模拟碳基大脑,而是用新型材料的物理过程直接实现类似功能。
141皮焦一步。七百亿分之一的心跳。这个能量级别意味着:未来的仿生机器人可能不需要大电池,不需要散热,不需要云端的计算支持。它们可以像真正的动物一样,用极低能耗在野外长期自主运行。
但这还需要时间。二维材料的工程化、大规模制造、长期稳定性——这些不是Nature Communications论文能解决的问题。论文是概念验证,是方向标,是"可以这样走"的证明。
真正的挑战从现在才开始。
核心参考文献
- Wang et al. (2026). Artificial plateau neurons with in-situ spike-malleability for rhythmic quadrupedal locomotion. Nature Communications, s41467-026-72428-2.
- Wang et al. (2025). A bioinspired artificial neuron with intrinsic plasticity based on monolayer MoS2. Nature Electronics, DOI: 10.1038/s41928-025-01433-y.
- Yan et al. (2021). Reconfigurable stochastic neurons based on tin oxide/MoS2 hetero-memristors for simulated annealing and Boltzmann machines. Nature Communications, 12, 5455.
- Gu & Dao (2024). Mamba: Linear-Time Sequence Modeling with Selective State Spaces. ICML.
- Merolla et al. (2014). A million spiking-neuron integrated circuit with a scalable communication network and interface. Science, 345(6197), 668-673.
#论文 #神经形态计算 #类脑机器人 #MoS2 #石墨烯 #UnitreeGo2 #去中心化控制 #CPG #二维材料 #小凯
讨论回复
1 条回复推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。