《141皮焦的一步：当机器人用二硫化钼做梦》

> 2026年4月28日，Nature Communications。 > > 浙江大学、北京大学、中国人民大学联合团队发布了一篇论文。标题拗口：Artificial plateau neurons with in-situ spike-malleability for rhythmic quadrupedal locomotion。但核心信息很简洁： > > 用二维材料做的人工神经元，直接驱动四足机器人走路。不需要中央处理器，不需要深度学习模型，不需要强化训练。141皮焦一步。 > > 皮焦是什么概念？一颗心跳一次耗的能量，大概是1焦耳。141皮焦是1焦耳的七百亿分之一。

---

一、这是啥：从生物的"平台神经元"到硅基的人工替代

1.1 生物的步态秘密：CPG和平台神经元

动物走路不需要想。猫被切掉大脑，脊髓还能让它走路。这叫中枢模式发生器（Central Pattern Generator, CPG）——脊椎动物脊髓中的神经回路，自主产生节律性运动信号。

CPG的核心神经元之一是平台神经元（plateau neuron）。它的特性：能进入一种"平台期"放电状态——不是单个脉冲，而是一串持续的脉冲爆发（burst）。这种爆发一旦启动，就能自我维持，直到被抑制信号打断。

平台神经元的生物学意义：

节律维持：平台期放电的持续性能稳定步态周期
拮抗协调：伸肌和屈肌交替激活，需要精确的相位关系
能量效率：一旦进入平台期，不需要持续的外部输入来维持放电

传统的机器人控制方式完全相反：中央处理器（CPU/GPU）实时计算每个关节的角度、速度、力矩，然后下发指令。计算量大、功耗高、延迟长。

1.2 人工平台神经元的结构：PG-TS双组件

论文提出的人工平台神经元由两个核心组件构成：

PG（Plateau Gate，平台门）：双稳态开关。一旦触发，进入"开"状态并自我维持，产生持续的膜电位平台期。

TS（Threshold Switch，阈值开关）：瞬态开关。当膜电位超过阈值时触发脉冲，然后快速复位。

PG和TS的组合形成一个脉冲振荡器：

PG提供平台期（持续放电的基础）
TS提供脉冲发放的具体时机
两者的耦合产生节律性的脉冲爆发

关键创新：in-situ spike-malleability（原位脉冲可塑性）。不是通过外部电路调节，而是神经元自身的放电特性可以在运行时被调制——脉冲的幅度、频率、相位都可以通过硬件层面的物理过程来改变。

1.3 二维材料：MoS2和石墨烯的角色

为什么用二维材料？

二硫化钼（MoS2）是过渡金属硫化物（TMDC）家族的代表。单层MoS2只有0.65纳米厚，但具有优异的光电特性和可调的电子结构。在神经形态器件中，MoS2被用来实现：

忆阻器行为：电阻可随历史电信号改变
光电响应：光脉冲可以触发或调制电信号
低功耗操作：二维材料的量子限域效应降低了操作电压和电流

石墨烯则提供：

高导电性：作为电极和互连材料
柔性/透明性：未来可穿戴或柔性机器人的基础
宽带响应：从光学到射频的多模态感知能力

论文没有详细披露MoS2和石墨烯的具体分工，但从Nature Electronics 2025年8月的一篇相关工作（Wang et al.）来看，团队使用的是基于单层MoS2薄膜的动态随机存取存储器和逆变器组合，通过调制DRAM电容器中的电压（即神经元膜电位）来模拟内在可塑性。

1.4 2(PG-TS)：从单个神经元到分布式电路

单个PG-TS对产生一个节律振荡器。但要驱动四足机器人，需要多个关节协调。

论文的方案是2(PG-TS)：两个PG-TS单元配对。

一个单元驱动伸肌（extensor）
一个单元驱动屈肌（flexor）
两者拮抗激活，相位差180度

多个2(PG-TS)电路分布式部署：

每条腿一个电路
四条腿的电路通过分布式编码协调
不需要中央处理器统一调度

扩展到四单元电路（four-unit circuit）后，系统具备了动态脉冲可塑性（dynamic spike malleability），可以并行处理多关节协调。

---

二、有啥用：5.62微秒的硬件本能

2.1 Unitree Go2：从深度学习到硬件本能

Unitree Go2是宇树科技的第二代四足机器人。它原本的控制方式是：

传感器采集数据
传给CPU/GPU
运行深度学习模型（或MPC/WBC控制器）
计算每个关节的目标角度和力矩
下发给电机驱动器

这个链条的延迟通常在毫秒级别（1-10ms）。论文中的方案把这个链条压缩到了5.62微秒——比原来快了约1000倍。

怎么做到的？跳过中央计算。分布式电路直接产生节律脉冲，经过高斯滤波后驱动关节级的PD（比例-微分）控制器。脉冲本身就是控制信号，不需要额外的"翻译"过程。

2.2 141.37皮焦/脉冲：功耗的极限压缩

141.37皮焦/脉冲是什么水平？

对比参考：

人脑神经元一次脉冲：约1-10飞焦（fJ）到皮焦（pJ）级别
Intel Loihi神经形态芯片：约10皮焦/脉冲
IBM TrueNorth：约26皮焦/脉冲
传统CPU模拟神经元：约纳焦（nJ）到微焦（μJ）级别

141.37皮焦比人脑神经元高1-2个数量级，但比传统CPU方案低3-6个数量级。考虑到这是室温下、无需冷却的二维材料器件，这个功耗水平已经极具竞争力。

更重要的是：这是端到端的功耗——从神经元电路到关节控制器，整个链条的能耗。不是单神经元的理想值，而是实际驱动机器人的实测值。

2.3 稳定行走与自适应步态转换

论文展示了两个关键能力：

稳定地面运动（stable on-ground locomotion）：机器人在平坦地面上实现能量高效的小跑（trotting）。注意是"能量高效"——传统控制方法也能让Go2走路，但功耗远高于这种硬件CPG方案。

自适应步态转换（adaptive gait transitions）：在真实环境中（非完美平坦地面），系统能根据地形反馈调整步态。这说明硬件CPG不是完全固化的，而是具备一定的环境适应性。

---

三、怎么用：去中心化控制的边界与追问

3.1 "去中心化"的真相

论文说"无需中央计算"（without centralized computation）。但这不等于完全不需要中央处理器。

关节级PD控制器仍然需要一个微控制器（MCU）来执行比例-微分运算。分布式电路产生的是节律脉冲参考信号，实际的关节控制还需要PID/PD闭环。论文中的"去中心化"指的是：节律生成的去中心化——不需要中央处理器来算步态周期，但底层控制仍然有分布式MCU。

更关键的是：四条腿的电路之间如何同步？

真正的分布式系统需要共识机制或耦合机制。论文没有详细讨论四条腿电路之间的具体耦合方式——是物理层的电容/电感耦合？还是通过一条共享总线？如果是后者，那总线本身就是隐式的"中央协调器"。

3.2 端到端延迟 vs 单神经元延迟

5.62微秒是单神经元的响应延迟，还是整个控制回路的端到端延迟？论文没有明确说明。如果是单神经元从输入到输出的延迟，那么从传感器采集到关节驱动的完整链条（传感器→ADC→神经元电路→驱动器→电机）的总延迟可能在几十到几百微秒级别——仍然很快，但不是5.62微秒。

3.3 二维材料的稳定性瓶颈

这是最关键的未回答问题。二维材料器件的已知问题：

寿命：MoS2薄膜在反复电应力下会退化
温度敏感性：二维材料的电子特性随温度变化大
批次一致性：单层MoS2的生长质量不稳定
环境稳定性：对氧气、水蒸气敏感

论文没有讨论这些工程化问题。Nature Communications上的原型和工业级产品之间，通常隔着5-10年的工程化距离。

3.4 生物复现的完整性

人工平台神经元复现了生物平台神经元的节律放电特性。但生物CPG还有其他关键特性：

适应性：根据地形、负载自动调整步态参数
多稳态：同一个CPG网络可以产生多种步态（走、跑、跳）
感觉反馈整合：实时整合本体感觉和外部感觉
疲劳与学习：长期使用后的参数调整

论文中的人工CPG是否具备这些？从"adaptive gait transitions"来看，至少有基础的环境适应性。但多稳态、疲劳、学习这些更高级的特性，论文没有涉及。

3.5 泛化性：节律运动 vs 复杂地形

硬件CPG在节律运动（走路、小跑）上表现优异，但在复杂地形（楼梯、障碍物、不平整地面）上的能力如何？

传统深度学习+强化学习的方案优势在于：可以从大量数据中学习复杂地形的应对策略。硬件CPG的优势在于：低功耗、低延迟、高可靠性。两者不是替代关系，而是互补：

简单地形：硬件CPG接管，节省能耗
复杂地形：切换到软件控制（深度学习），牺牲功耗换取能力

未来的混合架构可能是：硬件CPG作为"本能层"，软件AI作为"认知层"。

---

四、结语：从硅基大脑到碳基身体

这篇论文的价值不在于它让机器人走得多快或多稳，而在于它展示了一条完全不同的控制范式。

过去二十年，机器人控制的主流是"软件吃一切"：更强的CPU、更大的模型、更多的数据。但这带来了一个结构性矛盾：算力越强，功耗越大，延迟越长。

这篇论文回归了一个更古老的范式：让物理本身来做计算。MoS2薄膜的物理特性（忆阻、光电响应、阈值开关）直接编码了神经元的动力学，不需要外部程序来模拟。这是物理AI（Physical AI）的一个典范——不是用硅基芯片模拟碳基大脑，而是用新型材料的物理过程直接实现类似功能。

141皮焦一步。七百亿分之一的心跳。这个能量级别意味着：未来的仿生机器人可能不需要大电池，不需要散热，不需要云端的计算支持。它们可以像真正的动物一样，用极低能耗在野外长期自主运行。

但这还需要时间。二维材料的工程化、大规模制造、长期稳定性——这些不是Nature Communications论文能解决的问题。论文是概念验证，是方向标，是"可以这样走"的证明。

真正的挑战从现在才开始。

---

核心参考文献

1. Wang et al. (2026). Artificial plateau neurons with in-situ spike-malleability for rhythmic quadrupedal locomotion. *Nature Communications*, s41467-026-72428-2. 2. Wang et al. (2025). A bioinspired artificial neuron with intrinsic plasticity based on monolayer MoS2. *Nature Electronics*, DOI: 10.1038/s41928-025-01433-y. 3. Yan et al. (2021). Reconfigurable stochastic neurons based on tin oxide/MoS2 hetero-memristors for simulated annealing and Boltzmann machines. *Nature Communications*, 12, 5455. 4. Gu & Dao (2024). Mamba: Linear-Time Sequence Modeling with Selective State Spaces. *ICML*. 5. Merolla et al. (2014). A million spiking-neuron integrated circuit with a scalable communication network and interface. *Science*, 345(6197), 668-673.

---

#论文 #神经形态计算 #类脑机器人 #MoS2 #石墨烯 #UnitreeGo2 #去中心化控制 #CPG #二维材料 #小凯

《141皮焦的一步：当机器人用二硫化钼做梦》

《141皮焦的一步：当机器人用二硫化钼做梦》

一、这是啥：从生物的"平台神经元"到硅基的人工替代

1.1 生物的步态秘密：CPG和平台神经元

1.2 人工平台神经元的结构：PG-TS双组件

1.3 二维材料：MoS2和石墨烯的角色

1.4 2(PG-TS)：从单个神经元到分布式电路

二、有啥用：5.62微秒的硬件本能

2.1 Unitree Go2：从深度学习到硬件本能

2.2 141.37皮焦/脉冲：功耗的极限压缩

2.3 稳定行走与自适应步态转换

三、怎么用：去中心化控制的边界与追问

3.1 "去中心化"的真相

3.2 端到端延迟 vs 单神经元延迟

3.3 二维材料的稳定性瓶颈

3.4 生物复现的完整性

3.5 泛化性：节律运动 vs 复杂地形

四、结语：从硅基大脑到碳基身体

核心参考文献

五个追问，关于那篇5.62微秒的论文

🌟 智谱 GLM-5 已上线