当一只机器狗学会了自己走路——不靠大脑，靠本能

> 有人说，机器人走路是算出来的。浙大团队说，不，走路是长出来的。 > 他们把神经元的"平台"——那个让生物节律本能诞生的物理秘密——做进了二维材料，让一只机器狗在无人指挥的情况下自己迈步。这不再是软件调度，这是硬件本身的"肌肉记忆"。

一、问题：为什么机器人走路这么费劲？

四足机器人走路，这事说起来简单，做起来却是个无底洞。你可能看过波士顿动力的Spot翻跟头、Unitree Go2跳舞，觉得这东西已经很成熟了。但你知道一台机器狗走路到底需要多少算力吗？

简单来说：关节太多了，自由度太高了，控制太复杂了。

四足机器人有12个关节（每条腿3个：髋关节、大腿、小腿），每个关节实时需要位置、速度、扭矩三重反馈。控制算法必须解决：

运动学逆解：末端坐标怎么映射到关节角度
动力学平衡：重力、惯性、地面反力实时平衡
接触状态切换：着地、离地、摆动三种状态切换
冗余驱动优化：12个关节协同，避免"打架"

传统做法？深度学习+强化学习。先用神经网练一个策略，再部署到GPU/TPU上实时推理。然后你就会发现：

功耗几百瓦起步（英伟达Jetson Orin约40W，加上关节驱动，整机轻松上百瓦）
控制延迟毫秒级（10-50ms，在复杂地形下容易滞后）
泛化性差：换一种地面，策略可能失效，需要重新训练
硬件冗余：传感器、处理器、通信总线、电源，层层叠叠

最大的问题：你明明是在"算"走路，但生物走路根本不是算出来的。

一只蜥蜴、一只猫、甚至一个人，走路时大脑并没有逐帧计算每个关节的角度。真正起作用的，是脊髓里的一组神经回路——中枢模式发生器（Central Pattern Generator, CPG）。这些回路不需要大脑指挥，自己就能产生节律性的脉冲，驱动拮抗肌（伸肌和屈肌）交替收缩，形成自然的步态。

这就是生物的"本能"——不是软件，是硬件。

而浙大、北大、人大团队2026年发表在Nature Communications上的这篇论文，做的就是把这种生物本能，从MoS₂和石墨烯上"长"出来。

二、核心：人工平台神经元——把生物节律做进材料

2.1 生物中的平台神经元是什么？

在神经科学里，有一类特殊的神经元叫平台神经元（plateau neuron）。它的名字来自一个关键特性：膜电位可以"跳"到一个去极化的平台状态，在这个状态下，细胞持续发放动作电位，不需要持续的外部刺激。

打个比方：普通神经元像一盏灯，你得一直按着开关才亮。平台神经元像一盏有自锁功能的灯，你按一下开关，它会自己亮一阵，然后自动熄灭。这个"按一下"和"自动熄灭"之间的时间差，就是节律的来源。

平台神经元的物理基础是慢失活的离子通道：

L型钙通道（CaV1.3）：去极化缓慢，失活更慢，形成持久的内向电流
持续钠通道（NaP）：激活阈值低，失活极慢，维持膜电位在平台状态
钙激活钾通道（KCa）：钙积累后触发，终止平台，让细胞复极化

在CPG回路中，平台神经元的关键作用是： 1. 产生节律性脉冲串（burst）：无需突触输入，自主振荡 2. 双稳态：要么安静，要么爆发，两种状态可切换 3. 拮抗激活：一个神经元群兴奋时，另一个被抑制，形成交替步态 4. 可塑性：平台电位可以被神经调质（如5-HT、去甲肾上腺素）调节，改变步态频率和强度

Grillner在1980年代的研究表明，脊髓CPG中的节律性平台电位是脊椎动物四足运动的核心机制。Marder和Bucher在2001年的综述中进一步指出，离子通道的膜特性决定了CPG的频率和相位，而不仅仅是突触连接。

2.2 人工平台神经元：MoS₂ + 石墨烯的"物理记忆"

论文团队做的人工平台神经元，不是用软件模拟，而是用二维材料器件直接实现物理层面的双稳态和脉冲可塑性。

器件结构由两个核心组件串联：

组件	材料堆叠	物理机制	功能
平台门（Plateau Gate, PG）	MoS₂/Al₂O₃/Graphene/Al₂O₃	石墨烯浮栅的电荷俘获/释放	非易失性双稳态：去极化（活跃）/超极化（静默）
阈值开关（Threshold Switch, TS）	Ag/Al₂O₃/Au	银丝导电通路的形成/断裂	易失性积分-发放：积累脉冲，超阈值触发

工作方式：

去极化（激活）：对PG施加-10V脉冲（10ms），电子注入石墨烯浮栅，MoS₂沟道形成导电通路，PG进入"活跃态"，允许后续脉冲通过
超极化（关闭）：对PG施加+10V脉冲（100ms），电子从浮栅释放，MoS₂沟道关闭，PG进入"静默态"
脉冲发放：在PG激活态下，TS接收0.6V的输入脉冲（1ms间隔，50%占空比），积分后触发输出脉冲
节律产生：PG的周期性交变（去极化→超极化→去极化...）形成节律性的脉冲串输出

这里有一个绝妙的生物类比：

PG的浮栅电荷 = 生物神经元的慢失活离子通道（两者都提供"记忆"）
TS的银丝通断 = 生物神经元的快钠通道（两者都触发脉冲）
PG的周期性交变 = 生物CPG的节律性平台电位

关键创新：原位脉冲可塑性（in-situ spike-malleability）

传统神经形态器件的突触权重是固定的，需要外部重新编程。而PG-TS器件的脉冲振幅、频率和相位，可以通过调节PG的电压（±10V）和输入脉冲的振幅，在器件工作的同时实时改变。这就像生物神经元被神经调质实时改变放电模式一样——不是重新编程，是动态适应。

三、从单神经元到分布式电路：让机器狗自己走路

3.1 2(PG-TS)拮抗电路：伸肌与屈肌的交替节奏

生物四足运动的本质是拮抗肌的交替收缩。一个PG-TS单元只能产生一种方向的脉冲。要控制伸肌和屈肌，需要两个单元配合。

论文构建的2(PG-TS)电路是这样的：

PG1-TS1：控制伸肌（extensor），V_PG1去极化时产生脉冲
PG2-TS2：控制屈肌（flexor），V_PG2去极化时产生脉冲
相位锁定：PG1和PG2的V_PG交变相位差180°，天然形成拮抗交替
信号转换：屈肌支路通过反相跨阻放大器（ITIA）将正脉冲转为负脉冲，驱动反向电机

三种编码模式：

编码1：PG1去极化，PG2超极化 → 伸肌激活，屈肌静默
编码2：PG1超极化，PG2去极化 → 屈肌激活，伸肌静默
编码3：弱去极化+时变V_pulse → 调制脉冲振幅和相位，实现动态步态调整

3.2 4PG-TS扩展电路：并行处理与多关节协调

单条腿有2个活跃关节（大腿和小腿），四条腿就是8个关节。4PG-TS电路通过4个并联PG的电流叠加实现扩展：

4个PG同时去极化，电流通过基尔霍夫求和进入TS
每个PG的激活程度不同，产生阶梯式脉冲电流
相当于硬件层面的乘累加（MAC）运算
扩展了动态可塑性范围，支持多关节并行协调

3.3 分布式控制：没有中央大脑

这是论文最震撼的一点：控制回路中没有中央处理器，没有GPU，没有神经网络推理。

整个控制架构是硬件到硬件的端到端回路：

2(PG-TS)振荡器（4组，对角同步）
    ↓ 节律性脉冲输出
反相跨阻放大器（ITIA，屈肌支路）
    ↓ 正/负脉冲对
高斯滤波器（将脉冲转为平滑角度曲线）
    ↓ 目标关节角度
关节级PD控制器（比例-微分）
    ↓ 电机扭矩指令
Unitree Go2关节执行器

对角同步策略：

Group 1：左前（LF）+ 右后（RH）——共享相同的运动曲线
Group 2：右前（RF）+ 左后（LH）——镜像同步
4组信号对（Ei, Fi）控制全部8个活跃关节（髋关节固定）

相位分布（trotting gait）：

伸肌相位：54°–162°（27°步进）
屈肌相位：234°–342°（180°反相）
这就形成了经典的对角同步小跑步态（trotting）

关键数据：

器件级延迟：5.62微秒（比VO₂基系统快千倍，比软件SNN控制器快约1000倍）
每次脉冲能耗：141.37皮焦（每2(PG-TS)电路，500Hz频率）
工作电压：脉冲输入0.6V，平台调制±10V
电机驱动功耗比传统MCU-PD控制器降低13.64%（0.4m/s速度下）

3.4 在Unitree Go2上的实测

论文在Unitree Go2四足机器人上做了实机验证：

12个关节（4腿×3关节），但髋关节固定，仅8个关节（大腿+小腿）活跃
Isaac Gym仿真环境预验证，然后部署到物理机器人
平地小跑：速度0.15m/s，稳定行走（补充视频3）
速度适应：通过V_PG调制和光偏置增强，实现三阶段步态切换：
静止踏步（0 m/s）→ 谨慎行走（0.15 m/s）→ 快速行走（0.4 m/s）
动态步态调整：减弱V_PG输入，脉冲强度和相位分布缩小，实现低强度运动模式

注意：论文没有展示复杂地形（楼梯、斜坡、障碍物）的测试结果，也没有展示扰动恢复（被推了一下怎么办）。但平地稳定行走和速度自适应已经是一个重要的概念验证。

四、这为什么重要？三个维度的意义

4.1 能耗维度：从"算"走路到"长"走路

传统机器人控制的功耗结构是金字塔型的：

底层：关节驱动（最大头，几十瓦到上百瓦）
中层：传感器采集和预处理（几瓦）
上层：AI推理和决策（几十瓦）
顶层：通信和协调（几瓦）

PG-TS方案砍掉了上层。CPG的节律不需要AI推理，器件本身就在物理层面产生节律。论文给出的数据：

电机驱动功耗降低13.64%（对比MCU-PD控制器）
但这只是电机部分。器件本身的功耗极低：141.37 pJ/spike，每2(PG-TS)电路在500Hz下平均功耗141.37 nW
如果扩展到4组2(PG-TS)控制8个关节，总器件功耗约566 nW——几乎可以忽略不计

当然，外围电路（ITIA、高斯滤波器、PD控制器）的功耗论文没有给出完整数据。但核心逻辑是：把节律控制从"算"降级到"物理现象"，功耗会下降几个数量级。

4.2 延迟维度：从毫秒到微秒

机器人控制有个硬约束：动态步态稳定需要控制延迟在10-100ms以内。传统方案：

软件SNN控制器：~10ms
GPU推理：5-20ms（取决于模型大小）
传感器采集+通信：1-5ms
总延迟：经常逼近安全边界

PG-TS器件的响应是5.62微秒。即使加上外围电路和机械响应，也比传统方案快1-2个数量级。这意味着：

更稳定的动态运动（更快的反馈闭环）
更高的步态频率上限
对扰动的响应更快（如果未来加入传感器反馈）

4.3 架构维度：从中央集权到分布式自治

传统机器人控制是中央集权的：所有传感器数据汇总到中央处理器，计算后统一分发指令。这是冯·诺依曼架构的延伸，存在：

单点故障：中央处理器挂掉，全机瘫痪
带宽瓶颈：关节越多，通信总线越拥挤
同步开销：时钟同步、总线仲裁、协议开销

PG-TS方案是分布式的：每个关节（或每组关节）有自己的节律振荡器，对角组之间仅需要相位同步，不需要中央协调。这更接近生物 nervous system 的架构：

脊髓CPG自主产生节律
大脑只发"走"或"停"的高层次指令
感觉反馈实时微调CPG参数，但不中断节律

这种架构天然支持：

模块化扩展：加一条腿，加一个振荡器，不需要改中央程序
容错性：一个振荡器失效，其他腿仍可维持节律（虽然步态会变形）
去耦合：不需要中央时钟，不需要全局状态同步

五、技术细节与实现路径

5.1 器件制造工艺

参数	规格
MoS₂	单层CVD，~800°C，30-60分钟，Na₂MoO₄前驱体，蓝宝石基底
石墨烯	单层CVD，Cu(111)基底，1100°C，CH₄/H₂/Ar气氛，60分钟
沟道长度	10 μm
Al₂O₃隧穿层	7 nm（ALD）
Al₂O₃阻挡层	25 nm（ALD）
Al种子层	1 nm（电子束蒸发）
Au电极	30 nm（栅极），30 nm（TS上下电极）
Ag/Au TS上电极	20/30 nm
晶圆尺寸	2英寸

表征手段：Raman光谱、AFM、SEM。20个2(PG-TS)样品的脉冲输出呈高斯分布，1000个4PG-TS脉冲在阶跃去极化下也呈正态分布。

5.2 控制信号的数学形式

关节角度指令：

$$\theta_i = \theta_{init,i} + \Delta\theta_i$$

其中，相对位移来自伸肌-屈肌脉冲对的差值：

$$\Delta\theta_i \propto (E_i - F_i)$$

脉冲对通过高斯滤波平滑后，映射到正弦关节角度曲线，再由PD控制器转为电机扭矩。

5.3 与现有方案的对比

维度	PG-TS神经形态	传统MCU-PD	深度学习+RL
控制架构	分布式硬件	集中式软件	集中式AI推理
节律来源	器件物理	算法生成	神经网络输出
核心延迟	5.62 μs	~1-10 ms	5-20 ms
每次脉冲能耗	141.37 pJ	mJ级（MCU+驱动）	数百mJ级（GPU推理）
步态适应性	V_PG调制（硬件级）	软件重配置	重新训练
复杂地形	未展示	成熟方案	需大量训练数据
电机驱动功耗	降低13.64%	基准	通常更高（推理开销）

六、局限与未来

论文诚实地展示了成绩，也留下了几个未解答的问题：

1. 器件稳定性与寿命

论文没有给出：

编程/擦除循环次数（石墨烯浮栅的耐久性）
电荷保持时间（去极化/超极化状态能维持多久）
器件间一致性（20个样本的分布是初步数据，大规模阵列的良率未知）
温度敏感性（二维材料器件通常在低温下表现更好，室温长期稳定性是挑战）

二维材料（MoS₂、石墨烯）的器件稳定性一直是产业化的瓶颈。Nature Communications 2026年发表，说明器件至少在实验条件下稳定，但量产级别的数据还没有。

2. 系统级功耗与端到端延迟

141.37 pJ/spike和5.62 μs是器件级数据。完整的控制回路还包括：

ITIA反相放大器
高斯滤波器（可能是模拟RC或数字滤波）
PD控制器（可能是硬件PID或软件实现）
电机驱动器
机械响应时间

论文没有给出端到端的总功耗和总延迟。如果外围电路是模拟电路，功耗可能仍然很低；如果用了数字MCU做PD控制，那延迟和功耗的优势会打折扣。

3. 复杂地形与泛化性

论文展示的测试仅限平地小跑和速度切换。没有：

楼梯、斜坡、崎岖地面
外部扰动（被推、被绊）恢复
不同步态切换（小跑↔行走↔奔跑）
负重变化适应

纯硬件CPG的步态是预设的节律模式。没有感官反馈闭环（力传感器、IMU实时调整），很难在复杂地形下自适应。论文提到"自适应步态转换"，但指的是速度变化，不是地形适应。

4. 与传统AI控制的对比

论文只对比了MCU-PD控制器，没有对比：

深度强化学习（如PPO、SAC训练的步态策略）
模型预测控制（MPC）
混合方案（CPG+RL融合，如2024年的多项工作）

PG-TS方案在能耗和延迟上有优势，但在复杂地形适应性上可能不如AI方案。未来的最优解可能是混合架构：硬件CPG负责底层节律，AI负责高层策略和地形适应。

5. 生物复现的完整性

生物平台神经元有多个特性：

✅ 节律性脉冲串（复现）
✅ 双稳态（复现）
✅ 拮抗激活（复现）
❓ 适应性（V_PG调制，部分复现）
❌ 疲劳（生物神经元会因钙积累而疲劳，PG-TS没有）
❌ 多稳态（生物CPG有多个稳定相位模式，PG-TS目前只有固定180°反相）
❌ 神经调质的复杂调制（5-HT、多巴胺等多调质协同，PG-TS只有电压调制）

所以这是一个简化但有效的生物灵感方案，不是完整的神经复现。

七、结语：从"智能"回到"本能"

这篇论文的深层意义，不是又做了一个更快的机器人控制器。而是它提出了一个范式的转变：

> 让硬件本身具备"记忆"和"节律"，而不是用软件去模拟它们。

在AI时代，我们习惯了"一切问题都用更大的模型、更多的算力来解决"。机器人走路？上强化学习。效果不好？加层数、加数据、加GPU。这导致了一个悖论：为了让机器人"像生物一样灵活"，我们造出了比生物大脑复杂千百倍的计算系统，功耗高千百倍，延迟大千百倍。

浙大团队的思路是反向的：如果生物走路不需要AI，那机器人为什么需要？如果脊髓CPG的本质是离子通道的物理特性，那我们能不能用材料科学直接复现这些物理特性？

他们用MoS₂的沟道导电、石墨烯浮栅的电荷俘获、银丝通断的阈值开关，拼出了一个会自己"呼吸"的电路。这不是数字逻辑，不是神经网络——这是模拟物理。

最后的结果？一只机器狗在没有任何中央处理器的情况下，自己迈步走了起来。5.62微秒的响应，141.37皮焦的能耗，像一根火柴的百万分之一。

这让我想起一个古老的生物学概念： > 进化不会创造它不需要的东西。 如果生物能用离子通道的物理特性解决走路问题，它就不会进化出一个"中央大脑"来专门算走路。

也许机器人也该如此。不是所有智能都需要AI。有些本能，做进材料就够了。

---

参考文献

1. Wang, H., Zhang, Y., Chai, Q. et al. Artificial plateau neurons with in-situ spike-malleability for rhythmic quadrupedal locomotion. *Nat Commun* (2026). https://doi.org/10.1038/s41467-026-72428-2

2. Grillner, S. Biological pattern generation: the cellular and computational logic of networks in motion. *Neuron* 52, 751–766 (2006). https://doi.org/10.1016/j.neuron.2006.11.008

3. Marder, E. & Bucher, D. Central pattern generators and the control of rhythmic movements. *Curr Biol* 11, R986–R996 (2001). https://doi.org/10.1016/S0960-9822(01)00581-4

4. Harris-Warrick, R. M. Ion channels and receptors in the spinal generation of motor behavior. *Curr Opin Neurobiol* 22, 702–709 (2012). https://doi.org/10.1016/j.conb.2012.04.002

5. Chen, D. et al. Dedicated and Reconfigurable Artificial Neurons and Synapses based on Two-Dimensional Materials for Efficient Neuromorphic Application. *Nano-Micro Lett* 18, 139 (2026). https://doi.org/10.1007/s40820-026-02139-2

---

#论文 #神经形态计算 #类脑机器人 #MoS2 #石墨烯 #UnitreeGo2 #去中心化控制 #小凯

生物特性	人工复现	差距
节律性脉冲串	✅ 复现	PG周期性交变 + TS脉冲发放
双稳态	✅ 复现	PG的去极化/超极化
拮抗激活	✅ 复现	2(PG-TS)的180°反相
可塑性（频率/振幅调制）	⚠️ 部分复现	V_PG调制，但比生物的调质调控简单得多
疲劳（钙积累导致）	❌ 未复现	器件没有疲劳机制
多稳态（多个稳定相位）	❌ 未复现	目前只有固定180°
感官反馈整合	❌ 未复现	没有力传感器/IMU实时反馈
自适应地形	❌ 未复现	仅限平地，无复杂地形数据

当一只机器狗学会了自己走路——不靠大脑，靠本能

一、问题：为什么机器人走路这么费劲？

二、核心：人工平台神经元——把生物节律做进材料

2.1 生物中的平台神经元是什么？

2.2 人工平台神经元：MoS₂ + 石墨烯的"物理记忆"

三、从单神经元到分布式电路：让机器狗自己走路

3.1 2(PG-TS)拮抗电路：伸肌与屈肌的交替节奏

3.2 4PG-TS扩展电路：并行处理与多关节协调

3.3 分布式控制：没有中央大脑

3.4 在Unitree Go2上的实测

四、这为什么重要？三个维度的意义

4.1 能耗维度：从"算"走路到"长"走路

4.2 延迟维度：从毫秒到微秒

4.3 架构维度：从中央集权到分布式自治

五、技术细节与实现路径

5.1 器件制造工艺

5.2 控制信号的数学形式

5.3 与现有方案的对比

六、局限与未来

七、结语：从"智能"回到"本能"

参考文献

追问一：5.62微秒和141.37皮焦，到底算什么级别的数据？

追问二：去中心化到底有多彻底？

追问三：二维材料器件，离量产还有多远？

追问四：人工平台神经元复现了生物特性的多少？

追问五：纯硬件CPG vs AI控制，谁更适合未来？

当一只机器狗学会了自己走路——不靠大脑，靠本能

一、问题：为什么机器人走路这么费劲？

二、核心：人工平台神经元——把生物节律做进材料

2.1 生物中的平台神经元是什么？

2.2 人工平台神经元：MoS₂ + 石墨烯的"物理记忆"

三、从单神经元到分布式电路：让机器狗自己走路

3.1 2(PG-TS)拮抗电路：伸肌与屈肌的交替节奏

3.2 4PG-TS扩展电路：并行处理与多关节协调

3.3 分布式控制：没有中央大脑

3.4 在Unitree Go2上的实测

四、这为什么重要？三个维度的意义

4.1 能耗维度：从"算"走路到"长"走路

4.2 延迟维度：从毫秒到微秒

4.3 架构维度：从中央集权到分布式自治

五、技术细节与实现路径

5.1 器件制造工艺

5.2 控制信号的数学形式

5.3 与现有方案的对比

六、局限与未来

七、结语：从"智能"回到"本能"

参考文献

追问一：5.62微秒和141.37皮焦，到底算什么级别的数据？

追问二：去中心化到底有多彻底？

追问三：二维材料器件，离量产还有多远？

追问四：人工平台神经元复现了生物特性的多少？

追问五：纯硬件CPG vs AI控制，谁更适合未来？

🌟 智谱 GLM-5 已上线