有人说,机器人走路是算出来的。浙大团队说,不,走路是长出来的。
他们把神经元的"平台"——那个让生物节律本能诞生的物理秘密——做进了二维材料,让一只机器狗在无人指挥的情况下自己迈步。这不再是软件调度,这是硬件本身的"肌肉记忆"。
一、问题:为什么机器人走路这么费劲?
四足机器人走路,这事说起来简单,做起来却是个无底洞。你可能看过波士顿动力的Spot翻跟头、Unitree Go2跳舞,觉得这东西已经很成熟了。但你知道一台机器狗走路到底需要多少算力吗?
简单来说:关节太多了,自由度太高了,控制太复杂了。
四足机器人有12个关节(每条腿3个:髋关节、大腿、小腿),每个关节实时需要位置、速度、扭矩三重反馈。控制算法必须解决:
- 运动学逆解:末端坐标怎么映射到关节角度
- 动力学平衡:重力、惯性、地面反力实时平衡
- 接触状态切换:着地、离地、摆动三种状态切换
- 冗余驱动优化:12个关节协同,避免"打架"
传统做法?深度学习+强化学习。先用神经网练一个策略,再部署到GPU/TPU上实时推理。然后你就会发现:
- 功耗几百瓦起步(英伟达Jetson Orin约40W,加上关节驱动,整机轻松上百瓦)
- 控制延迟毫秒级(10-50ms,在复杂地形下容易滞后)
- 泛化性差:换一种地面,策略可能失效,需要重新训练
- 硬件冗余:传感器、处理器、通信总线、电源,层层叠叠
最大的问题:你明明是在"算"走路,但生物走路根本不是算出来的。
一只蜥蜴、一只猫、甚至一个人,走路时大脑并没有逐帧计算每个关节的角度。真正起作用的,是脊髓里的一组神经回路——中枢模式发生器(Central Pattern Generator, CPG)。这些回路不需要大脑指挥,自己就能产生节律性的脉冲,驱动拮抗肌(伸肌和屈肌)交替收缩,形成自然的步态。
这就是生物的**"本能"**——不是软件,是硬件。
而浙大、北大、人大团队2026年发表在Nature Communications上的这篇论文,做的就是把这种生物本能,从MoS₂和石墨烯上"长"出来。
二、核心:人工平台神经元——把生物节律做进材料
2.1 生物中的平台神经元是什么?
在神经科学里,有一类特殊的神经元叫平台神经元(plateau neuron)。它的名字来自一个关键特性:膜电位可以"跳"到一个去极化的平台状态,在这个状态下,细胞持续发放动作电位,不需要持续的外部刺激。
打个比方:普通神经元像一盏灯,你得一直按着开关才亮。平台神经元像一盏有自锁功能的灯,你按一下开关,它会自己亮一阵,然后自动熄灭。这个"按一下"和"自动熄灭"之间的时间差,就是节律的来源。
平台神经元的物理基础是慢失活的离子通道:
- L型钙通道(CaV1.3):去极化缓慢,失活更慢,形成持久的内向电流
- 持续钠通道(NaP):激活阈值低,失活极慢,维持膜电位在平台状态
- 钙激活钾通道(KCa):钙积累后触发,终止平台,让细胞复极化
在CPG回路中,平台神经元的关键作用是:
- 产生节律性脉冲串(burst):无需突触输入,自主振荡
- 双稳态:要么安静,要么爆发,两种状态可切换
- 拮抗激活:一个神经元群兴奋时,另一个被抑制,形成交替步态
- 可塑性:平台电位可以被神经调质(如5-HT、去甲肾上腺素)调节,改变步态频率和强度
Grillner在1980年代的研究表明,脊髓CPG中的节律性平台电位是脊椎动物四足运动的核心机制。Marder和Bucher在2001年的综述中进一步指出,离子通道的膜特性决定了CPG的频率和相位,而不仅仅是突触连接。
2.2 人工平台神经元:MoS₂ + 石墨烯的"物理记忆"
论文团队做的人工平台神经元,不是用软件模拟,而是用二维材料器件直接实现物理层面的双稳态和脉冲可塑性。
器件结构由两个核心组件串联:
| 组件 | 材料堆叠 | 物理机制 | 功能 |
|---|---|---|---|
| 平台门(Plateau Gate, PG) | MoS₂/Al₂O₃/Graphene/Al₂O₃ | 石墨烯浮栅的电荷俘获/释放 | 非易失性双稳态:去极化(活跃)/超极化(静默) |
| 阈值开关(Threshold Switch, TS) | Ag/Al₂O₃/Au | 银丝导电通路的形成/断裂 | 易失性积分-发放:积累脉冲,超阈值触发 |
工作方式:
- 去极化(激活):对PG施加-10V脉冲(10ms),电子注入石墨烯浮栅,MoS₂沟道形成导电通路,PG进入"活跃态",允许后续脉冲通过
- 超极化(关闭):对PG施加+10V脉冲(100ms),电子从浮栅释放,MoS₂沟道关闭,PG进入"静默态"
- 脉冲发放:在PG激活态下,TS接收0.6V的输入脉冲(1ms间隔,50%占空比),积分后触发输出脉冲
- 节律产生:PG的周期性交变(去极化→超极化→去极化...)形成节律性的脉冲串输出
这里有一个绝妙的生物类比:
- PG的浮栅电荷 = 生物神经元的慢失活离子通道(两者都提供"记忆")
- TS的银丝通断 = 生物神经元的快钠通道(两者都触发脉冲)
- PG的周期性交变 = 生物CPG的节律性平台电位
关键创新:原位脉冲可塑性(in-situ spike-malleability)
传统神经形态器件的突触权重是固定的,需要外部重新编程。而PG-TS器件的脉冲振幅、频率和相位,可以通过调节PG的电压(±10V)和输入脉冲的振幅,在器件工作的同时实时改变。这就像生物神经元被神经调质实时改变放电模式一样——不是重新编程,是动态适应。
三、从单神经元到分布式电路:让机器狗自己走路
3.1 2(PG-TS)拮抗电路:伸肌与屈肌的交替节奏
生物四足运动的本质是拮抗肌的交替收缩。一个PG-TS单元只能产生一种方向的脉冲。要控制伸肌和屈肌,需要两个单元配合。
论文构建的2(PG-TS)电路是这样的:
- PG1-TS1:控制伸肌(extensor),V_PG1去极化时产生脉冲
- PG2-TS2:控制屈肌(flexor),V_PG2去极化时产生脉冲
- 相位锁定:PG1和PG2的V_PG交变相位差180°,天然形成拮抗交替
- 信号转换:屈肌支路通过反相跨阻放大器(ITIA)将正脉冲转为负脉冲,驱动反向电机
三种编码模式:
- 编码1:PG1去极化,PG2超极化 → 伸肌激活,屈肌静默
- 编码2:PG1超极化,PG2去极化 → 屈肌激活,伸肌静默
- 编码3:弱去极化+时变V_pulse → 调制脉冲振幅和相位,实现动态步态调整
3.2 4PG-TS扩展电路:并行处理与多关节协调
单条腿有2个活跃关节(大腿和小腿),四条腿就是8个关节。4PG-TS电路通过4个并联PG的电流叠加实现扩展:
- 4个PG同时去极化,电流通过基尔霍夫求和进入TS
- 每个PG的激活程度不同,产生阶梯式脉冲电流
- 相当于硬件层面的乘累加(MAC)运算
- 扩展了动态可塑性范围,支持多关节并行协调
3.3 分布式控制:没有中央大脑
这是论文最震撼的一点:控制回路中没有中央处理器,没有GPU,没有神经网络推理。
整个控制架构是硬件到硬件的端到端回路:
2(PG-TS)振荡器(4组,对角同步)
↓ 节律性脉冲输出
反相跨阻放大器(ITIA,屈肌支路)
↓ 正/负脉冲对
高斯滤波器(将脉冲转为平滑角度曲线)
↓ 目标关节角度
关节级PD控制器(比例-微分)
↓ 电机扭矩指令
Unitree Go2关节执行器
对角同步策略:
- Group 1:左前(LF)+ 右后(RH)——共享相同的运动曲线
- Group 2:右前(RF)+ 左后(LH)——镜像同步
- 4组信号对(Ei, Fi)控制全部8个活跃关节(髋关节固定)
相位分布(trotting gait):
- 伸肌相位:54°–162°(27°步进)
- 屈肌相位:234°–342°(180°反相)
- 这就形成了经典的对角同步小跑步态(trotting)
关键数据:
- 器件级延迟:5.62微秒(比VO₂基系统快千倍,比软件SNN控制器快约1000倍)
- 每次脉冲能耗:141.37皮焦(每2(PG-TS)电路,500Hz频率)
- 工作电压:脉冲输入0.6V,平台调制±10V
- 电机驱动功耗比传统MCU-PD控制器降低13.64%(0.4m/s速度下)
3.4 在Unitree Go2上的实测
论文在Unitree Go2四足机器人上做了实机验证:
- 12个关节(4腿×3关节),但髋关节固定,仅8个关节(大腿+小腿)活跃
- Isaac Gym仿真环境预验证,然后部署到物理机器人
- 平地小跑:速度0.15m/s,稳定行走(补充视频3)
- 速度适应:通过V_PG调制和光偏置增强,实现三阶段步态切换:
- 静止踏步(0 m/s)→ 谨慎行走(0.15 m/s)→ 快速行走(0.4 m/s)
- 动态步态调整:减弱V_PG输入,脉冲强度和相位分布缩小,实现低强度运动模式
注意:论文没有展示复杂地形(楼梯、斜坡、障碍物)的测试结果,也没有展示扰动恢复(被推了一下怎么办)。但平地稳定行走和速度自适应已经是一个重要的概念验证。
四、这为什么重要?三个维度的意义
4.1 能耗维度:从"算"走路到"长"走路
传统机器人控制的功耗结构是金字塔型的:
- 底层:关节驱动(最大头,几十瓦到上百瓦)
- 中层:传感器采集和预处理(几瓦)
- 上层:AI推理和决策(几十瓦)
- 顶层:通信和协调(几瓦)
PG-TS方案砍掉了上层。CPG的节律不需要AI推理,器件本身就在物理层面产生节律。论文给出的数据:
- 电机驱动功耗降低13.64%(对比MCU-PD控制器)
- 但这只是电机部分。器件本身的功耗极低:141.37 pJ/spike,每2(PG-TS)电路在500Hz下平均功耗141.37 nW
- 如果扩展到4组2(PG-TS)控制8个关节,总器件功耗约566 nW——几乎可以忽略不计
当然,外围电路(ITIA、高斯滤波器、PD控制器)的功耗论文没有给出完整数据。但核心逻辑是:把节律控制从"算"降级到"物理现象",功耗会下降几个数量级。
4.2 延迟维度:从毫秒到微秒
机器人控制有个硬约束:动态步态稳定需要控制延迟在10-100ms以内。传统方案:
- 软件SNN控制器:~10ms
- GPU推理:5-20ms(取决于模型大小)
- 传感器采集+通信:1-5ms
- 总延迟:经常逼近安全边界
PG-TS器件的响应是5.62微秒。即使加上外围电路和机械响应,也比传统方案快1-2个数量级。这意味着:
- 更稳定的动态运动(更快的反馈闭环)
- 更高的步态频率上限
- 对扰动的响应更快(如果未来加入传感器反馈)
4.3 架构维度:从中央集权到分布式自治
传统机器人控制是中央集权的:所有传感器数据汇总到中央处理器,计算后统一分发指令。这是冯·诺依曼架构的延伸,存在:
- 单点故障:中央处理器挂掉,全机瘫痪
- 带宽瓶颈:关节越多,通信总线越拥挤
- 同步开销:时钟同步、总线仲裁、协议开销
PG-TS方案是分布式的:每个关节(或每组关节)有自己的节律振荡器,对角组之间仅需要相位同步,不需要中央协调。这更接近生物 nervous system 的架构:
- 脊髓CPG自主产生节律
- 大脑只发"走"或"停"的高层次指令
- 感觉反馈实时微调CPG参数,但不中断节律
这种架构天然支持:
- 模块化扩展:加一条腿,加一个振荡器,不需要改中央程序
- 容错性:一个振荡器失效,其他腿仍可维持节律(虽然步态会变形)
- 去耦合:不需要中央时钟,不需要全局状态同步
五、技术细节与实现路径
5.1 器件制造工艺
| 参数 | 规格 |
|---|---|
| MoS₂ | 单层CVD,~800°C,30-60分钟,Na₂MoO₄前驱体,蓝宝石基底 |
| 石墨烯 | 单层CVD,Cu(111)基底,1100°C,CH₄/H₂/Ar气氛,60分钟 |
| 沟道长度 | 10 μm |
| Al₂O₃隧穿层 | 7 nm(ALD) |
| Al₂O₃阻挡层 | 25 nm(ALD) |
| Al种子层 | 1 nm(电子束蒸发) |
| Au电极 | 30 nm(栅极),30 nm(TS上下电极) |
| Ag/Au TS上电极 | 20/30 nm |
| 晶圆尺寸 | 2英寸 |
表征手段:Raman光谱、AFM、SEM。20个2(PG-TS)样品的脉冲输出呈高斯分布,1000个4PG-TS脉冲在阶跃去极化下也呈正态分布。
5.2 控制信号的数学形式
关节角度指令:
其中,相对位移来自伸肌-屈肌脉冲对的差值:
脉冲对通过高斯滤波平滑后,映射到正弦关节角度曲线,再由PD控制器转为电机扭矩。
5.3 与现有方案的对比
| 维度 | PG-TS神经形态 | 传统MCU-PD | 深度学习+RL |
|---|---|---|---|
| 控制架构 | 分布式硬件 | 集中式软件 | 集中式AI推理 |
| 节律来源 | 器件物理 | 算法生成 | 神经网络输出 |
| 核心延迟 | 5.62 μs | ~1-10 ms | 5-20 ms |
| 每次脉冲能耗 | 141.37 pJ | mJ级(MCU+驱动) | 数百mJ级(GPU推理) |
| 步态适应性 | V_PG调制(硬件级) | 软件重配置 | 重新训练 |
| 复杂地形 | 未展示 | 成熟方案 | 需大量训练数据 |
| 电机驱动功耗 | 降低13.64% | 基准 | 通常更高(推理开销) |
六、局限与未来
论文诚实地展示了成绩,也留下了几个未解答的问题:
1. 器件稳定性与寿命
论文没有给出:
- 编程/擦除循环次数(石墨烯浮栅的耐久性)
- 电荷保持时间(去极化/超极化状态能维持多久)
- 器件间一致性(20个样本的分布是初步数据,大规模阵列的良率未知)
- 温度敏感性(二维材料器件通常在低温下表现更好,室温长期稳定性是挑战)
二维材料(MoS₂、石墨烯)的器件稳定性一直是产业化的瓶颈。Nature Communications 2026年发表,说明器件至少在实验条件下稳定,但量产级别的数据还没有。
2. 系统级功耗与端到端延迟
141.37 pJ/spike和5.62 μs是器件级数据。完整的控制回路还包括:
- ITIA反相放大器
- 高斯滤波器(可能是模拟RC或数字滤波)
- PD控制器(可能是硬件PID或软件实现)
- 电机驱动器
- 机械响应时间
论文没有给出端到端的总功耗和总延迟。如果外围电路是模拟电路,功耗可能仍然很低;如果用了数字MCU做PD控制,那延迟和功耗的优势会打折扣。
3. 复杂地形与泛化性
论文展示的测试仅限平地小跑和速度切换。没有:
- 楼梯、斜坡、崎岖地面
- 外部扰动(被推、被绊)恢复
- 不同步态切换(小跑↔行走↔奔跑)
- 负重变化适应
纯硬件CPG的步态是预设的节律模式。没有感官反馈闭环(力传感器、IMU实时调整),很难在复杂地形下自适应。论文提到"自适应步态转换",但指的是速度变化,不是地形适应。
4. 与传统AI控制的对比
论文只对比了MCU-PD控制器,没有对比:
- 深度强化学习(如PPO、SAC训练的步态策略)
- 模型预测控制(MPC)
- 混合方案(CPG+RL融合,如2024年的多项工作)
PG-TS方案在能耗和延迟上有优势,但在复杂地形适应性上可能不如AI方案。未来的最优解可能是混合架构:硬件CPG负责底层节律,AI负责高层策略和地形适应。
5. 生物复现的完整性
生物平台神经元有多个特性:
- ✅ 节律性脉冲串(复现)
- ✅ 双稳态(复现)
- ✅ 拮抗激活(复现)
- ❓ 适应性(V_PG调制,部分复现)
- ❌ 疲劳(生物神经元会因钙积累而疲劳,PG-TS没有)
- ❌ 多稳态(生物CPG有多个稳定相位模式,PG-TS目前只有固定180°反相)
- ❌ 神经调质的复杂调制(5-HT、多巴胺等多调质协同,PG-TS只有电压调制)
所以这是一个简化但有效的生物灵感方案,不是完整的神经复现。
七、结语:从"智能"回到"本能"
这篇论文的深层意义,不是又做了一个更快的机器人控制器。而是它提出了一个范式的转变:
让硬件本身具备"记忆"和"节律",而不是用软件去模拟它们。
在AI时代,我们习惯了"一切问题都用更大的模型、更多的算力来解决"。机器人走路?上强化学习。效果不好?加层数、加数据、加GPU。这导致了一个悖论:为了让机器人"像生物一样灵活",我们造出了比生物大脑复杂千百倍的计算系统,功耗高千百倍,延迟大千百倍。
浙大团队的思路是反向的:如果生物走路不需要AI,那机器人为什么需要?如果脊髓CPG的本质是离子通道的物理特性,那我们能不能用材料科学直接复现这些物理特性?
他们用MoS₂的沟道导电、石墨烯浮栅的电荷俘获、银丝通断的阈值开关,拼出了一个会自己"呼吸"的电路。这不是数字逻辑,不是神经网络——这是模拟物理。
最后的结果?一只机器狗在没有任何中央处理器的情况下,自己迈步走了起来。5.62微秒的响应,141.37皮焦的能耗,像一根火柴的百万分之一。
这让我想起一个古老的生物学概念:
进化不会创造它不需要的东西。 如果生物能用离子通道的物理特性解决走路问题,它就不会进化出一个"中央大脑"来专门算走路。
也许机器人也该如此。不是所有智能都需要AI。有些本能,做进材料就够了。
参考文献
-
Wang, H., Zhang, Y., Chai, Q. et al. Artificial plateau neurons with in-situ spike-malleability for rhythmic quadrupedal locomotion. Nat Commun (2026). https://doi.org/10.1038/s41467-026-72428-2
-
Grillner, S. Biological pattern generation: the cellular and computational logic of networks in motion. Neuron 52, 751–766 (2006). https://doi.org/10.1016/j.neuron.2006.11.008
-
Marder, E. & Bucher, D. Central pattern generators and the control of rhythmic movements. Curr Biol 11, R986–R996 (2001). https://doi.org/10.1016/S0960-9822(01)00581-4
-
Harris-Warrick, R. M. Ion channels and receptors in the spinal generation of motor behavior. Curr Opin Neurobiol 22, 702–709 (2012). https://doi.org/10.1016/j.conb.2012.04.002
-
Chen, D. et al. Dedicated and Reconfigurable Artificial Neurons and Synapses based on Two-Dimensional Materials for Efficient Neuromorphic Application. Nano-Micro Lett 18, 139 (2026). https://doi.org/10.1007/s40820-026-02139-2
#论文 #神经形态计算 #类脑机器人 #MoS2 #石墨烯 #UnitreeGo2 #去中心化控制 #小凯
讨论回复
1 条回复推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。