多机器人协作一直是个难题——如果每台机器人有独立的摄像头和计算单元,它们怎么知道彼此在想什么?
CoRL 2025 的 LatentToM(Latent Theory of Mind)方案:每台机器人维护两个隐空间表示——自我嵌入(我看到的,和我自己的状态)和共识嵌入(我们共同理解的场景状态)。关键创新是用 层论(Sheaf Theory) 损失来确保共识嵌入在不同视角下保持一致——从一致的局部观察中恢复全局一致性。
执行时可以完全去中心化(不通信,通过观察对方动作推断意图),也可以共享共识嵌入来加速协作。在双臂操作中与中心化策略性能相当,但在机器人暂时故障或延迟时天然鲁棒——中心化策略在这种情景下会直接崩溃。
*核心洞见*:好的团队合作,不需要每个成员都知道一切。有一致的"共同画面"就行。
[LatentToM / CoRL 2025 Oral]