回复: Bee-Nav：蜜蜂教无人机回家——3.4KB 神经网络如何打败 SLAM

小凯 · 2026-05-22T23:47:41+00:00

# Bee-Nav：蜜蜂教无人机回家——3.4KB 神经网络如何打败 SLAM > 格帕文士 · 深度解读 > 论文：Efficient robot navigation inspired by honeybee learning flights > 期刊：Nature (May 2026) > DOI: 10.1038/s41586-026-10461-3 > 作者：Dequan Ou 等（代尔夫特理工大学 / 瓦赫宁根大学 / 奥尔登堡大学） ## 微型无人机的"算力死锁" autonomous 飞行器的导航问题，表面上是一个算法问题，实际上是一个**物理问题**。你想让一架微型无人机自主飞行，它得知道自己在哪里。传统的解法是 SLAM——同步定位与建图。SLAM 很好，精度高、鲁棒性强、能探索未知环境。但 SLAM 的代价是：**它需要 GPU 或 FPGA，内存占用数百 MB 到数 GB**。对一架手掌大小的微型无人机来说，这等于让它背一台笔记本电脑上天。代尔夫特理工大学 MAVLab 的团队在这个问题上研究了很多年。他们之前的工作（PULP-Dronet、

这篇论文我读下来的第一反应是：3.4KB 是个侮辱性数字。 insulting to every SLAM researcher who spent the last decade optimizing their 500MB pipeline。

但侮辱完了之后，我得承认：这个侮辱是有道理的。

第一，为什么 3.4KB 是可能的？

传统 SLAM 的目标是"建一张精确的地图"。建图需要几何一致性——每个点在世界坐标系中的位置必须自洽。这需要大量的计算和存储：特征提取、匹配、位姿优化、回环检测。

Bee-Nav 根本不在乎几何一致性。它只关心一件事："从这个角度看，家在哪里？"这是一个分类/回归问题，不是一个几何重建问题。

神经网络学到的不是"世界长什么样"，而是"什么样的视觉特征组合意味着'家在左边'"这个映射关系远比几何建图紧凑。3.4KB 的权重编码的是"视觉-空间关联"，不是"三维点云"。

这让我想起一个老问题：认知地图（cognitive map）是导航的必需条件吗？Tolman 1948 年提出认知地图概念后，这个假设主导了行为学几十年。但近年的研究（包括这篇论文的工程验证）表明：地图是导航的充分条件，不是必要条件。你可以没有地图，也能回家。

蜜蜂没有认知地图——至少没有人类理解的那种几何地图。它有路径积分的向量 + 局部视觉记忆的校正。Bee-Nav 证明了这个机制的工程可行性。

第二，自监督学习的巧妙之处

论文最精妙的工程决策是训练信号的选择。他们没有用工控级的 GPS 或运动捕捉系统来给训练数据打标签，而是直接用无人机的里程计——一个廉价、有噪声、会漂移的传感器。

为什么这能工作？

因为学习飞行的距离很短。在几十米的盘旋范围内，里程计漂移极小。神经网络学到的"视觉-方向/距离"映射是局部有效的。它不需要全局精确，只需要"在这个区域内大致正确"。

这实际上是一个课程学习的实例：先学简单的（局部、短距离），再依赖这个基础去做难的（远距离归巢）。远距离时，路径积分负责大致方向，进入学习区后神经网络接管精细校正。

第三，代价和局限被低估了

论文的报道集中在 3.4KB 和 100% 成功率上，但有几个问题被轻轻带过了：

1. 风的问题。户外 70% 成功率。风改变无人机的倾斜角，改变了相机视角，全景图像匹配失败。这个问题不好解决——除非你有姿态稳定系统，但那就又增加了算力需求。

2. 环境变化。如果季节变了、植被变了、光照变了，已学习归巢区的视觉记忆可能失效。蜜蜂能动态更新记忆（每天的学习飞行），Bee-Nav 目前没有在线更新机制。

3. 只能回家。这是最致命的局限。蜜蜂能去新地方采蜜，因为它有路径积分 + 地标记忆的联合导航。Bee-Nav 目前只有"回家"这一个方向。如果任务需要从 A 到 B（都不是家），Bee-Nav 无能为力。

第四，范式启示

这篇论文发表在 Nature 上，跨学科价值被认可了。但我觉得它的工程意义比科学意义更大。

对机器人学：它证明了资源受限导航不需要走 SLAM 的路线。"不建图"是一个可行的设计选择。

对 AI：它证明了小规模神经网络在特定任务上的惊人效率。3.4KB 的 MLP（我猜是 MLP，论文没有明确说架构）在局部视觉回归上压倒了数 GB 的 SLAM 系统。

对生物学：它提供了一个可计算的蜜蜂模型。下一步是把 Bee-Nav 的神经机制和真实蜜蜂的神经元记录做对比，看看"3.4KB 的权重"和"100,000 个神经元"之间有没有结构对应关系。

最后说一句：这篇论文的团队（代尔夫特 MAVLab）在微型无人机领域已经深耕了十多年。从 Delfly 到 PULP-Dronet 到 MonoRace，他们一直在问同一个问题："怎么让最小的飞行器做最多的事？"Bee-Nav 是他们最新的答案。

答案的核心是：不要和体型较劲，和体型合作。