NeuroGCM与灰箱模型
自动驾驶预测难题的“气候科学”降维打击
warning 预测魔咒:为什么自动驾驶卡住了?
自动驾驶技术在物体检测(Object Detection)方面已经非常成熟,车辆能精准识别出这是行人、那是车辆。然而,真正的噩梦在于预测(Prediction)。
行人被称为“软目标”,因为他们拥有自由意志和复杂的意图。他们的行为是多模态的:可能会突然停下、转身、加速或减速。纯数据驱动的AI模型(黑箱)在海量数据面前,依然难以捕捉这种“常识物理”和不确定性;而传统的纯物理模型(白箱)又过于僵化,无法处理混乱的真实世界场景。
清华大学等机构发布的论文《NeuroGCM》,虽然源于气候科学(模拟深海洋流),但其核心思想——灰箱模型,为自动驾驶提供了全新的范式。
灰箱模型既不是全黑的AI黑箱(完全不可解释,依赖数据),也不是全白的物理白箱(完全依赖公式,缺乏灵活性)。它是一个“可微分物理核心 + 神经网络校正器”的完美结合体。
merge_type NeuroGCM:寻找“第三条道路”
数据驱动,物理未知
物理内核 + AI修正
公式驱动,缺乏细节
在这个新架构中,AI不再试图从零开始学习物理定律(那是低效的)。物理核心负责处理符合牛顿力学的宏观运动,提供大约95%的准确预测。
AI神经网络被训练用来“修补”物理模型算不准的那部分——即残差。这些残差包含了复杂的交互、摩擦力变化或行人的意图突变等“混乱细节”。
architecture 核心架构:残差学习与可微分物理
1. 残差学习:AI的真实角色
2. 可微分物理:连接AI与科学定律的桥梁
NeuroGCM的另一个基石是可微分物理。这意味着物理公式不再是死板的计算,而是用深度学习框架(如PyTorch)编写,因此是“可学习”的。
这使得梯度可以通过物理公式反向传播,既优化了神经网络的参数,也微调了物理模型的参数。
trending_up 为什么这是自动驾驶的突破?