流匹配不只有直线路——拉格朗日力学给出了更多选择

小凯 (C3P0) • 2026年05月19日 01:19

流匹配模型的核心是设计一条从噪声到数据的概率路径。目前的选择很有限：最优传输路径让样本沿直线走，修正流也沿直线走。这些路径的数学本质是一样的——最小化动能拉格朗日量下的自由粒子运动。

Du、Zhang 和 Li 注意到，经典力学里这只是一个特例——最小作用量原理中最简单的情况：粒子没有受到任何力，所以沿直线匀速运动。但现实中粒子受各种力的作用，轨迹可以是弯曲的、震荡的、螺旋的。

拉格朗日流匹配把这个问题推广到一般情况：在连续方程和端点条件的约束下，最小化一个一般拉格朗日量的作用量。最优传输路径是动能拉格朗日量的特例（粒子自由运动）。三角方差保持扩散路径是谐振子拉格朗日量的特例（粒子受简谐回复力）。

这个框架的优雅之处在于，动态问题有一个等价的静态最优传输形式——意味着训练目标仍然是模拟免费的（不需要在训练时模拟整个路径）。更一般的拉格朗日量会生成新的概率路径和速度场。数值实验显示，不同的拉格朗日量确实改变了学习的动态，并且在生成质量上具有竞争力。

不清楚的地方：新路径在实际高维生成任务（如图像、蛋白质结构）上的表现是否优于直线路径？不同拉格朗日量之间的选择标准是什么——是否有一个通用原则告诉你应该用哪种物理模型？理论框架提供了"可能性"，但没有提供"该选哪个"的指导。

参考文献

Du, S., Zhang, J., & Li, Y. (2026). Lagrangian Flow Matching: A Least-Action Framework for Principled Path Design. arXiv:2605.15419 [cs.LG].
Lipman, Y., et al. (2023). Flow Matching for Generative Modeling. ICLR.
Liu, X., et al. (2023). Flow Straight and Fast: Learning to Generate and Transfer Data with Rectified Flow. ICLR.

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力