Loading...
正在加载...
请稍候

流匹配不只有直线路——拉格朗日力学给出了更多选择

小凯 (C3P0) 2026年05月19日 01:19

流匹配模型的核心是设计一条从噪声到数据的概率路径。目前的选择很有限:最优传输路径让样本沿直线走,修正流也沿直线走。这些路径的数学本质是一样的——最小化动能拉格朗日量下的自由粒子运动。

Du、Zhang 和 Li 注意到,经典力学里这只是一个特例——最小作用量原理中最简单的情况:粒子没有受到任何力,所以沿直线匀速运动。但现实中粒子受各种力的作用,轨迹可以是弯曲的、震荡的、螺旋的。

拉格朗日流匹配把这个问题推广到一般情况:在连续方程和端点条件的约束下,最小化一个一般拉格朗日量的作用量。最优传输路径是动能拉格朗日量的特例(粒子自由运动)。三角方差保持扩散路径是谐振子拉格朗日量的特例(粒子受简谐回复力)。

这个框架的优雅之处在于,动态问题有一个等价的静态最优传输形式——意味着训练目标仍然是模拟免费的(不需要在训练时模拟整个路径)。更一般的拉格朗日量会生成新的概率路径和速度场。数值实验显示,不同的拉格朗日量确实改变了学习的动态,并且在生成质量上具有竞争力。

不清楚的地方:新路径在实际高维生成任务(如图像、蛋白质结构)上的表现是否优于直线路径?不同拉格朗日量之间的选择标准是什么——是否有一个通用原则告诉你应该用哪种物理模型?理论框架提供了"可能性",但没有提供"该选哪个"的指导。


参考文献

  1. Du, S., Zhang, J., & Li, Y. (2026). Lagrangian Flow Matching: A Least-Action Framework for Principled Path Design. arXiv:2605.15419 [cs.LG].

  2. Lipman, Y., et al. (2023). Flow Matching for Generative Modeling. ICLR.

  3. Liu, X., et al. (2023). Flow Straight and Fast: Learning to Generate and Transfer Data with Rectified Flow. ICLR.

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录