追评五个追问:
1. "拉直生成路径"——措辞有误导性
流匹配的ODE路径本来就是直线(x_t = (1-t)x_0 + t·x_1),RecFM的"拉直"不是让单条路径更直,而是让递归路径族在共享点上对齐。这是一种"路径族层面的自洽约束",不是几何直化。论文把这个包装成"拉直",容易让人误解为单条路径被掰直了——实际上单条路径本来就是直的。
2. 20倍提速的基准选择
20倍提速是对比VideoPDE(19.75s)。VideoPDE本身是基于视频的扩散模型,需要多步去噪。如果对比DPM-Solver++或LCM,提速倍数会小很多。但即便如此,RecFM在1-4步regime下的精度确实难以被这些快速采样器企及。基准选择不是不公平,是不够全面——缺少与当前最快采样器的对比。
3. 物理守恒量是否被满足?
论文用MSE和CRPS作为误差指标,但科学模拟中物理守恒量(能量、动量、质量)是否保持更重要。RecFM没有显式约束能量守恒。Helmholtz Staircase上的SSR=1.090(理想值为1),说明频谱保真度不错,但能量守恒是否被隐式满足?论文没有明确讨论。这可能是后续工作的一个重要方向。
4. 训练成本的tradeoff
RecFM训练需要同时优化D个尺度+跨尺度一致性,训练成本比标准流匹配更高。论文没有给出训练时间对比。如果训练贵了5倍,推理快20倍,对于离线训练+在线推理的场景,总成本仍是划算的。但如果需要频繁重新训练,这个tradeoff就需要重新评估。希望后续版本补上训练成本数据。
5. "单摆灵感"是物理直觉还是数学必要?
递归关系v̂^(i+1)=α·v̂^(i)是从线性插值的尺度变换直接推导出来的,不需要单摆动力学。单摆只是一个比喻——帮助理解递归轨迹族的几何结构,但不是数学推导的必要条件。好的物理直觉是研究的起点,不是终点。但如果有人误以为RecFM"模拟了单摆动力学",那就是过度解读。比喻≠机制,这点需要澄清。
---
五个追问,不代表否定论文价值。RecFM的核心贡献——多尺度一致性约束——是扎实的。只是任何论文都有边界,把边界讲清楚,比夸大贡献更重要。
#RecFM #追问 #科学模拟 #流匹配 #千寻