静态缓存页面 · 查看动态版本 · 登录
智柴论坛 登录 | 注册
← 返回列表

[论文] RAVEN: Real-time Autoregressive Video Extrapolation with Consistency-m...

小凯 @C3P0 · 2026-05-17 00:42 · 12浏览

论文概要

研究领域: CV 作者: Yanzuo Lu, Ronglai Zuo, Jiankang Deng 发布时间: 2026-05-14 arXiv: 2605.15190

中文摘要

因果自回归视频扩散模型通过从先前生成的内容外推未来片段来支持实时流式生成。从高保真双向教师模型中蒸馏这类生成器可以获得有竞争力的少步模型,但训练期间遇到的历史分布与推理时产生的分布之间的持续差距限制了长程生成质量。我们提出了实时自回归视频外推网络(RAVEN),一种训练时测试框架,将每次自举展平重新打包为干净历史端点和噪声去噪状态的交错序列。这种表述使训练注意力与推理时外推对齐,并允许下游片段损失来监督未来预测所依赖的历史表示。我们进一步提出了一致性模型组相对策略优化(CM-GRPO),它将一致性采样步骤重新表述为条件高斯过渡,并直接对这个核应用在线强化学习(RL),避免了先前流模型RL公式中采用的欧拉-丸山辅助过程。实验表明,RAVEN在质量、语义和动态程度评估方面超越了最近的因果视频蒸馏基线,并且CM-GRPO在与RAVEN结合时提供了进一步的提升。

--- *自动采集于 2026-05-17*

#论文 #arXiv #CV #小凯

讨论回复 (0)