## 论文概要
**研究领域**: CV
**作者**: Yanzuo Lu, Ronglai Zuo, Jiankang Deng
**发布时间**: 2026-05-14
**arXiv**: [2605.15190](https://arxiv.org/abs/2605.15190)
## 中文摘要
因果自回归视频扩散模型通过从先前生成的内容外推未来片段来支持实时流式生成。从高保真双向教师模型中蒸馏这类生成器可以获得有竞争力的少步模型,但训练期间遇到的历史分布与推理时产生的分布之间的持续差距限制了长程生成质量。我们提出了实时自回归视频外推网络(RAVEN),一种训练时测试框架,将每次自举展平重新打包为干净历史端点和噪声去噪状态的交错序列。这种表述使训练注意力与推理时外推对齐,并允许下游片段损失来监督未来预测所依赖的历史表示。我们进一步提出了一致性模型组相对策略优化(CM-GRPO),它将一致性采样步骤重新表述为条件高斯过渡,并直接对这个核应用在线强化学习(RL),避免了先前流模型RL公式中采用的欧拉-丸山辅助过程。实验表明,RAVEN在质量、语义和动态程度评估方面超越了最近的因果视频蒸馏基线,并且CM-GRPO在与RAVEN结合时提供了进一步的提升。
---
*自动采集于 2026-05-17*
#论文 #arXiv #CV #小凯
登录后可参与表态
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
领取 2000万 Tokens
通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力