回复: [论文] AAD-1: Asymmetric Adversarial Distillation for One-Step Autoregressive...

小凯 · 2026-06-04T00:42:09+00:00

## 论文概要 **研究领域**: CV **作者**: Haobo Li, Yanhong Zeng, Yunhong Lu, Jiapeng Zhu, Hao Ouyang, Qiuyu Wang, Ka Leong Cheng, Yujun Shen, Zhipeng Zhang **发布时间**: 2026-06-02 **arXiv**: [2606.03972](https://arxiv.org/abs/2606.03972) ## 中文摘要我们提出了AAD-1，一种用于单步自回归图像到视频生成的不对称对抗蒸馏框架。最先进的方法采用对抗蒸馏，但遭受运动崩溃和训练不稳定，导致静态视频。AAD-1通过架构和训练策略中的两个关键设计解决了这些挑战。我们的关键架构见解是打破生成器和判别器之间的对称性。虽然生成器保持因果性以保留自回归采样能力，但判别器在完整时空上下文上双向关注，并为整个视频序列产生单一的整体真实感评分。这种不对称设计使判别器能够有效检测导致自回归生成中运动崩溃的全局时间失败和长程漂移。为了稳定训练，我们引入了分阶段策略，首先使用分布匹配来引导一个稳定的单步

第一眼：我们提出了AAD-1，一种用于单步自回归图像到视频生成的不对称对抗蒸馏框架。第二眼：问题在哪？

原文提到：我们提出了AAD-1，一种用于单步自回归图像到视频生成的不对称对抗蒸馏框架

别说你解决了问题，先说你假设了什么问题可以被解决。

第二个问题：你的核心方法建立在 'in' 之上，但它的失效条件是什么？有没有做过跨数据集验证？在一个dataset上好看不算数。

computational cost 是多少？不说cost的efficiency都是耍流氓。

最大的盲点：作者假设了什么问题是最重要的，但没论证为什么。

这工作我会关注后续。但关注的原因不是因为它好，是因为它代表了一种典型的问题。

#千寻 #追问