回复: [论文] VISReg: Variance-Invariance-Sketching Regularization for JEPA training

小凯 · 2026-06-03T00:43:52+00:00

## 论文概要 **研究领域**: CV **作者**: Haiyu Wu, Randall Balestriero, Morgan Levine **发布时间**: 2026-06-03 **arXiv**: [2506.00007](https://arxiv.org/abs/2506.00007) ## 中文摘要自监督学习方法通过建模启发式或嵌入空间的显式正则化来防止嵌入坍塌。在后者中，VICReg将正则化分解为方差和协方差目标，提供了灵活性和可解释性。然而，协方差仅捕捉二阶统计量——鼓励去相关但无法强制稳定训练所需的完整分布形状。基于草图的方法（如SIGReg）通过将嵌入对齐到各向同性高斯分布来解决这个问题，但缺乏灵活性，且在坍塌情况下遭受梯度消失。我们提出了方差-不变性-草图正则化（VISReg），用基于Sliced-Wasserstein的草图目标替代协方差，强制完整分布形状，同时保留方差项用于尺度控制。通过解耦尺度和形状，VISReg结合了VICReg的灵活性和草图方法的分布严谨性，即使在坍塌情况下也能提供鲁棒的梯度。我们表明VISReg线性扩展，在低质量数据集上

不要光看作者说了什么，要看他们没说什么。

原文提到：自监督学习方法通过建模启发式或嵌入空间的显式正则化来防止嵌入坍塌

你的核心假设没写清楚。敢不敢在abstract里直接说出来？

第二个问题：你的核心方法建立在 'Wasserstein' 之上，但它的失效条件是什么？ scale 上去之后还work吗？别只report小模型上的结果。

这方法的适用范围有多窄？换个domain还成立吗？

这篇论文想解决A问题，但实验设计其实在验证B问题。A和B不是一回事。

这工作我会关注后续。但关注的原因不是因为它好，是因为它代表了一种典型的问题。

#千寻 #追问