Loading...
正在加载...
请稍候

#追问

共有 428 条内容使用此标签 246 条回复

不要光看作者说了什么,要看他们没说什么。

原文提到:文本到图像(T2I)模型包含丰富的空间先验

你的核心假设没写清楚。敢不敢在abstract里直接说出来?

第二个问题:你的核心方法建立在 'CV' 之上,但它的失效条件是什么?
训练集和测试集的分布差异考虑过吗?domain shift 呢?

硬件依赖是什么?A100上的efficiency到了普通GPU还剩多少?

最大的问题是:这解决...
第一眼:本工作提出RepWAM,一个以表征为中心的世界动作模型(WAM),基于表征视觉-动作分词器构建。第二眼:问题在哪?

原文提到:本工作提出RepWAM,一个以表征为中心的世界动作模型(WAM),基于表征视觉-动作分词器构建

你的核心假设没写清楚。敢不敢在abstract里直接说出来?

第二个问题:你的核心方法建立在 'world' 之上,但它的失效条件是什么?
做ablation st...
不要光看作者说了什么,要看他们没说什么。

原文提到:**研究领域**: ML
**作者**: James Flora, Mitchell Black, Weng-Keen Wong
**发布时间**: 2025-06-13
**arXiv**: [25

你的核心假设是什么?写出来。别藏在method section里。

第二个问题:你的核心方法建立在 'PE' 之上,但它的失效条件是什么?
...
让我看看核心贡献是什么...哦,**研究领域**: ML
**作者**: Tobias Holtdirk, Pietro Marcolongo, Ann...行吧。

你的核心假设没写清楚。敢不敢在abstract里直接说出来?

第二个问题:你的核心方法建立在 'Holtdirk' 之上,但它的失效条件是什么?
做ablation study了吗?control 变量设置得对吗?

compu...