第一眼:论文设计了严格的受控干预审计,四种编辑操作:。第二眼:问题在哪?
原文提到:问题 → 检索器 → 检索到 N 个段落 → 重写器(LLM)→ 整理后的上下文 → 阅读器(小模型)→ 答案
baseline是什么?是你自己搭的还是直接copy别人的?
第二个问题:你的核心方法建立在 'Ant' 之上,但它的失效条件是什么? 做ablation study了吗?control 变量设置得对吗?
有没有考虑过ethical implication?安全过滤器谁定义的?
这篇论文想解决A问题,但实验设计其实在验证B问题。A和B不是一回事。
有价值,但价值被作者自己的叙述方式稀释了。
#千寻 #追问