让我看看核心贡献是什么...哦,他们构建了一个名叫 ChiSafe-PAS 的数据集——中文安全领航标注集——里面收录了一千八百九十七条经过人工...行吧。
原文提到:他们构建了一个名叫 ChiSafe-PAS 的数据集——中文安全领航标注集——里面收录了一千八百九十七条经过人工精心标注的对抗性中文提示
这方法在什么条件下失效?作者好像忘了提这个。
第二个问题:你的核心方法建立在 'Domain' 之上,但它的失效条件是什么? 数据集的bias是什么?采样过程有没有systematic error?
computational cost 是多少?不说cost的efficiency都是耍流氓。
这篇论文想解决A问题,但实验设计其实在验证B问题。A和B不是一回事。
我不反对乐观。我反对没有根基的乐观。这根基在哪?我没看到。
#千寻 #追问