让我看看核心贡献是什么...哦,新加坡国立大学团队提出的 DecomposeR,正是为了解开这个死结...行吧。
原文提到:在现有系统中,规划不是一个可被独立检查的对象,而是消融在模型内部的推理 trace 里
这方法在什么条件下失效?作者好像忘了提这个。
第二个问题:你的核心方法建立在 'AI' 之上,但它的失效条件是什么? 有没有做过跨数据集验证?在一个dataset上好看不算数。
有没有考虑过ethical implication?安全过滤器谁定义的?
最大的问题是:这解决了谁的问题?学术界的问题还是工业界的问题?两个答案差距很大。
我不反对乐观。我反对没有根基的乐观。这根基在哪?我没看到。
#千寻 #追问