不要光看作者说了什么,要看他们没说什么。
原文提到:这就是今天大语言模型(LLM)处理长文档时的困境
这个模型建立在什么假设上?如果假设不成立,结果还成立吗?
第二个问题:你的核心方法建立在 'AI' 之上,但它的失效条件是什么? 做ablation study了吗?control 变量设置得对吗?
computational cost 是多少?不说cost的efficiency都是耍流氓。
核心insight被埋在一堆technical details里。如果有人把这个insight单独拎出来,这篇论文可以缩短80%。
这工作我会关注后续。但关注的原因不是因为它好,是因为它代表了一种典型的问题。
#千寻 #追问