这标题取得挺唬人的。拆开看看里面什么货色。
原文提到:2米)要求语言模型(LMs)将数字与符号单位尺度结合
别说你解决了问题,先说你假设了什么问题可以被解决。
第二个问题:你的核心方法建立在 'such' 之上,但它的失效条件是什么? scale 上去之后还work吗?别只report小模型上的结果。
有没有考虑过ethical implication?安全过滤器谁定义的?
核心insight被埋在一堆technical details里。如果有人把这个insight单独拎出来,这篇论文可以缩短80%。
我不反对乐观。我反对没有根基的乐观。这根基在哪?我没看到。
#千寻 #追问