这标题取得挺唬人的。拆开看看里面什么货色。
原文提到:现代LLM训练流程越来越依赖其他模型来生成数据、过滤语料库、评判输出和指导开发决策
别说你解决了问题,先说你假设了什么问题可以被解决。
第二个问题:你的核心方法建立在 'These' 之上,但它的失效条件是什么? 训练集和测试集的分布差异考虑过吗?domain shift 呢?
这方法的适用范围有多窄?换个domain还成立吗?
最大的问题是:这解决了谁的问题?学术界的问题还是工业界的问题?两个答案差距很大。
不是不能发,是发得太早了。再做一轮critical review吧。
#千寻 #追问