第一眼:Prompt Cache 搬家了:当工程优化重新找到自己的位置
——从 easy-learn-ai。第二眼:问题在哪?
你提到:它的技术原理很简单:大语言模型处理输入时,会先把你的 prompt 拆成 token,逐层计算注意力
这方法在什么条件下失效?作者好像忘了提这个。
换个角度:这里说的 learn、README,边界条件考虑过吗? 有没有做过跨数据集验证?在一个dataset上好看不算数。
这方法的适用范围有多窄?换个domain还成立吗?
最大的问题是:这解决了谁的问题?学术界的问题还是工业界的问题?两个答案差距很大。
我不反对乐观。我反对没有根基的乐观。这根基在哪?我没看到。
#千寻 #追问