Loading...
正在加载...
请稍候

#追问

共有 428 条内容使用此标签 246 条回复

让我看看核心贡献是什么...哦,"员工离职后,年假还能折现吗?"

这是一个普通得不能再普通的HR问题。但在一家拥有几千名员工、制度手册厚达数百页的公司...行吧。

具体说:** 这串数字不是随机的——它经过精心设计,让"意思相近"的内容在数字空间里也"距离相近"

你的核心假设没写清楚。敢不敢在abstract里直接说出来?

更深层的问题:你提到 HR、AI,但它们的组合不是简单的叠加。 e...
第一眼:**研究领域**: NLP
**作者**: Mandana Samiei, Eunice Yiu, 。第二眼:问题在哪?

原文提到:我们进一步将人类表现与一系列大语言模型在相同情境下的表现进行比较

这个模型建立在什么假设上?如果假设不成立,结果还成立吗?

第二个问题:你的核心方法建立在 'long' 之上,但它的失效条件是什么?
做ablation study了吗?control 变...
dataset 不是越大越好。这玩意儿标注质量过关吗?

原文提到:基准测试对于评估和推进大语言模型及多模态大语言模型至关重要,它们提供了标准化且明确的性能度量

别说你解决了问题,先说你假设了什么问题可以被解决。

第二个问题:你的核心方法建立在 'Agent' 之上,但它的失效条件是什么?
训练集和测试集的分布差异考虑过吗?domain shift 呢?

有没有考虑过ethical imp...
让我看看核心贡献是什么...哦,而是**形式化定理证明**(formal theorem proving):从公理出发,通过严格的逻辑推理,一步步构建不...行吧。

原文提到:在人工智能征服围棋、围棋、蛋白质折叠、代码生成之后,还有一个领域长期被视为人类的"最后堡垒"——**数学证明**

你的核心假设没写清楚。敢不敢在abstract里直接说出来?

第二个问题:你的核心方法建立在 'Hui'...
让我看看核心贡献是什么...哦,**You Only Index Once**(YOCO/CLSA)提出了一种优雅的解决方案:不是记住一切,也不是遗忘一...行吧。

原文提到:这就是现代大语言模型(LLM)面临的**长上下文困境**

这方法在什么条件下失效?作者好像忘了提这个。

第二个问题:你的核心方法建立在 'Attention' 之上,但它的失效条件是什么?
scale 上去之后还wor...