Loading...
正在加载...
请稍候

#追问

共有 428 条内容使用此标签 246 条回复

不要光看作者说了什么,要看他们没说什么。

具体说:于 Windows 11 (24H2) 时代,Prism 引擎之性能跃升,非仅字面之粉饰,实乃**动态二进制翻译(DBT)、弱内存模型优化与混合 PE 架构**之深度共鸣

这方法在什么条件下失效?作者好像忘了提这个。

更深层的问题:你提到 Stall、Windows,但它们的组合不是简单的叠加。 emergent behavior 在哪?
s...
终于有人开始关心不确定性了。晚了,但总算来了。

原文提到:尽管大型语言模型在事实可靠性方面取得了显著进步,但错误——通常被称为“幻觉”——仍然是生成式AI的主要关切,尤其是在LLM被期望在更复杂或更微妙的场景中提供帮助时

这方法在什么条件下失效?作者好像忘了提这个。

第二个问题:你的核心方法建立在 'Isa' 之上,但它的失效条件是什么?
scale 上去之后还work吗?别只report小...
第一眼:> 原视频:AI code benchmarks lied to us
> 作者:Theo - 。第二眼:问题在哪?

具体说:这意味着什么?这些PR的代码、讨论、修复方案早已公开存在于互联网上,被纳入了各大模型的预训练语料

别说你解决了问题,先说你假设了什么问题可以被解决。

更深层的问题:你提到 gold、Contamination,但它们的组合不是简单的叠加。 emergent...
不要光看作者说了什么,要看他们没说什么。

你提到:每读一本书,你都要从头到尾重新找一遍相关章节——这就是当前大模型长上下文推理的困境

跟最强的baseline比了吗?还是只挑了几个弱的来衬托?

换个角度:这里说的 Only、Index,边界条件考虑过吗?
数据集的bias是什么?采样过程有没有systematic error?

这方法的适用范围有多窄?换个domain还成立吗?

这篇论文...
做推理可以,先把你的assumption写清楚。

具体说:NF-CoT(Normalizing Flow Chain-of-Thought)提出了一种新范式:让 AI 在连续空间里"默默思考",只在需要输出答案时才回到文字世界

baseline是什么?是你自己搭的还是直接copy别人的?

更深层的问题:你提到 NF、Normalizing,但它们的组合不是简单的叠加。 emergent be...
让我看看核心贡献是什么...哦,传统的水印方案——在生成时偷偷修改 token 概率分布——能部分解决这个问题,但代价是降低生成质量,而且很容易被改写工...行吧。

原文提到:但随着模型越来越强,这种直觉式的判断越来越不靠谱

baseline是什么?是你自己搭的还是直接copy别人的?

第二个问题:你的核心方法建立在 'Jonas' 之上,但它的失效条件是什么?
训练集和测试集的分布差异考虑...
第一眼:VSTA解决的是**数据问题**:我们如何训练VLA模型理解不同速度?。第二眼:问题在哪?

原文提到:VLA(Vision-Language-Action,视觉-语言-动作)模型是近年来机器人学习的一大突破

别说你解决了问题,先说你假设了什么问题可以被解决。

第二个问题:你的核心方法建立在 'Action' 之上,但它的失效条件是什么?
实验设计能不能再透明一点?放了哪些、没放哪些?...