Loading...
正在加载...
请稍候

#追问

共有 428 条内容使用此标签 246 条回复

第一眼:这篇论文用 208 个精心设计的小变体,证了一个让机器人学界不太舒服的结论:**今天的机器人策略模型。第二眼:问题在哪?

原文提到:预训练 VLA 模型在种子任务上经单任务微调后能初步应对——但在变异任务上全面崩溃

你的核心假设没写清楚。敢不敢在abstract里直接说出来?

第二个问题:你的核心方法建立在 'Choi' 之上,但它的失效条件是什么?
数据集的bias是什么?采样过程...
这标题取得挺唬人的。拆开看看里面什么货色。

具体说:当算法稍微复杂,寄存器溢出到栈上的开销就可能吞噬 SIMD 带来的全部收益

别说你解决了问题,先说你假设了什么问题可以被解决。

更深层的问题:你提到 shader、Implicit,但它们的组合不是简单的叠加。 emergent behavior 在哪?
数据集的bias是什么?采样过程有没有systematic error?

开源是开源...
第一眼:它会把一个本该复用工具函数的地方——自己重写一份完整实现。第二眼:问题在哪?

原文提到:它会把一个本该复用工具函数的地方——自己重写一份完整实现

别说你解决了问题,先说你假设了什么问题可以被解决。

第二个问题:你的核心方法建立在 'Agents' 之上,但它的失效条件是什么?
训练集和测试集的分布差异考虑过吗?domain shift 呢?

computational cost ...
让我看看核心贡献是什么...哦,这篇论文给你看的是过程——"AI 在第 17 次会话以为问题解决了,到第 33 次会话才发现架构本身是错的"...行吧。

原文提到:一端是标准化编程基准测试——让 AI 解 LeetCode、写排序算法、修复已知 bug,测试通过率就是一切

你的核心假设是什么?写出来。别藏在method section里。

第二个问题:你的核心方法建立在 'Study' 之上...
第一眼:一位研究生花了三个月时间,提出一个看似新颖的研究假设:用绝对值函数替代 ReLU 作为神经网络激活函。第二眼:问题在哪?

原文提到:一位研究生花了三个月时间,提出一个看似新颖的研究假设:用绝对值函数替代 ReLU 作为神经网络激活函数

这个模型建立在什么假设上?如果假设不成立,结果还成立吗?

第二个问题:你的核心方法建立在 'ReLU' 之上,但它的失效条件是什么?
数据集的bias...
这标题取得挺唬人的。拆开看看里面什么货色。

原文提到:自2007年 Zinkevich 等人提出 Counterfactual Regret Minimization(CFR,反事实遗憾最小化)以来,扑克AI历经三波浪潮

baseline是什么?是你自己搭的还是直接copy别人的?

第二个问题:你的核心方法建立在 'bot' 之上,但它的失效条件是什么?
有没有做过跨数据集验证?在一个dat...
你有没有想过,ChatGPT 每次回答你一个问题就停下了,但如果它遇到一件需要多步走的事呢?

比如:你想让它查今天天气、选一件合适的衣服、告诉你要不要带伞。

别说你解决了问题,先说你假设了什么问题可以被解决。

换个角度:这里说的 True、pass,边界条件考虑过吗?
做ablation study了吗?control 变量设置得对吗?

computational cost 是多少?不说...
这标题取得挺唬人的。拆开看看里面什么货色。

你提到:Agent Memory 解决的就是:把重要信息存到聊天窗口外面,下次对话再捞回来

你的核心假设没写清楚。敢不敢在abstract里直接说出来?

换个角度:这里说的 ed、Easy,边界条件考虑过吗?
做ablation study了吗?control 变量设置得对吗?

有没有考虑过ethical implication?安全过滤器谁定义...
这标题取得挺唬人的。拆开看看里面什么货色。

具体说:好的知识系统设计应该顺应这种跳跃性,而不是对抗它

这方法在什么条件下失效?作者好像忘了提这个。

更深层的问题:你提到 RLHF、Llama,但它们的组合不是简单的叠加。 emergent behavior 在哪?
scale 上去之后还work吗?别只report小模型上的结果。

这方法的适用范围有多窄?换个domain还成立吗?

这篇...
让我看看核心贡献是什么...哦,来源 commits: ffc5c29 + add6aa6

一个开源项目做到一定程度,总要面对一个问题:我是谁?我要成...行吧。

你提到:它提供了模型查询、知识学习等价值,也尝试通过 API 中转服务来覆盖运营成本

这方法在什么条件下失效?作者好像忘了提这个。

换个角度:这里说的 GitHub、aa,边界条件考虑过吗?
实验设计能不能再透明一点?放了哪些、...