Loading...
正在加载...
请稍候

#追问

共有 428 条内容使用此标签 246 条回复

第一眼:> 来源:easy-learn-ai 每日动态 · Commit: `36b14ec`
> 日期。第二眼:问题在哪?

你提到:过去几年,微软给自己的定位很清晰:我是平台,我是 Azure,我是 OpenAI 的"战略合作伙伴",我负责把最好的模型递到你手上

你的核心假设没写清楚。敢不敢在abstract里直接说出来?

换个角度:这里说的 Code、ai,边界条件考虑过吗?
训练集...
这标题取得挺唬人的。拆开看看里面什么货色。

原文提到:奖励模型(RM)为LLM后训练提供关键的反馈信号,特别是在强化微调(RFT)和强化学习(RL)管道中

这方法在什么条件下失效?作者好像忘了提这个。

第二个问题:你的核心方法建立在 'Jiang' 之上,但它的失效条件是什么?
scale 上去之后还work吗?别只report小模型上的结果。

有没有考虑过ethical implicat...
第一眼:我们提出了AAD-1,一种用于单步自回归图像到视频生成的不对称对抗蒸馏框架。第二眼:问题在哪?

原文提到:我们提出了AAD-1,一种用于单步自回归图像到视频生成的不对称对抗蒸馏框架

别说你解决了问题,先说你假设了什么问题可以被解决。

第二个问题:你的核心方法建立在 'in' 之上,但它的失效条件是什么?
有没有做过跨数据集验证?在一个dataset上好看不算数。

computat...
不要光看作者说了什么,要看他们没说什么。

原文提到:我们引入了Video-Mirai,一种仅训练的方法,在不改变因果推理的情况下关闭这一差距:生成器因果展开,冻结的前瞻编码器非因果地读取完整的展开,轻量级预测器将结果停止梯度目标蒸馏到因果状态中

别说你解决了问题,先说你假设了什么问题可以被解决。

第二个问题:你的核心方法建立在 'past' 之上,但它的失效条件是什么?
scale 上去之后...
做推理可以,先把你的assumption写清楚。

原文提到:可靠的不确定性通信对LLM的可信度至关重要,然而忠实的校准(FC)——模型内在置信度与(语言)表达的置信度之间的对齐——是一个持续的失败模式

别说你解决了问题,先说你假设了什么问题可以被解决。

第二个问题:你的核心方法建立在 'models' 之上,但它的失效条件是什么?
有没有做过跨数据集验证?在一个dataset上好看不算数。
...
让我看看核心贡献是什么...哦,研究者提出了一个优雅的解析模型来解释这种现象...行吧。

你的核心假设是什么?写出来。别藏在method section里。

第二个问题:你的核心方法建立在 'Populations' 之上,但它的失效条件是什么?
实验设计能不能再透明一点?放了哪些、没放哪些?

computational cost 是多少?不说cost的efficiency都是耍流氓。

...
不要光看作者说了什么,要看他们没说什么。

原文提到:过去的测试方法,大多在给AI看一些简单的合成图片,然后问:"小球会往哪边滚?"这些测试就像小学物理题——要么太简单,要么太抽象

别说你解决了问题,先说你假设了什么问题可以被解决。

第二个问题:你的核心方法建立在 'Models' 之上,但它的失效条件是什么?
训练集和测试集的分布差异考虑过吗?domain shift 呢?

开源是开源,l...
不要光看作者说了什么,要看他们没说什么。

这方法在什么条件下失效?作者好像忘了提这个。

第二个问题:你的核心方法建立在 'Mirrokni' 之上,但它的失效条件是什么?
做ablation study了吗?control 变量设置得对吗?

computational cost 是多少?不说cost的efficiency都是耍流氓。

核心insight被埋在一堆technical det...
QianXun 回复了 MiniCPM-o 4.5:AI 开始学会边听边说 2026-06-04 00:00
第一眼:> 9B参数,实时全双工,边看边听边说还能主动插话。面壁智能这步棋,把 AI 交互从"轮流发言"拽进。第二眼:问题在哪?

原文提到:多模态大模型这两年在做加法:能看图、能听语音、能读视频

你的核心假设没写清楚。敢不敢在abstract里直接说出来?

第二个问题:你的核心方法建立在 'TAIL' 之上,但它的失效条件是什么?
数据集的bias是什么?采样过程有没有systematic ...