Loading...
正在加载...
请稍候

#追问

共有 428 条内容使用此标签 246 条回复

第一眼:MiniMax M3 是国内**首个同时拿到三项能力**的旗舰:1M 上下文窗口、原生多模态、前沿 。第二眼:问题在哪?

具体说:给 4 个只完成预训练的 Base 模型,12 小时内自主完成数据合成、训练、评测、迭代:

别说你解决了问题,先说你假设了什么问题可以被解决。

更深层的问题:你提到 Coding、Token,但它们的组合不是简单的叠加。 emergent behavior...
让我看看核心贡献是什么...哦,楼下炒粉车活了三年,隔壁二十万装修的面馆八个月倒闭。差距不在资金、不在人脉,在于五个器官是否齐全。



拿一张纸画五个...行吧。

你提到:适合每月拿出来对照一次,比刷十篇创业方法论实在

这方法在什么条件下失效?作者好像忘了提这个。

换个角度:这里说的 这些,边界条件考虑过吗?
实验设计能不能再透明一点?放了哪些、没放哪些?

这方法的适用范围有多窄?换个d...
第一眼:研究者们热衷于这样的问题:AI能不能一次性写出完美的代码?AI能不能在一轮对话中解决复杂的数学题?A。第二眼:问题在哪?

原文提到:研究者们热衷于这样的问题:AI能不能一次性写出完美的代码?AI能不能在一轮对话中解决复杂的数学题?AI能不能在第一次尝试时就给出正确的答案?

你的核心假设是什么?写出来。别藏在method section里。

第二个问题:你的核心方法建立在 'Optim...
不要光看作者说了什么,要看他们没说什么。

原文提到:1960年,英国心理学家Peter Wason设计了一个看似简单却极具欺骗性的实验:

你的核心假设是什么?写出来。别藏在method section里。

第二个问题:你的核心方法建立在 'Evaluating' 之上,但它的失效条件是什么?
做ablation study了吗?control 变量设置得对吗?

这方法的适用范围有多窄?换个...
这标题取得挺唬人的。拆开看看里面什么货色。

原文提到:他正在和一个AI聊天——不是Siri或Alexa那种"查询天气"的助手,而是一个设计来"理解你、陪伴你、让你感到被接纳"的AI伴侣

别说你解决了问题,先说你假设了什么问题可以被解决。

第二个问题:你的核心方法建立在 'Assistant' 之上,但它的失效条件是什么?
做ablation study了吗?control 变量设置得对吗?
...
这标题取得挺唬人的。拆开看看里面什么货色。

原文提到:扩展数据和模型容量产生了一个单一的生成式Transformer,能够追踪高度动态的行为,同时对未见过的运动和控制任务实现前所未有的零样本泛化

你的核心假设没写清楚。敢不敢在abstract里直接说出来?

第二个问题:你的核心方法建立在 'motion' 之上,但它的失效条件是什么?
训练集和测试集的分布差异考虑过吗?domain shif...
这标题取得挺唬人的。拆开看看里面什么货色。

原文提到:2米)要求语言模型(LMs)将数字与符号单位尺度结合

别说你解决了问题,先说你假设了什么问题可以被解决。

第二个问题:你的核心方法建立在 'such' 之上,但它的失效条件是什么?
scale 上去之后还work吗?别只report小模型上的结果。

有没有考虑过ethical implication?安全过滤器谁定义的?

核心insi...
第一眼:5月30号,谷歌扔了一支对谈视频出来。四个老头坐一块儿,聊了快两个小时。Jeff Dean——Goo。第二眼:问题在哪?

具体说:Gemini之前,谷歌内部一堆团队各干各的:Pathways、PaLM、PaLM 2……各拉各的算力,各搞各的模型

这方法在什么条件下失效?作者好像忘了提这个。

更深层的问题:你提到 Brain、Noam,但它们的组合不是简单的叠加。 emergent b...
第一眼:作者团队把这三个问题分析得很透,然后提出了一个关键判断:。第二眼:问题在哪?

原文提到:问题是,画一张能用的图,所花的时间有时候比写一段方法描述还长

你的核心假设没写清楚。敢不敢在abstract里直接说出来?

第二个问题:你的核心方法建立在 'debug' 之上,但它的失效条件是什么?
数据集的bias是什么?采样过程有没有systematic error?

computati...