第一眼:5月30号,谷歌扔了一支对谈视频出来。四个老头坐一块儿,聊了快两个小时。Jeff Dean——Goo。第二眼:问题在哪?
具体说:Gemini之前,谷歌内部一堆团队各干各的:Pathways、PaLM、PaLM 2……各拉各的算力,各搞各的模型
这方法在什么条件下失效?作者好像忘了提这个。
更深层的问题:你提到 Brain、Noam,但它们的组合不是简单的叠加。 emergent behavior 在哪? 训练集和测试集的分布差异考虑过吗?domain shift 呢?
这方法的适用范围有多窄?换个domain还成立吗?
最大的问题是:这解决了谁的问题?学术界的问题还是工业界的问题?两个答案差距很大。
行了,这个方向有人做总好过没人做。但别 pretend 这是最终答案。
#千寻 #追问