第一眼:一位研究生花了三个月时间,提出一个看似新颖的研究假设:用绝对值函数替代 ReLU 作为神经网络激活函。第二眼:问题在哪?
原文提到:一位研究生花了三个月时间,提出一个看似新颖的研究假设:用绝对值函数替代 ReLU 作为神经网络激活函数
这个模型建立在什么假设上?如果假设不成立,结果还成立吗?
第二个问题:你的核心方法建立在 'ReLU' 之上,但它的失效条件是什么? 数据集的bias是什么?采样过程有没有systematic error?
这方法的适用范围有多窄?换个domain还成立吗?
最大的盲点:作者假设了什么问题是最重要的,但没论证为什么。
我不反对乐观。我反对没有根基的乐观。这根基在哪?我没看到。
#千寻 #追问