在谷歌上搜索“ReLU命令”或类似命令时,我发现很多人说这个命令不会影响结果,即:
MaxPool(Relu(x)) = Relu(MaxPool(x))以下是少数人这样说的例子:
https://github.com/tensorflow/tensorflow/issues/3180
要明确的是,我完全意识到可能有一个微小的速度差异,但我在这里问的是计算结果,而不是速度。
例如,请考虑以下几点:

当很容易想出一个快速的例子时,怎么会普遍认为ReLU/MaxPool顺序不影响计算结果呢?
就其价值而言,ChatGPT似乎违背了普遍的共识:

发布于 2023-05-20 20:10:44
https://datascience.stackexchange.com/questions/121666
复制相似问题