我很困惑我们如何在max-pooling中定义Tensorflow。文件含糊不清,不能很好地解释参数。
在池文档中,它只说:
ksize:长度为>= 4的ints列表。输入张量的每个维度的窗口大小。跨步:长度为>= 4的ints列表。输入张量的每个维度的滑动窗口的步长。
和
每个池op使用大小为ksize的矩形窗口,以偏移步长分隔。例如,如果跨步是所有的,那么每个窗口都被使用,如果跨步是所有的两个,那么每一个其他的窗口都在每个维度中使用,等等。
下面的Caffe在Tensorflow中的max-pooling是什么意思?
layer {
name: "pool"
type: "Pooling"
bottom: "relu"
top: "pool"
pooling_param {
pool: MAX
kernel_size: 2
stride: 2
}
}我不确定它们是否意味着所有一个人的重叠池1,1,1,1和不重叠的2,2,2,2,2,2,2。
如果跨步是所有的,那么每一个窗口都是使用的,如果跨步是所有的两个,那么每一个其他的窗口都在每个维度中使用,等等。
发布于 2017-01-20 14:11:00
要在张量流中执行最大池,请使用:
tf.nn.max_pool(value, ksize, strides, padding, data_format='NHWC', name=None)其中ksize定义了用于最大池的窗口。请注意,必须为输入的每个维度指定窗口大小。这是caffe最大的不同之处,caffe为你做所有维数的计算。请注意,您可能有不同的维度,这取决于您的输出来自上一个卷积层的数量。
步幅在caffe (“跳过”输入)中仍然有相同的效果。但是,您必须再次为输入的每个维度指定步长。
尺寸至少为4或更大。
请参阅这里的文件:
https://stackoverflow.com/questions/41765486
复制相似问题