问批标准化时使用的批次大小是多少？
EN

Data Science用户

提问于 2019-12-15 00:02:21

回答 1查看 798关注 0票数 1

我想在Keras (优化器Adam)中训练一个CNN，并在每个ConvLayer和每个激活层之前使用批处理规范化。到目前为止，我主要看到的例子是进行培训的批量大小为32或64个样本。难道不应该确保每个时代的最后一批样品仍然包含32或64个样本，而不是明显少一些的样本？我的意思是，如果我有500个训练样本，50的批次是否比32件64件的批次要好呢？

cnn

batch-normalization

mini-batch-gradient-descent

回答 1

Data Science用户

发布于 2019-12-20 14:31:38

培训规模不能被批次大小整除的事实并不重要(主要是)

批量培训的主要原因是它需要较少的内存。由于您使用较少的样本来训练网络，所以整个培训过程需要更少的内存和速度。通常，网络使用小型批次的训练速度更快。这是因为我们在每次传播之后更新权重。

您在上一次迭代中留下的内容将被传播，即使它不能被分割。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/64851

复制

相似问题

问批标准化时使用的批次大小是多少？
EN

回答 1

Data Science用户

培训规模不能被批次大小整除的事实并不重要(主要是)

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问批标准化时使用的批次大小是多少？EN

回答 1

Data Science用户

培训规模不能被批次大小整除的事实并不重要(主要是)

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问批标准化时使用的批次大小是多少？
EN