我使用的是lstm模型。我理解关于训练模型的小批量大小意味着什么。基本上,它与批量更新梯度有关,而不是在每个样本之后更新。但是在预测阶段,小批量大小意味着什么?我不能理解批量大小在预测阶段的作用。更改它会影响我的结果吗?
发布于 2018-09-27 17:07:33
批处理的概念比仅仅计算梯度更一般。大多数神经网络框架允许您将一批图像输入到您的网络中,它们这样做是因为GPU更高效且更容易并行化。
增加或减少用于预测的批次大小通常只会影响计算效率,而不会影响结果。只有在有状态模型的情况下,比如带有状态的LSTM (而不是普通的LSTM),您才会得到随批大小变化的结果。
发布于 2018-09-27 23:41:38
批量大小等只与你的模型已经学习(训练)的Learning.After相关,它将只保存weights.While测试或预测,它将只使用保存的权重进行预测。
默认情况下,一个普通的LSTM会在批处理大小之后重置单元状态,但是您可以更改that.You,使其在一个时期后更新状态,甚至维护所有状态。
https://stackoverflow.com/questions/52531324
复制相似问题