问递归神经网络(LSTM)批量大小和输入
EN

Data Science用户

提问于 2018-08-25 21:39:01

回答 1查看 1.7K关注 0票数 2

我在Keras工作以建立LSTM模型。我理解设置STATEFUL=FALSE意味着在训练模型时将不同的批处理为独立的。

假设我想建立一个模型，用6周的每小时温度观测来预测明天的24小时温度。我一直使用的批量大小为24，这意味着每天的培训数据是独立使用的LSTM时，培训。但这意味着我不允许RNN在几天内获得更长的相关性，对吗？那么，我应该使用批处理大小的6*7*24=168吗？这种更大的批量是否允许LSTM在6周的培训期间获得更长的范围相关性？

其次，我一直使用前一天的观测值$y_{(t-24)}$作为当前一天温度(同期) $y_t$的预测值。这是一种有效的方法，还是LSTM将寻找的长期相关性的冗余？

keras

time-series

lstm

回答 1

Data Science用户

回答已采纳

发布于 2018-08-26 13:50:23

批次大小与系列长度不同。批次大小指的是观察的数量，通常是在执行小批量随机梯度下降时定义的。

如果您正在做N个小型批处理SGD，您需要确保您的网络的输入是一个Nx168张量。批次大小通常为32-128次观察.

你的第二个问题，方法很好，只是不一样。看看哪个更好。

票数 2

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/37433

复制

相似问题

问递归神经网络(LSTM)批量大小和输入
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问递归神经网络(LSTM)批量大小和输入EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问递归神经网络(LSTM)批量大小和输入
EN