首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >递归神经网络(LSTM)批量大小和输入

递归神经网络(LSTM)批量大小和输入
EN

Data Science用户
提问于 2018-08-25 21:39:01
回答 1查看 1.7K关注 0票数 2

我在Keras工作以建立LSTM模型。我理解设置STATEFUL=FALSE意味着在训练模型时将不同的批处理为独立的。

假设我想建立一个模型,用6周的每小时温度观测来预测明天的24小时温度。我一直使用的批量大小为24,这意味着每天的培训数据是独立使用的LSTM时,培训。但这意味着我不允许RNN在几天内获得更长的相关性,对吗?那么,我应该使用批处理大小的6*7*24=168吗?这种更大的批量是否允许LSTM在6周的培训期间获得更长的范围相关性?

其次,我一直使用前一天的观测值$y_{(t-24)}$作为当前一天温度(同期) $y_t$的预测值。这是一种有效的方法,还是LSTM将寻找的长期相关性的冗余?

EN

回答 1

Data Science用户

回答已采纳

发布于 2018-08-26 13:50:23

批次大小与系列长度不同。批次大小指的是观察的数量,通常是在执行小批量随机梯度下降时定义的。

如果您正在做N个小型批处理SGD,您需要确保您的网络的输入是一个Nx168张量。批次大小通常为32-128次观察.

你的第二个问题,方法很好,只是不一样。看看哪个更好。

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/37433

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档