我有一个化学过程的以下数据集,该过程由5个连续的输入向量组成,以产生1个输出。每分钟对每个输入采样一次,而输出os每5分钟采样一次。

虽然我认为输出取决于前面的5个输入向量,但我决定为我的设计寻找LSTM。在对我的LSTM架构进行了大量研究之后,我得出结论,我应该用零来屏蔽一些输出序列,只留下最后一个输出。根据我的数据集,最终的架构如下:

我的问题是:我的3D输入张量参数应该是什么?例如,5,5,??还有,我的“批量大小”应该是多少?应该是我的样品数量吗?
发布于 2016-09-16 00:29:02
由于您要进行多对一序列建模,因此您不需要在输出中填充零(这不是必需的)。最简单的事情是在最后一步执行分类,即在RNN/LSTM看到第五个输入之后。3D输入张量的维度将是batch_size,sequence_length,input_dimensionality,其中sequence_length是5( 1-5,7-11,13-17等行),input_dimensionality也是5(即A- E列)。Batch_size取决于示例的数量(以及您的数据的可靠性),如果您有超过10,000个示例,那么批处理大小30-50应该是可以的(请阅读this关于选择适当批处理大小的说明)。
发布于 2018-10-31 01:13:05
看一下前面的答案,我会说你不需要做多对一架构。这真的取决于你有什么问题。例如,如果您的系统有许多来自过去的依赖项,即在您的案例中超过5个样本,那么做多对多架构会更好,但具有不同的输入和输出频率。但是如果你认为前面的5个样本不会影响你接下来的5个样本。那么多对一架构就能做到这一点。
此外,如果您的问题是回归,则可以使用密集层,因为LSTM单元的输出是输出范围为(-1,1)的tanh。
https://stackoverflow.com/questions/39515320
复制相似问题