我在一个包含3630371个数据点和39个特征的语音数据中对语音和非语音进行分类。即语音数据的形状为(3630371,39)。如何将其重塑为LSTM输入。什么是3D input_shape,或者"Samples“、"Timestep”和“Feature”的值是什么。
下面的是正确的吗?
data.reshape(3630371, 1, 39)
LSTM(32, input_shape = (1, 39))请帮帮我!毫无线索。
发布于 2019-07-18 00:23:34
LSTM输入:(no of samples, timesteps, features)
data.reshape(3630371, 1, 39)
LSTM(32, input_shape = (1, 39))在上面的代码中,您实际上只有一个时间步,它没有利用LSTM的能力。您正在做的是: LSTM在第一个时间步中接受39维向量作为输入,并终止迭代。
另一种选择是给出39个时间步的标量。
data.reshape(3630371, 39, 1)在这里,LSTM循环了39次(39个时间步),但是在每个时间步都接受一个标量作为输入。
事实上,在no_timestep x feature_dim = total_input_dimension之前,任何其他组合都可以。通常,这在很大程度上取决于您正在处理的修复这些数字的域。
https://stackoverflow.com/questions/57079344
复制相似问题