文章/答案/技术大牛

发布

社区首页 >问答首页 >如何将语音数据整形为LSTM输入？

问如何将语音数据整形为LSTM输入？
EN

Stack Overflow用户

提问于 2019-07-17 23:24:12

回答 1查看 297关注 0票数 2

我在一个包含3630371个数据点和39个特征的语音数据中对语音和非语音进行分类。即语音数据的形状为(3630371，39)。如何将其重塑为LSTM输入。什么是3D input_shape，或者"Samples“、"Timestep”和“Feature”的值是什么。

下面的是正确的吗？

data.reshape(3630371, 1, 39)
LSTM(32, input_shape = (1, 39))

请帮帮我！毫无线索。

keras

deep-learning

lstm

recurrent-neural-network

speech

回答 1

Stack Overflow用户

发布于 2019-07-18 00:23:34

LSTM输入：(no of samples, timesteps, features)

data.reshape(3630371, 1, 39)
LSTM(32, input_shape = (1, 39))

在上面的代码中，您实际上只有一个时间步，它没有利用LSTM的能力。您正在做的是: LSTM在第一个时间步中接受39维向量作为输入，并终止迭代。

另一种选择是给出39个时间步的标量。

data.reshape(3630371, 39, 1)

在这里，LSTM循环了39次(39个时间步)，但是在每个时间步都接受一个标量作为输入。

事实上，在no_timestep x feature_dim = total_input_dimension之前，任何其他组合都可以。通常，这在很大程度上取决于您正在处理的修复这些数字的域。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/57079344

复制

相似问题

问如何将语音数据整形为LSTM输入？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何将语音数据整形为LSTM输入？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何将语音数据整形为LSTM输入？
EN