首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何将语音数据整形为LSTM输入?

如何将语音数据整形为LSTM输入?
EN

Stack Overflow用户
提问于 2019-07-17 23:24:12
回答 1查看 297关注 0票数 2

我在一个包含3630371个数据点和39个特征的语音数据中对语音和非语音进行分类。即语音数据的形状为(3630371,39)。如何将其重塑为LSTM输入。什么是3D input_shape,或者"Samples“、"Timestep”和“Feature”的值是什么。

下面的是正确的吗?

代码语言:javascript
复制
data.reshape(3630371, 1, 39)
LSTM(32, input_shape = (1, 39))

请帮帮我!毫无线索。

EN

回答 1

Stack Overflow用户

发布于 2019-07-18 00:23:34

LSTM输入:(no of samples, timesteps, features)

代码语言:javascript
复制
data.reshape(3630371, 1, 39)
LSTM(32, input_shape = (1, 39))

在上面的代码中,您实际上只有一个时间步,它没有利用LSTM的能力。您正在做的是: LSTM在第一个时间步中接受39维向量作为输入,并终止迭代。

另一种选择是给出39个时间步的标量。

代码语言:javascript
复制
data.reshape(3630371, 39, 1)

在这里,LSTM循环了39次(39个时间步),但是在每个时间步都接受一个标量作为输入。

事实上,在no_timestep x feature_dim = total_input_dimension之前,任何其他组合都可以。通常,这在很大程度上取决于您正在处理的修复这些数字的域。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57079344

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档