问婴儿哭声检测
EN

Stack Overflow用户

提问于 2015-07-12 13:11:21

回答 1查看 2.6K关注 0票数 0

我想写个代码来检测婴儿的哭声。我正在使用Windows作为平台。目前，我可以得到音频样本和它的频率图(使用FFT)，但不确定如何继续前进。

我想问的是，鉴于婴儿的时频图，我应该遵循哪些步骤来检测婴儿的哭声。

在语音识别中，我看到了一些方法，如中值滤波和隐马尔可夫模型。但是对于简单的声音检测，我是否需要采用这样一种诡辩的方法？

如果你能帮助我，我将非常感激。

发布于 2015-07-12 14:10:00

隐马尔可夫模型在语言识别中得到了广泛的应用，但是由于你不需要知道你的宝宝在说什么(下一个项目:婴儿翻译)，我不认为这是你需要的。

你应该做的是看看很多婴儿哭的照片，并寻找模式。或者，更好的是，让你的算法这样做。您要做的是计算有关您的声音的特定指标，称为MFCC。

你在1000个哭声样本上做这件事，然后你就有了1000个度量向量。

现在，对于每一个度量，计算标准偏差。这给了你一种方法，告诉你一个随机的婴儿声音样本，它是有多大的不同，从平均哭泣的声音。

这听起来很难，但我知道外面有一些工具。看看狮身人面像。你也许可以训练去工作。

但无论如何，从收集婴儿哭声开始；(但不要偷糖果)

票数 4

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/31368124

复制

相似问题

问婴儿哭声检测EN