我想写个代码来检测婴儿的哭声。我正在使用Windows作为平台。目前,我可以得到音频样本和它的频率图(使用FFT),但不确定如何继续前进。
我想问的是,鉴于婴儿的时频图,我应该遵循哪些步骤来检测婴儿的哭声。
在语音识别中,我看到了一些方法,如中值滤波和隐马尔可夫模型。但是对于简单的声音检测,我是否需要采用这样一种诡辩的方法?
如果你能帮助我,我将非常感激。
发布于 2015-07-12 14:10:00
隐马尔可夫模型在语言识别中得到了广泛的应用,但是由于你不需要知道你的宝宝在说什么(下一个项目:婴儿翻译),我不认为这是你需要的。
你应该做的是看看很多婴儿哭的照片,并寻找模式。或者,更好的是,让你的算法这样做。您要做的是计算有关您的声音的特定指标,称为MFCC。
你在1000个哭声样本上做这件事,然后你就有了1000个度量向量。
现在,对于每一个度量,计算标准偏差。这给了你一种方法,告诉你一个随机的婴儿声音样本,它是有多大的不同,从平均哭泣的声音。
这听起来很难,但我知道外面有一些工具。看看狮身人面像。你也许可以训练去工作。
但无论如何,从收集婴儿哭声开始;(但不要偷糖果)
https://stackoverflow.com/questions/31368124
复制相似问题