如何从包含语音的单个音频文件中估计信噪比?我知道两种方法:
http://labrosa.ee.columbia.edu/~dpwe/tmp/nist/doc/stnr.txt
- S = sum{x[i]^2 \* e[i]}
- N = sum{x[i]^2 \* (1-e[i])}
- e[i] some sort of voice activity detection (speech/non-speech indicator)
是否有任何更好的方法不需要立体声数据(或清洁和噪音版本的数据)?我还想避免NIST文档中描述的“第二种方法”(见1)。这就对这些分布做出了强有力的假设。
发布于 2012-09-08 14:00:18
人类的声音频率从300赫兹到3 kHz。这是(旧的)电话系统正在使用的。人类的声音从来没有一次使用所有这些频率,这就是为什么我们可以做一个频率分析来找出噪音地板-没有任何参考或声音活动检测ei。
H 210As,code>信噪比=(S)/N。电平为,信噪比随时间而变化,带着一些新的样本回到步骤1--可能有一些重叠的https://stackoverflow.com/questions/8150725
复制相似问题