我正在寻找一个简单的C#实时语音检测库。输入应为音频流,输出应为“人声”或“非人声”。我没有语音识别或信号处理方面的知识,任何形式的帮助我都将不胜感激。
发布于 2012-07-30 21:37:57
看看"Detecting audio silence in WAV files using C#“的答案。我假设输入是一个WAV文件。如果没有,请提供音频流的格式,或者如果您打算直接从麦克风获取输入。如果您可以测量音频流中的静音量,并且知道音频流的持续时间,那么您就可以计算通话时间。答案中的链接是死的,但是如果你去codeproject.com上搜索“wav波形”,你会在许多项目中找到一个命中,这些项目向你展示了如何解释和操作C#文件。如果存在背景噪声,则检测静默可能有点主观。您需要为静音选择一个最小音量阈值,低于该阈值的任何音量都被认为是静音。
https://stackoverflow.com/questions/11697854
复制相似问题