我不确定这是否可能,但不管怎样,
我在winform C#应用程序中使用using System.Speech.Recognition;。
我想知道是否有可能不仅可以识别语音,还可以识别声音,以某种方式识别不同声音之间的差异
从每个单独的声音,例如从两个同时或单独说话的用户作为不同的两个用户,获得接近于读取多个内容的内容。
或者至少可能有一些方法来控制背景音量,例如,如果AudioLevelUpdated事件允许我看到输入音量,但也可能存在一些特定的方法来将嘈杂的声音与背景中的额外噪音或声音分开
发布于 2017-05-16 12:11:58
System.Speech.Recognition不会在语音识别方面帮助您。System.Speech.Recognition旨在用于语音到文本的转换。向其添加语法可以提高其效率。您可以训练Windows桌面以实现更好的转换。请参阅控制面板中的语音识别。
有几个第三方库可用于语音识别。有关消除噪声的信息,请参阅Sound visualizer in C#。
你可以在msdn forum上找到一个有趣的讨论。
发布于 2017-05-16 16:11:07
我认为你应该看看CRIS,这是微软认知服务的一部分,至少对于你关于噪音的问题。
CRIS是一种自定义语音服务,其基本用途是使用自定义声学模型(如背景噪声)提高语音到文本的质量,并使用示例学习词汇。
您可以导入:
例如,在声学模型中,您具有:
预览中还提供了一个Speaker Recognition API
https://stackoverflow.com/questions/43991292
复制相似问题