我正在开发一个android应用程序,TTS (文本到语音)由语音命令控制。对于语音识别,我使用的是pocketsphinx,当TTS不活动时(即"start“命令),它可以正常工作。然而,当TTS处于活动状态时(例如,对于“停止”命令),识别的准确性就会下降。
我试过使用AcousticEchoCanceler,但它似乎没有帮助。你能告诉我:
谢谢!
发布于 2014-08-21 08:25:15
我们很快就在聊天中和你讨论了这个问题。
AEC应该过滤输入的电话输出吗?是因为它不能正常工作,还是它不应该这样做?
不,AEC不会过滤TTS。它去除了重复的回声信号。
我还能试试什么呢?
您可能想先将音频合成到文件中:
How to store text to speech output as WAV file?
然后再弹。当你知道是什么播放,你可以过滤它从录音中减去它从录制的声音,最好的延迟。否则,这是一个非常复杂的问题。
https://stackoverflow.com/questions/25418266
复制相似问题