我正在尝试创建一个语音识别功能,可以用一个热词激活。我发现了这个snowboy包,它可以创建一个hotword监听器,可以全天候监听并在激活时运行特定的任务。
我的问题是,我需要在检测到热词时运行语音验证功能。假设我的热词是"hello“,语音身份验证需要的输入是"hello,请开门”。但是如果我在检测到热词之后开始记录,我需要重复单词hello。我怎样才能在不重复的情况下获得完整的“你好,请打开门”录音。
有没有办法让snowboy输出它用来激活的短音频文件"hello“,如果是这样的话,我可以把它们组合起来。
如果现在我可以创建一个音频缓冲区,它将一直保存最后10秒的麦克风数据,而不会对cpu产生太大的影响。同时,这也需要与雪男孩分享麦克风。
这是我的想法,但我不知道如何实现它。请告诉我怎样做才能得到完整的录音。
可以随意编辑的问题是有些地方不清楚。
谢谢你!!
发布于 2020-01-12 02:22:47
是。当检测到时,Snowboy默认播放在resources文件夹中找到的"ding“wave文件。您可以编辑snowboydecoder.HotwordDetector函数来播放另一个声音文件,而不是铃声(您可能需要大致了解它的编译语言)。你可以在这里下载一个自定义的wave文件来播放,或者使用互联网上各种免费的TTS APIs来生成一个“机器人发声”的自定义消息,保存到你的计算机上。如果需要的话,我会详细解释的。
https://stackoverflow.com/questions/58925916
复制相似问题