首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何创建音频缓冲区来访问几秒钟前的麦克风输入

如何创建音频缓冲区来访问几秒钟前的麦克风输入
EN

Stack Overflow用户
提问于 2019-11-19 10:47:43
回答 1查看 93关注 0票数 0

我正在尝试创建一个语音识别功能,可以用一个热词激活。我发现了这个snowboy包,它可以创建一个hotword监听器,可以全天候监听并在激活时运行特定的任务。

我的问题是,我需要在检测到热词时运行语音验证功能。假设我的热词是"hello“,语音身份验证需要的输入是"hello,请开门”。但是如果我在检测到热词之后开始记录,我需要重复单词hello。我怎样才能在不重复的情况下获得完整的“你好,请打开门”录音。

有没有办法让snowboy输出它用来激活的短音频文件"hello“,如果是这样的话,我可以把它们组合起来。

如果现在我可以创建一个音频缓冲区,它将一直保存最后10秒的麦克风数据,而不会对cpu产生太大的影响。同时,这也需要与雪男孩分享麦克风。

这是我的想法,但我不知道如何实现它。请告诉我怎样做才能得到完整的录音。

可以随意编辑的问题是有些地方不清楚。

谢谢你!!

EN

回答 1

Stack Overflow用户

发布于 2020-01-12 02:22:47

是。当检测到时,Snowboy默认播放在resources文件夹中找到的"ding“wave文件。您可以编辑snowboydecoder.HotwordDetector函数来播放另一个声音文件,而不是铃声(您可能需要大致了解它的编译语言)。你可以在这里下载一个自定义的wave文件来播放,或者使用互联网上各种免费的TTS APIs来生成一个“机器人发声”的自定义消息,保存到你的计算机上。如果需要的话,我会详细解释的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58925916

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档