我需要创建我自己的"Ok谷歌“,当我的用户打开我的应用程序时,应用程序应该启动麦克风来收听我的用户说的每句话,当我的用户说”之前配置的单词“时,应用程序应该开始录制音频并发送到我的api.ai (我已经这样做了),但在我得到api.ai返回后,我需要将该文本转换为speach(我也已经这样做了),并等待我的用户提示( 10秒或更长时间取决于配置),如果我的用户说了什么,获取它并再次发送到api.ai。并且会一直循环,直到我的用户关闭我的应用程序。
可以做到这一点吗?
发布于 2017-08-22 01:51:07
除了检索原始音频之外,您所说的所有内容都是可能的。Google平台上的操作将获取音频并将其转录为文本,因此您不需要访问原始音频。
我建议您查看the Actions on Google getting started guide,了解如何执行您所描述的操作。
https://stackoverflow.com/questions/45788357
复制相似问题