发布于 2016-10-11 09:43:09
没有流的方法,就像Google在语音API上所做的那样。要注册新的配置文件,不需要30秒。在我最近的实践中,我取得了10秒的成功结果。MS的核心问题是对多个扬声器的限制。你必须找到自己的方法,如何把它们分割成不同的音轨。否则它就会认出第一个已知的声音。
发布于 2016-10-09 10:16:51
注册需要30秒的数据。一旦您有了用户配置文件,您就可以从1秒的示例中识别用户,这样您就可以在非常小的延迟范围内几乎实时地完成此操作。要使用它,您需要设置shortAudio参数。很难想象识别比这更快。
如果您需要一些不同的东西,就有一些开源的语音工具包,比如卡尔迪,它们可以做更灵活的事情。
https://stackoverflow.com/questions/39920134
复制相似问题