当得知Google终于发布了面向开发人员的官方speech API时,我超级兴奋。我一直对谷歌的语音识别在Android、Chrome和其他产品上的出色表现感到惊讶。
我创建了一个Google Cloud帐户,启用了speech API,并按照Google Speech API documentation创建了一些测试脚本。精确度非常高,但速度却慢得离谱。一个18秒的音频文件将花费他们的引擎大约16秒来转录!Microsoft Bing Speech API只需3-4秒即可完成!
有没有人有过同样的经历?或者是我的配置有问题?任何帮助都是非常感谢的!
下面是我使用的代码:
BASH:
time curl "https://speech.googleapis.com/v1beta1/speech:syncrecognize?key={MY_API_KEY}" --header "Content-Type: application/json" --data '{"config":{"encoding":"FLAC","sample_rate":16000,"language_code":"en-US"},"audio":{"uri":"gs://accobot-speech/new_record.flac"}}'发布于 2017-01-10 05:13:06
到目前为止,这个问题的最佳参考资料仍然是谷歌平台上的the reply published in the issue tracker。
https://stackoverflow.com/questions/39029686
复制相似问题