我们正在尝试通过JAVA客户端使用谷歌的StreamingRecognize方法。我们正在从麦克风读取数据,并将其发送到speech API。使用以下设置:识别配置- LINEAR16,16 size,en-US我们尝试将不同的缓冲区大小推送到StreamingRecognize (最多16000字节)。我们观察到,获得第一个结果至少需要4-5秒,并且在中间结果被流式传输之后。任何人都能确认这是否是API的预期行为。另外,如果能知道为什么会有这么多延迟,那就太好了。是否有任何方法或工作可以最小化延迟。
请注意,在延迟之后,我们将获得临时结果,并最终以合理的准确性获得完整的发声
发布于 2017-09-27 06:43:36
我怀疑在描述的上下文中有两种行为是错误的,
在您的java服务应用程序中,
如果以上几点都不起作用,请分享你的StreamingRecognize类。这样我就可以相应地调优您的代码
https://stackoverflow.com/questions/45983346
复制相似问题