这是一个问题,我遇到了使用谷歌语音文字引擎。我目前正在以32 in块实时播放16位/ 16 kHz音频。但是在发送音频和接收记录之间平均有25秒的延迟,这违背了实时转录的目的。
为什么会有这么高的延迟?
发布于 2018-07-26 18:41:38
Google 文档建议使用100 ms的帧大小来减少延迟。
32 16 * (8位/1字节)*(1个样本/16位)*(1秒/ 16000个样本)=1秒。
所以,尝试发送3.2kB块代替。这将平均延迟从25s降低到~4s。
https://stackoverflow.com/questions/51545598
复制相似问题