我正在使用https://github.com/TalAter/annyang将语音翻译成文本。
在annyang.start();被调用之后,我发现麦克风连接到谷歌的语音识别引擎,并且只会在调用annyang.abort()之后停止流数据。
必须知道,我是否可以保留麦克风进行被动语音检测,或者是否有必要在命令发出后关闭麦克风,以保留数据和带宽。
我找不到任何关于谷歌语音识别使用多少数据的统计数据。
是否有任何关于这个主题的文档是我错过的,或者我如何衡量这一点?
发布于 2016-06-20 11:03:06
不确定这是否标准,但这是我的发现:
我看了一下网络活动。
在启动语音识别服务之后,我的输出带宽从每秒几个字节(0 ~ 60 bps)增加到大约每秒18 KB ~20 KB,以及大约每秒+- 1KB ~1.5KB。
不管我发出什么声音,这个速度似乎相当稳定。
+- 20 60每秒60*60 =72000 60
结论:
如果服务保持活跃状态,语音识别将每小时消耗72 per左右。
https://stackoverflow.com/questions/37918664
复制相似问题