我知道Google Voice Search的工作原理是将原始音频(当然是数字化的)发送到Google的服务器,然后Google以文本形式返回结果。
结果本身相对较小(除非它是一个非常长的句子……),所以我认为通过Internet发送它所需的时间可以忽略不计(不包括HTTP开销、服务器负载等)。
我感兴趣的是发送到Google语音服务器的实际“模拟”原始音频的大小(KB),以便获得该组件对Internet连接速度(上行链路)的依赖关系的大致数字。
当然,原始音频数据包的大小很大程度上取决于所说的短语(一个单词?整句话?一个非常长的句子?),所以我正在寻找一些关于这方面的统计信息(平均,典型,等等)。
我也知道那些原始的音频包是压缩的。有关于压缩方法的信息吗?(它不是MP3,或者是它?)
Android设备和PC(即基于Chrome的)的压缩方式是否不同?
虽然这似乎不是一个直接的编程问题,但在我的例子中,它与编程直接相关,因为答案可能会影响基于Google Voice Search构建应用程序时使用的算法。
发布于 2012-07-12 03:46:14
我还没有测量到底有多少数据被发送到Google服务器,但让我们合理地假设语音搜索
在这种情况下,1秒的记录将消耗(1 * 16,000 * 2) / 2 = 16,000 bytes。
https://stackoverflow.com/questions/11398969
复制相似问题