我知道音频指纹识别音频文件,这是很棒的,但我真正想知道的是Google是如何制作语音识别API的,它们是如何获取音频和返回的单词的。
我写了一个宝石来指纹wav音频文件并对它们进行比较,但是如果我用指纹将我的声音与充满指纹的数据库进行比较,可能要花费很长时间。谷歌是怎么做到的?
用途:
我真的很喜欢语音识别,我想要一个地方开始编码,但我不知道从哪里开始。DragonVoice是语音识别软件的另一个例子,所有这些软件都非常快。
我想知道从音频记录到转换成文本的服务器流。
发布于 2014-02-27 22:16:28
使用源,路加:-)
最好的开源语音识别软件: CMUSphinx http://cmusphinx.sourceforge.net/
学习曲线有点陡峭,但应该值得.
FWIW上对标签语音识别的描述说:语音识别意味着说话人的识别,并且经常被误用为“语音识别”--识别正在说的话。
正如引用的那样,这是一个非常常见的错误:-)
玩得开心!
https://stackoverflow.com/questions/22058219
复制相似问题