问谷歌语音识别是如何工作的？
EN

Stack Overflow用户

提问于 2014-02-27 03:07:20

回答 1查看 5.2K关注 0票数 0

我知道音频指纹识别音频文件，这是很棒的，但我真正想知道的是Google是如何制作语音识别API的，它们是如何获取音频和返回的单词的。

我写了一个宝石来指纹wav音频文件并对它们进行比较，但是如果我用指纹将我的声音与充满指纹的数据库进行比较，可能要花费很长时间。谷歌是怎么做到的？

用途：

我真的很喜欢语音识别，我想要一个地方开始编码，但我不知道从哪里开始。DragonVoice是语音识别软件的另一个例子，所有这些软件都非常快。

我想知道从音频记录到转换成文本的服务器流。

回答已采纳

发布于 2014-02-27 22:16:28

使用源，路加:-)

最好的开源语音识别软件: CMUSphinx http://cmusphinx.sourceforge.net/

学习曲线有点陡峭，但应该值得.

FWIW上对标签语音识别的描述说:语音识别意味着说话人的识别，并且经常被误用为“语音识别”--识别正在说的话。

正如引用的那样，这是一个非常常见的错误:-)

玩得开心！

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/22058219

复制

相似问题

问谷歌语音识别是如何工作的？EN