首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >谷歌语音识别是如何工作的?

谷歌语音识别是如何工作的?
EN

Stack Overflow用户
提问于 2014-02-27 03:07:20
回答 1查看 5.2K关注 0票数 0

我知道音频指纹识别音频文件,这是很棒的,但我真正想知道的是Google是如何制作语音识别API的,它们是如何获取音频和返回的单词的。

我写了一个宝石来指纹wav音频文件并对它们进行比较,但是如果我用指纹将我的声音与充满指纹的数据库进行比较,可能要花费很长时间。谷歌是怎么做到的?

用途:

我真的很喜欢语音识别,我想要一个地方开始编码,但我不知道从哪里开始。DragonVoice是语音识别软件的另一个例子,所有这些软件都非常快。

我想知道从音频记录到转换成文本的服务器流。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-02-27 22:16:28

使用源,路加:-)

最好的开源语音识别软件: CMUSphinx http://cmusphinx.sourceforge.net/

学习曲线有点陡峭,但应该值得.

FWIW上对标签语音识别的描述说:语音识别意味着说话人的识别,并且经常被误用为“语音识别”--识别正在说的话。

正如引用的那样,这是一个非常常见的错误:-)

玩得开心!

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/22058219

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档