首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用CMU Shinx、JSAPI和Google Speech API进行语音识别

使用CMU Shinx、JSAPI和Google Speech API进行语音识别
EN

Stack Overflow用户
提问于 2011-12-29 14:37:37
回答 2查看 2.1K关注 0票数 1

语音识别是我当前项目的众多功能之一,很可能是用J2EE开发的(如果其他语言的选择是合理的,也欢迎他们)。

googleSO上的大多数链接都建议上述三种选择,Sphinx4,JSAPI directly和Google Speech API (向谷歌发出服务器调用,然后以文本形式获取结果)。

我还有其他免费的选择吗?如果我使用Sphinx-4,我如何获得与它一起使用的通用英语的语言模型?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2011-12-30 00:52:05

是的,有。

  1. 可以使用一个包装器来实现谷歌语音识别器,这只是一行基本代码。您发送FLAC或SPEEX格式的语音音频,并收到识别和置信度分数。唯一的问题是Google可以关闭API,就像Google translate一样。
  2. 其他选项是使用Sphinx (Sphinx4或Pocketsphinx)。
  3. 可以使用HTK (http://htk.eng.cam.ac.uk/),也可以使用HVite (HTK解码器)或其他类似Julius (http://julius.sourceforge.jp/en/)的解码器。还有使用HTK训练声学模型和/或语言和语法的其他选项。

Voxforge有HTK和Sphinx (http://voxforge.org/)的声学和语言模型。

票数 3
EN

Stack Overflow用户

发布于 2012-01-05 06:57:07

,如果我使用Sphinx-4,我如何获得与它一起使用的通用英语的语言模型?

您可以从CMUSphinx网站或其他地方下载它们。您也可以自己构建它们。其中一个可能的位置是

http://www.keithv.com/software/csr/

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8664726

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档