我想使用sphinx4来进行通用语音识别,例如你告诉应用程序一些事情,它会打印你说过的话。然而,当我浏览这些例子的时候,它都是关于识别非常少的词汇量的。是否有任何好的教程来帮助配置它来识别更有挑战性的东西,例如两个人之间的对话?
PS:我相信sphinx4已经有了正确的声音模型和字典,但是lm文件是针对特定的应用程序的,所以我需要一个lm文件,对吗?
发布于 2014-01-12 16:21:38
然而,当我浏览这些例子的时候,都是关于用非常少的词汇量来识别的。是否有任何好的教程来帮助配置它来识别更有挑战性的东西,例如两个人之间的对话。
您不需要配置sphinx4。您只需签出subversion的最新版本并按原样使用演示,有关详细信息,请参阅本教程。
http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4
当我相信sphinx4已经包含了正确的声音模型和字典时,但是lm文件是针对特定应用程序的,所以我需要一个lm文件,对吗?
提供的默认lm文件对于泛型语音来说已经足够好了,但是如果您有特定的域,则创建特定域的语言模型是有意义的。
https://stackoverflow.com/questions/21073061
复制相似问题