我最近开始学习OpenEars语音识别,它很棒!但我也需要支持其他语言的语音识别和听写,如俄语、法语和德语,我发现here有各种不同的声学和语言模型。
但是我真的不明白--这足够我在应用程序中集成额外的语言支持了吗?
的问题是-我应该采取哪些步骤来成功地整合,例如俄语,开放耳朵?
据我所知,开放耳朵演示中所有用于英语语言的声学和语言模型都位于文件夹hub4wsj_sc_8k中。在voxforge language archives中可以找到相同的文件。所以我只是在演示中替换了它们。有一件事是不同的--在演示英语语言中,还有一个sendump 2MB大文件,它不在voxforge语言中,archives.There是在Open演示中使用的另外两个文件:
我代之以:
因为.dmp类似于.languagemodel。但是应用程序正在崩溃,没有任何错误。
我做错了什么?谢谢。
发布于 2013-05-10 15:51:11
根据我的评论,转载如下:
……对于这样的问题,第一步是打开OpenEarsLogging和verbosePocketsphinx,这将为您提供非常细粒度的错误信息(搜索控制台输出的单词错误和警告以节省时间)。有关此操作的说明可在文档中找到。请随意将问题带到OpenEars论坛.:http://politepix.com/forums/openears,您可能还想查看这个线程:http://politepix.com/forums/topic/other-languages
解决办法:
为了便于以后的读者继续阅读,在打开日志之后,我们使用mixture_weights文件代替sendump,并确保语音词典使用了声学模型中存在的音素,而不是英语音素。
我们完成此疑难解答的完整讨论可以在这里阅读:http://www.politepix.com/forums/topic/using-russian-acoustic-model/
更新:自从OpenEars 1.5于本周发布以来,可以将通向任何声学模型的路径传递给主要的聆听方法,并且有一种更标准化的方法来打包和引用任何声学模型,这样您就可以在同一个应用程序中拥有许多声学模型。这个论坛帖子中的信息取代了我在这个答案中链接到的讨论中的信息:http://www.politepix.com/forums/topic/creating-an-acoustic-model-bundle-for-openears-1-5-and-up/,由于历史原因,我离开了答案的其余部分,因为讨论中可能有一些细节仍然有用,但是可以跳过它,以支持新的链接。
https://stackoverflow.com/questions/14254266
复制相似问题