我想建立一个模型来识别阿拉伯字母。我知道如何创建语言模型和字典文件,但我仍然停留在声学模型上。我记录每个字母的wav文件,但在培训期间,它说培训时间太短,尽管培训仍在继续。当我尝试使用它时,模型不会识别任何东西(给出null)。
我想知道我应该如何记录wav文件,应该继续重复,例如,字母Alif在一个wav文件中重复100次,还是应该只记录多个相同字母的wav文件。
你的帮助是非常感谢的。
发布于 2014-10-06 09:48:32
我想知道我应该如何记录wav文件,应该继续重复,例如,字母Alif在一个wav文件中重复100次,还是应该只记录多个相同字母的wav文件。
最好有多个带有连续词的文件,而不是字母。字母很难辨认。
当我尝试使用它时,模型不会识别任何东西(给出null)。
这里可能有不同的问题(错误的音频格式等)。您可以在CMUSphinx论坛上与dropbox共享您的数据库,以获得有关此问题的帮助。
https://stackoverflow.com/questions/26194198
复制相似问题