我正在尝试为语音识别训练一个新的声学模型,具有自定义功能。是否可以将特征矩阵而不是wav文件输入到CMUSphinx中进行培训?我尝试搜索谷歌和教程页,但找不到任何有关它的信息。我是不是遗漏了什么?
发布于 2020-04-22 10:07:46
是否可以将特征矩阵而不是wav文件输入到CMUSphinx中进行培训?
更好的方法是使用更现代化的工具包,比如Kaldi。
我试着在google和教程页面上搜索,但是找不到任何关于它的信息。我是不是遗漏了什么?
您只需自己准备mfc文件,跳过feature_extraction的第一步。您必须编写如下所述的代码:
https://cmusphinx.github.io/wiki/mfcformat/
在卡尔迪,你只需要自己准备方舟档案:
https://stackoverflow.com/questions/61360913
复制相似问题