我正在考虑为我的母语开发语音识别软件,我正在考虑使用CMUSphinx-4。有一个包含英语单词的CMU字典文件,该文件将原始单词的拆分映射到其音素边界。例如,放弃=> 'AH','B','AE','N','D','AH','N','D‘我不能理解这背后的逻辑,我想为这个单词对话开发一个算法。如果任何人可以知道这种转换的算法或这种分裂是如何发生的,请与我分享它。
发布于 2015-09-07 00:05:13
将原始单词
到其音素边界
“边界”在这里是一个错误的词。它将单词映射到音素序列,与边界无关
如果有人知道这种转换的算法,或者这种分裂是如何发生的,请与我分享。
字典构造将在我们的教程中介绍
http://cmusphinx.sourceforge.net/wiki/tutorialdict
https://stackoverflow.com/questions/32423943
复制相似问题