我正在阅读speech recognition上的这份指南,其中提到我需要三个项目来进行语音识别:声学模型、语言模型和语音字典。
我想开始玩这个python demo,它使用Gstreamer从麦克风中捕获,并重新采样到8 8kHz,16位的PCM音频。
我看到我可以指定语言模型和语音词典,并且我使用cmu提供的模型和语音词典
http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Language%20Model/但是我不明白我应该在哪里指定声学模型?gstreamer有自己的声学模型吗?我希望使用这里提供的声学模型来获得稍微更好的结果:
http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Acoustic%20Model/(对于超链接,我很抱歉。我不能发布超过2个代表少于10的链接)
发布于 2012-12-01 05:26:43
但是我很困惑,我应该在哪里指定声学模型?
您可以使用gstreamer元素的hmm属性指定模型。就像教程中介绍的一样
asr.set_property('lm', '/home/user/mylanguagemodel.lm')您可以使用
asr.set_property('hmm', '/home/user/acoustic_model_folder')gstreamer是否有自己的声学模型,我正在暗中使用?
是的,默认情况下,它使用发行版中的美国英语模型hub4wsj_sc_8k
https://stackoverflow.com/questions/13653379
复制相似问题