自动语音匹配不是自动语音识别,而是比较两段语音信号,并返回这两种语音信号匹配的百分比。
这种技术通常会像这样的场景一样使用:
2.我们可以从上面的单字扩展到句子。那么如何匹配这些音频信号呢?
这里的问题是为ASM寻找一些好的开源或商业解决方案。
或者任何其他好的解决方案来满足这样的实际需求?
提前谢谢!
发布于 2011-12-07 22:12:49
与模板的比较不会给出任何好的结果,因为它实际上不会暗示错误地说了什么。良好的语音学习框架与模板不匹配,而是与代表正确和错误发音的声学模型相匹配。这样就可以检测到学习者的言语错误。你可以阅读
SRI EduSpeakTM系统:识别与发音评分http://www.speech.sri.com/people/hef/papers/EduSpeak.ps
要在IPhone上实现该算法,可以检查
http://ottercall.com
https://stackoverflow.com/questions/8411235
复制相似问题