在哪里可以找到关于ARPA语言模型格式的文档?
我正在开发简单的语音识别应用程序与口袋斯芬克斯STT引擎。出于性能原因,推荐ARPA。我想了解我能做多少来调整我的语言模式,以满足我的定制需求。
我发现的只是一些非常简短的ARPA格式描述:
我是STT的初学者,我很难把头绕在这上面(n克等)。我在找更详细的文档。类似于关于JSGF语法的文档如下:
http://www.w3.org/TR/jsgf/
发布于 2013-05-07 06:27:42
关于格式,实际上没有比在这些文档中所说的更多的了。
此外,您可能需要准备一个带有示例语句和基于它生成语言文件的文本文件。有一个在线版本可以帮你:电磁工具
发布于 2013-11-13 10:44:33
您可以使用这个技术报告来补充这些文档,该报告全面概述了用于语言建模的平滑:http://www.ee.columbia.edu/~stanchen/papers/h015a-techreport.pdf,您还可以找到退避模型和内插模型的定义。
发布于 2019-12-18 07:04:34
我可能已经很晚才回答这个问题,我发现在这个由Steve et编写的“来自链接 The HTK ”中,ARPA格式有很好的文档。阿尔。
ARPA的每一行都是三个存储点:
n-gram log-probability(base10) ; the n-gram itself ; back-off weight (also in log space). https://stackoverflow.com/questions/16408163
复制相似问题