首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在SRILM中实现基于监督类的语言模型?

如何在SRILM中实现基于监督类的语言模型?
EN

Stack Overflow用户
提问于 2018-05-08 12:25:49
回答 1查看 629关注 0票数 3

我找到了教程,其中使用Brown集群实现了基于类的LM,只传递了您想要的类数,但是我希望实现一个基于类的模型,在这个模型中,我首先给出类分配。我试过这个http://projects.csail.mit.edu/cgi-bin/wiki/view/SLS/SriLM。但这给了LM中所有的纳克-99。这方面的文件很少,有人能帮我吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-05-08 21:05:38

我以前也这么做过,但那是几年前的事了。让我看看我能不能为你回溯这些步骤。

第一步是创建指定类的文件。它应该有三列。首先是类id,然后是给定类的单词的概率,最后是单词。

下一步是用它们的类is替换训练数据中的所有单词。您可以使用SRILM replace-words-with-classes脚本,也可以编写自己的脚本。

现在,您使用ngram-count训练语言模型,就像对常规的非类n格模型一样。

对于计算,您只需指定语言模型和类文件。

代码语言:javascript
复制
ngram -ppl test_data.txt -lm class.lm -classes class_definition_file.txt
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50233608

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档