我在文档中没有找到任何关于向标记器添加更多标记单词的内容,特别是双向单词。谢谢
发布于 2011-05-13 13:04:15
目前还不能,模型训练是一次性的操作。(由于标记器使用的权重考虑了上下文和频率,因此在文章中添加新词不是一件容易的事情。)
发布于 2013-11-05 10:32:55
有一种解决方法。它很难看,但应该能起到作用:
来自:http://www.cs.ucf.edu/courses/cap5636/fall2011/nltk.pdf“您还可以为其提供带POS标记的文本;如果您的标记有意义,解析器将尝试使用它们。如果解析器在您的文本域中出现标记错误,您可能需要这样做。”
https://stackoverflow.com/questions/5570765
复制相似问题