首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何将更多的标记词添加到斯坦福POS-Tagger的训练模型中?

如何将更多的标记词添加到斯坦福POS-Tagger的训练模型中?
EN

Stack Overflow用户
提问于 2011-04-07 01:50:16
回答 2查看 287关注 0票数 0

我在文档中没有找到任何关于向标记器添加更多标记单词的内容,特别是双向单词。谢谢

EN

回答 2

Stack Overflow用户

发布于 2011-05-13 13:04:15

目前还不能,模型训练是一次性的操作。(由于标记器使用的权重考虑了上下文和频率,因此在文章中添加新词不是一件容易的事情。)

票数 1
EN

Stack Overflow用户

发布于 2013-11-05 10:32:55

有一种解决方法。它很难看,但应该能起到作用:

  • 构建您的单词列表
  • 扫描文本中的这些单词
  • 如果发现任何与您自己的词性标记匹配的内容(NLTK可以在此处帮助您)
  • 将其提供给斯坦福分析器。

来自:http://www.cs.ucf.edu/courses/cap5636/fall2011/nltk.pdf“您还可以为其提供带POS标记的文本;如果您的标记有意义,解析器将尝试使用它们。如果解析器在您的文本域中出现标记错误,您可能需要这样做。”

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/5570765

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档