首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何构建StanfordNER分类器

如何构建StanfordNER分类器
EN

Stack Overflow用户
提问于 2016-01-22 14:50:20
回答 1查看 195关注 0票数 2

我正在使用StanfordNER分类器。有4个分类器

代码语言:javascript
复制
english.all.3class.distsim.crf.ser.gz
english.muc.7class.distsim.crf.ser.gz
english.conll.4class.distsim.crf.ser.gz
example.serialized.ncc.ncc.ser.gz

这些分类器是如何建立的?因为它们都是基于不同的语料库,所以我猜

  1. 在语料库上训练一个机器学习分类器,如SVMOVR (用于多标签案例),以检测ORGANIZATIONPERSONLOCATION等实体,这意味着训练数据将是语料库中文档的完整文本。对于该文本,我们显式地表示了ORGANIZATIONs、PERSONs和LOCATIONs,这样分类器就能够预测这些实体。
  2. 训练机器学习分类器将POS标记与ORGANIZATIONPERSONLOCATION等实体连接起来。例如,可以训练一个量词来预测哪些专有名词应该是ORGANIZATION

这是正确的大局吗?我只是想找出如何建立我自己的能力。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-01-22 16:39:09

是的,这些模型是关于监督数据的。它们是一阶CRF,可以进行多类概率序列分类(所以不是OVR,不是SVM)。您可以在斯坦福大学网页上找到关于NER和斯坦福NER的介绍。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34949472

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档