首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >MITIE如何进行命名实体识别?

MITIE如何进行命名实体识别?
EN

Data Science用户
提问于 2017-03-31 11:43:56
回答 1查看 4.6K关注 0票数 6

我试图使用MITIE从短文本中提取命名实体。我对日期、时间、名字和地点等实体感兴趣。开箱即用,MITIE只识别姓名、地点和组织。我想把它训练成识别日期、时间和其他类别。通过查看MITIE目录的结构和dlib网站,我发现这是通过支持向量机完成的。这是正确的吗?

关于向命名实体识别器添加新类别,我有几个问题:

  1. 这能以一种增强的方式进行吗?也就是说,考虑到现有的NER系统,我是否可以添加分类示例并训练它识别它们呢?还是我需要从头开始训练模特?
  2. 如果我确实需要从头开始训练模型,那么我可以使用什么数据集来完成这个任务?
  3. 与添加新示例有关的是,是否有一种我可以使用的在线方法,在需要时为系统提供新的示例和类别?
EN

回答 1

Data Science用户

回答已采纳

发布于 2017-07-14 06:44:43

在使用MITIE几个星期之后,我觉得我至少有足够的时间回答我的基本问题:

  1. (和3.)所有的模型都需要从头开始训练--没有在线方法在模型中添加新的样本。这是不幸的,因为MITIE至少要花45分钟到一个小时才能在大约20K大小的数据集上进行训练。
  2. 我使用的数据集是阿提斯CoNLL 2003DBpedia

就分类的准确性而言,我发现MITIE是相当好的,尽管为它准备数据集需要做一些工作。

票数 6
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/18026

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档