首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >聚焦命名实体识别(NER)?

聚焦命名实体识别(NER)?
EN

Stack Overflow用户
提问于 2012-04-06 20:09:29
回答 2查看 1.6K关注 0票数 3

我想要识别特定领域(例如棒球)中的命名实体。我知道有像StanfordNER,LingPipe,AlchemyAPI这样的工具,我已经用它们做了一些测试。但正如我之前提到的,我希望它们是特定于领域的。这怎么可能呢?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-04-09 18:23:30

一种方法可能是

  1. 使用通用(非域特定)工具检测人名
  2. 使用主题分类器过滤掉不在域

<代码>G29中的文本

如果数据集的总大小足够大,并且提取器和分类器的准确性足够好,那么您可以使用结果来获得与相关领域密切相关的人名列表(例如,通过将结果限制为在特定领域文本中比在其他文本中更经常提及的那些人的姓名)。

以棒球为例,这应该是获得与棒球相关的人员列表的一种相当好的方式。然而,这不是一种仅获得棒球运动员列表的好方法。对于后者,有必要分析提到这些名字的确切背景以及关于这些名字的说法;但也许这不是必需的。

编辑:通过主题分类器我的意思与其他人可能简单地称为分类、文档分类、领域分类或类似的东西相同。现成工具的例子包括Python-NLTK中的分类器(参见here中的示例)和LingPipe中的分类器(参见here)。

票数 3
EN

Stack Overflow用户

发布于 2013-02-15 03:46:48

请看一下smile-ner.apppot.com,它涵盖了250+类别。具体来说,它涵盖了许多关于体育的人/队/俱乐部。可能对你的目的有用。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/10043293

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档