首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在斯坦福大学( Stanford CoreNlp ),为什么不所有专有名词(NNP)也都命名实体?

在斯坦福大学( Stanford CoreNlp ),为什么不所有专有名词(NNP)也都命名实体?
EN

Stack Overflow用户
提问于 2020-07-31 04:44:05
回答 2查看 535关注 0票数 0

我使用斯坦福大学CoreNlp进行命名实体识别(NER)。我注意到,在某些情况下,这并不是100%,这是好的,也不令人惊讶。然而,即使单个词命名实体不被识别(即标签是O),它也有标记NNP (专有名词)。

例如,给定示例句“纽约的RestautantName是最好的出口”,nerTags()产生的[O, O, O, LOCATION, LOCATION, O, O, O, O, O]只能正确地识别“纽约”。这个句子的解析树看起来像

代码语言:javascript
复制
(ROOT
  (S
    (NP
      (NP (DT The) (NNP RestautantName))
      (PP (IN in)
        (NP (NNP New) (NNP York))))
    (VP (VBZ is)
      (NP (DT the) (JJS best) (NN outlet)))
    (. .)))

所以"RestaurantName“是一个专有名词(NNP)

当我查找专有名词的定义时,它听起来非常接近命名实体。有什么关系呢?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-08-02 06:06:34

解析器接受解析树状库数据的训练,命名实体识别器被训练成用于个人、位置、组织、MISC的单独的命名实体数据。

我认为RestaurantName可能会被标记为MISC,但是如果它没有被标记,这就意味着在命名实体的培训数据中没有真正的这样的例子。这里的关键点是,解析决策和命名实体决策是通过在不同数据上训练的独立模型而完全独立地做出的。

票数 1
EN

Stack Overflow用户

发布于 2020-09-03 09:25:50

命名实体是90年代为信息检索/提取目的而提出的概念。更准确地说,它考虑了应用程序文本中的“互名”,例如搜索引擎。

你可以读相应的维基百科页面

简单地说,许多命名实体不是专有名词:日期、数量、集合实体等等。相反,您可能会发现没有命名实体的专有名词,但这是相当罕见的,并且取决于应用程序。例如,语言名称(英语、法语、西班牙语)被认为是专有名词,但不能被命名为实体。历史,人类,宇宙也是如此。

所以NLP软件必须决定每一个专有名词是否是一个实体,它的类型是什么,这并不简单。

理论上,命名实体的定义依赖于一个确定的引用,该引用将名称绑定到一个对象,无论是具体的还是抽象的。这将导致符号学和哲学的考虑,所以我不会详细阐述,但您可能会发现许多文章和书籍讨论这个概念以及如何在软件中实现这个概念。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63185929

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档