问CoreNLP服务器不返回实体提及
EN

Stack Overflow用户

提问于 2016-02-23 15:48:53

回答 1查看 253关注 0票数 4

从这里下载了这里服务器并遵循了这些指令，当我将entitymentions作为注释器时：

wget --post-data 'Mark Ronson played a concert in New York.' 'localhost:9000/?properties={"tokenize.whitespace": "true", "annotators": "tokenize,ssplit,pos,entitymentions", "outputFormat": "json"}'

返回的json如下所示，虽然ner是按令牌添加的，但没有提到的列表。

知道为什么吗？

(值得一提的是，corenlp.run似乎也没有返回它们-这些亮点似乎是后处理的结果)。

{
    "sentences": [
        {
            "index": 0,
            "parse": "SENTENCE_SKIPPED_OR_UNPARSABLE",
            "tokens": [
                {
                    "index": 1,
                    "word": "Mark",
                    "originalText": "Mark",
                    "lemma": "Mark",
                    "characterOffsetBegin": 0,
                    "characterOffsetEnd": 4,
                    "pos": "NNP",
                    "ner": "PERSON"
                },
                {
                    "index": 2,
                    "word": "Ronson",
                    "originalText": "Ronson",
                    "lemma": "Ronson",
                    "characterOffsetBegin": 5,
                    "characterOffsetEnd": 11,
                    "pos": "NNP",
                    "ner": "PERSON"
                },
                {
                    "index": 3,
                    "word": "played",
                    "originalText": "played",
                    "lemma": "play",
                    "characterOffsetBegin": 12,
                    "characterOffsetEnd": 18,
                    "pos": "VBD",
                    "ner": "O"
                },
                {
                    "index": 4,
                    "word": "a",
                    "originalText": "a",
                    "lemma": "a",
                    "characterOffsetBegin": 19,
                    "characterOffsetEnd": 20,
                    "pos": "DT",
                    "ner": "O"
                },
                {
                    "index": 5,
                    "word": "concert",
                    "originalText": "concert",
                    "lemma": "concert",
                    "characterOffsetBegin": 21,
                    "characterOffsetEnd": 28,
                    "pos": "NN",
                    "ner": "O"
                },
                {
                    "index": 6,
                    "word": "in",
                    "originalText": "in",
                    "lemma": "in",
                    "characterOffsetBegin": 29,
                    "characterOffsetEnd": 31,
                    "pos": "IN",
                    "ner": "O"
                },
                {
                    "index": 7,
                    "word": "New",
                    "originalText": "New",
                    "lemma": "New",
                    "characterOffsetBegin": 32,
                    "characterOffsetEnd": 35,
                    "pos": "NNP",
                    "ner": "LOCATION"
                },
                {
                    "index": 8,
                    "word": "York.",
                    "originalText": "York.",
                    "lemma": "York.",
                    "characterOffsetBegin": 36,
                    "characterOffsetEnd": 41,
                    "pos": "NNP",
                    "ner": "LOCATION"
                }
            ]
        }
    ]
}

stanford-nlp

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-02-23 17:12:47

无论是好是坏，我们目前没有输出实体提到的输出者。推荐的解决方法是按照实体提到注解器的方式对数据进行后置处理:相同NER的连续跨度被认为是实体提及。我相信实体提到对象中的所有注释也都附加到组件令牌上。

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/35582020

复制

相似问题

问CoreNLP服务器不返回实体提及
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问CoreNLP服务器不返回实体提及EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问CoreNLP服务器不返回实体提及
EN