首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >斯坦福大学核心nlp -使用ner和RegexNER -如果重叠,则regexNER胜过ner

斯坦福大学核心nlp -使用ner和RegexNER -如果重叠,则regexNER胜过ner
EN

Stack Overflow用户
提问于 2018-04-11 17:09:32
回答 1查看 163关注 0票数 0

我正在使用斯坦福大学的核心nlp进行命名实体识别。我发现一个使用regexp和ner togheter的问题。

这是我的句子:

“我的名字是文森佐”的翻译

Ner正确地找到了"vincenzo monaco“作为"NAME”regexner找到了"monaco“就像一座城市

对于注释器{“http://localhost:9009/?properties=”:“ner,regexner","outputFormat":"json"}的请求的输出

代码语言:javascript
复制
{
"sentences": [
    {
        "index": 0,
        "tokens": [
            {
                "index": 1,
                "word": "mi",
                "originalText": "mi",
                "lemma": "mi",
                "characterOffsetBegin": 0,
                "characterOffsetEnd": 2,
                "pos": "O",
                "ner": "O"
            },
            {
                "index": 2,
                "word": "chiamo",
                "originalText": "chiamo",
                "lemma": "chiamo",
                "characterOffsetBegin": 3,
                "characterOffsetEnd": 9,
                "pos": "O",
                "ner": "O"
            },
            {
                "index": 3,
                "word": "vincenzo",
                "originalText": "vincenzo",
                "lemma": "vincenzo",
                "characterOffsetBegin": 10,
                "characterOffsetEnd": 18,
                "pos": "O",
                "ner": "NAME"
            },
            {
                "index": 4,
                "word": "monaco",
                "originalText": "monaco",
                "lemma": "monaco",
                "characterOffsetBegin": 19,
                "characterOffsetEnd": 25,
                "pos": "O",
                "ner": "CITY"
            }
        ]
    }
]

}

如果我在http://localhost:9009/?properties={"annotators":"ner","outputFormat":"json"} (不带regexp)发出请求,它会正确回答:

代码语言:javascript
复制
{
"sentences": [
    {
        "index": 0,
        "tokens": [
            {
                "index": 1,
                "word": "mi",
                "originalText": "mi",
                "lemma": "mi",
                "characterOffsetBegin": 0,
                "characterOffsetEnd": 2,
                "pos": "O",
                "ner": "O"
            },
            {
                "index": 2,
                "word": "chiamo",
                "originalText": "chiamo",
                "lemma": "chiamo",
                "characterOffsetBegin": 3,
                "characterOffsetEnd": 9,
                "pos": "O",
                "ner": "O"
            },
            {
                "index": 3,
                "word": "vincenzo",
                "originalText": "vincenzo",
                "lemma": "vincenzo",
                "characterOffsetBegin": 10,
                "characterOffsetEnd": 18,
                "pos": "O",
                "ner": "NAME"
            },
            {
                "index": 4,
                "word": "monaco",
                "originalText": "monaco",
                "lemma": "monaco",
                "characterOffsetBegin": 19,
                "characterOffsetEnd": 25,
                "pos": "O",
                "ner": "NAME"
            }
        ]
    }
]

}

我读过一些关于将ner放在regexner之前的内容,但是从来没有改变过,正如你所看到的,并且同样颠倒了顺序。

EN

回答 1

Stack Overflow用户

发布于 2018-06-05 17:36:49

代码语言:javascript
复制
monaco\tperson\tcity

使您的regexner行类似于上面的行

并在您的属性文件中编写以下内容

Ner.fine.regexner.mapping=/自定义regexner文件的路径

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/49771004

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档