我正在使用斯坦福大学的核心nlp进行命名实体识别。我发现一个使用regexp和ner togheter的问题。
这是我的句子:
“我的名字是文森佐”的翻译
Ner正确地找到了"vincenzo monaco“作为"NAME”regexner找到了"monaco“就像一座城市
对于注释器{“http://localhost:9009/?properties=”:“ner,regexner","outputFormat":"json"}的请求的输出
{
"sentences": [
{
"index": 0,
"tokens": [
{
"index": 1,
"word": "mi",
"originalText": "mi",
"lemma": "mi",
"characterOffsetBegin": 0,
"characterOffsetEnd": 2,
"pos": "O",
"ner": "O"
},
{
"index": 2,
"word": "chiamo",
"originalText": "chiamo",
"lemma": "chiamo",
"characterOffsetBegin": 3,
"characterOffsetEnd": 9,
"pos": "O",
"ner": "O"
},
{
"index": 3,
"word": "vincenzo",
"originalText": "vincenzo",
"lemma": "vincenzo",
"characterOffsetBegin": 10,
"characterOffsetEnd": 18,
"pos": "O",
"ner": "NAME"
},
{
"index": 4,
"word": "monaco",
"originalText": "monaco",
"lemma": "monaco",
"characterOffsetBegin": 19,
"characterOffsetEnd": 25,
"pos": "O",
"ner": "CITY"
}
]
}
]}
如果我在http://localhost:9009/?properties={"annotators":"ner","outputFormat":"json"} (不带regexp)发出请求,它会正确回答:
{
"sentences": [
{
"index": 0,
"tokens": [
{
"index": 1,
"word": "mi",
"originalText": "mi",
"lemma": "mi",
"characterOffsetBegin": 0,
"characterOffsetEnd": 2,
"pos": "O",
"ner": "O"
},
{
"index": 2,
"word": "chiamo",
"originalText": "chiamo",
"lemma": "chiamo",
"characterOffsetBegin": 3,
"characterOffsetEnd": 9,
"pos": "O",
"ner": "O"
},
{
"index": 3,
"word": "vincenzo",
"originalText": "vincenzo",
"lemma": "vincenzo",
"characterOffsetBegin": 10,
"characterOffsetEnd": 18,
"pos": "O",
"ner": "NAME"
},
{
"index": 4,
"word": "monaco",
"originalText": "monaco",
"lemma": "monaco",
"characterOffsetBegin": 19,
"characterOffsetEnd": 25,
"pos": "O",
"ner": "NAME"
}
]
}
]}
我读过一些关于将ner放在regexner之前的内容,但是从来没有改变过,正如你所看到的,并且同样颠倒了顺序。
发布于 2018-06-05 17:36:49
monaco\tperson\tcity使您的regexner行类似于上面的行
并在您的属性文件中编写以下内容
Ner.fine.regexner.mapping=/自定义regexner文件的路径
https://stackoverflow.com/questions/49771004
复制相似问题