是否可以将path_hierarchy标记器与其中包含空格的路径一起使用,并让它只根据分隔符而不是空格来创建标记?例如,
“/机场/机库1”
将被标记为
“机场”,“一号机库”
不
“机场”,“机库”,"1"?
发布于 2013-03-24 11:16:59
path_hierarchy标记器可以很好地处理包含空格的路径:
curl "localhost:9200/_analyze?tokenizer=path_hierarchy&pretty=true" -d "/airport/hangar 1"
{
"tokens" : [ {
"token" : "/airport",
"start_offset" : 0,
"end_offset" : 8,
"type" : "word",
"position" : 1
}, {
"token" : "/airport/hangar 1",
"start_offset" : 0,
"end_offset" : 17,
"type" : "word",
"position" : 1
} ]
}但是,根据您的示例,您可能需要改用pattern标记器。
https://stackoverflow.com/questions/15594749
复制相似问题