首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在elasticsearch的设置中声明多个令牌程序

如何在elasticsearch的设置中声明多个令牌程序
EN

Stack Overflow用户
提问于 2017-02-28 15:48:28
回答 1查看 706关注 0票数 1

我希望创建一个具有属性的搜索索引,该属性的结果按以下顺序排列:

  1. 首先,所有以搜索词开头的结果
  2. 然后,包含搜索项的所有结果

因此,我想使用https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-edgengram-tokenizer.html

但是我的索引设置中已经有了一个标记程序kuromoji_tokenizer

那么,我如何在设置中添加另一个令牌程序(稍后在分析器中使用),这样我就可以实现上面的scneario了?

因此,例如,在下面的json中,我可以将另一个子元素添加到tokenzier或者tokenzier需要是一个数组吗?

代码语言:javascript
复制
"settings": {
    "analysis": {
      "analyzer": {
        "autocomplete": {
          "tokenizer": "autocomplete",
          "filter": [
            "lowercase"
          ]
        },
        "autocomplete_search": {
          "tokenizer": "lowercase"
        }
      },
      "tokenizer": {
        "autocomplete": {
          "type": "edge_ngram",
          "min_gram": 2,
          "max_gram": 10,
          "token_chars": [
            "letter"
          ]
        }
      }
    }
  }
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-02-28 16:21:20

我相信你可以的,是的。只需将其添加到第一个数组的旁边,不要创建一个数组,只需给它另一个名称(在我的示例中,我称之为"my_other_tokenizer"):

代码语言:javascript
复制
"settings": {
    "analysis": {
      "analyzer": {
        "autocomplete": {
          "tokenizer": "autocomplete",
          "filter": [
            "lowercase"
          ]
        },
        "autocomplete_search": {
          "tokenizer": "lowercase"
        }
      },
      "tokenizer": {
        "autocomplete": {
          "type": "edge_ngram",
          "min_gram": 2,
          "max_gram": 10,
          "token_chars": [
            "letter"
          ]
        },
        "my_other_tokenizer": {
          "type": "kuromoji_tokenizer",
          "mode": "extended",
          "discard_punctuation": "false",
          "user_dictionary": "userdict_ja.txt"
        }
      }
    }
  }

然后,只需在分析器设置中使用它,就像对第一个令牌程序一样。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/42513145

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档