首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用智能中文分析进行弹性搜索?

如何使用智能中文分析进行弹性搜索?
EN

Stack Overflow用户
提问于 2014-09-28 16:31:50
回答 1查看 6K关注 0票数 3

我已经在ES集群上安装了,但是我没有找到关于如何指定正确的分析器的文档。我只需要设置一个标记器和一个过滤器来指定停止词和词干器.

例如在荷兰语中:

代码语言:javascript
复制
"dutch": {
            "type": "custom",
            "tokenizer": "uax_url_email",
            "filter": ["lowercase", "asciifolding", "dutch_stemmer_filter", "dutch_stop_filter"]
          }

with:

"dutch_stemmer_filter": {
            "type": "stemmer",
            "name": "dutch"
          },

          "dutch_stop_filter": {
            "type": "stop",
            "stopwords": ["_dutch_"]
          }

如何配置我的中文分析器?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-09-29 22:12:06

对特定的索引(分析器为'smartcn‘,令牌程序为’smartcn_tokenizer‘)尝试这样做:

代码语言:javascript
复制
PUT /test_chinese
{
  "settings": {
    "index": {
      "analysis": {
        "analyzer": {
          "default": {
            "type": "smartcn"
          }
        }
      }
    }
  }
}

GET /test_chinese/_analyze?text='叻出色'

它应该输出两个令牌(来自插件测试类的测试):

代码语言:javascript
复制
{
   "tokens": [
      {
         "token": "叻",
         "start_offset": 1,
         "end_offset": 2,
         "type": "word",
         "position": 2
      },
      {
         "token": "出色",
         "start_offset": 2,
         "end_offset": 4,
         "type": "word",
         "position": 3
      }
   ]
}
票数 8
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26087072

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档