首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我可以自定义Elastic Search来使用我自己的停用词列表吗?

我可以自定义Elastic Search来使用我自己的停用词列表吗?
EN

Stack Overflow用户
提问于 2011-02-08 06:54:33
回答 4查看 7.6K关注 0票数 11

具体地说,我希望在没有停用词列表的情况下索引所有内容(例如,谁)。弹性搜索是否足够灵活,是否足够容易更改?

EN

回答 4

Stack Overflow用户

发布于 2011-06-17 17:33:16

默认情况下,elasticsearch使用的分析器是一个带有默认Lucene英语停用词的standard analyzer。通过将以下内容添加到elasticsearch.yml文件中,我已经将elasticsearch配置为使用相同的分析器,但不使用停止词。

代码语言:javascript
复制
# Index Settings
index:
  analysis:
    analyzer:
      # set standard analyzer with no stop words as the default for both indexing and searching
      default:
        type: standard
        stopwords: _none_
票数 17
EN

Stack Overflow用户

发布于 2011-02-12 19:32:08

可以,您可以使用ElasticSearch的内部配置YAML文件来完成此操作。

有关如何更改分析器设置的信息,请参阅config docs

票数 4
EN

Stack Overflow用户

发布于 2012-10-22 21:25:53

您可以全局覆盖默认分析器,并通过将以下行添加到中来关闭停止字过滤器

代码语言:javascript
复制
index.analysis.analyzer.default:
  type: custom
  tokenizer: standard
  filter: standard, lowercase

这将创建一个带有标准标记器和两个筛选器的自定义分析器:标准和小写。这样,您的自定义分析器将与标准分析器相同,但它不会使用停止字过滤器。因为它被命名为"default",所以elasticsearch将在没有显式设置分析器的任何地方使用它。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/4927629

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档