文章/答案/技术大牛

发布

社区首页 >问答首页 >Elasticsearch -使用Python对具有不同分析器的单个字段进行重新索引

问Elasticsearch -使用Python对具有不同分析器的单个字段进行重新索引
EN

Stack Overflow用户

提问于 2020-03-02 04:50:57

回答 1查看 401关注 0票数 0

我在elasticsearch中使用动态映射将json文件加载到elasticsearch中，如下所示：

es = Elasticsearch([{'host': 'localhost', 'port': 9200}])

def extract():
    f = open('tmdb.json')
    if f:
        return json.loads(f.read())

movieDict = extract()

def index(movieDict={}):

    for id, body in movieDict.items():
        es.index(index='tmdb', id=id, doc_type='movie', body=body)

index(movieDict)

如何更新单个字段的映射？我有字段title，我想要添加不同的分析器。

title_settings = {"properties" : { "title": {"type" : "text", "analyzer": "english"}}}
es.indices.put_mapping(index='tmdb', body=title_settings)

此操作失败。

我知道我不能更新已经存在的索引，但是什么是重新索引从json文件生成的映射的正确方法呢？我的文件有很多字段，手动创建映射/设置会非常麻烦。

我可以为查询指定分析器，如下所示：

query = {"query": {
            "multi_match": {
                "query": userSearch, "analyzer":"english", "fields": ['title^10', 'overview']}}}

如何为索引或字段指定它？

我还可以在关闭和打开索引后将分析器设置为

analysis = {'settings': {'analysis': {'analyzer': 'english'}}}
es.indices.close(index='tmdb')
es.indices.put_settings(index='tmdb', body=analysis)
es.indices.open(index='tmdb')

复制英语分析器的精确设置并不能“激活”我的数据。

https://www.elastic.co/guide/en/elasticsearch/reference/7.6/analysis-lang-analyzer.html#english-analyzer

我的意思是，搜索不是以英语分析器ie处理的形式返回的。仍然有一些停顿的词。

python

elasticsearch

elasticsearch-analyzers

回答 1

Stack Overflow用户

发布于 2020-03-03 05:58:48

通过大量的谷歌搜索解决了这个问题...

您不能更改已索引数据的分析器。这包括索引的打开/关闭。您可以指定新的索引，创建新的映射和加载您的数据(最快的way)
Specifying分析器为整个索引不是很好的解决方案，因为‘英语’分析器是特定于‘文本’字段。最好是按字段指定分析器。
如果分析器是按字段指定的，您还需要指定类型。
您需要记住，分析器使用时可以在/或索引和搜索时使用。参考Specifying analyzers

代码：

def create_index(movieDict={}, mapping={}):
    es.indices.create(index='test_index', body=mapping)

    start  = time.time()
    for id, body in movieDict.items():
        es.index(index='test_index', id=id, doc_type='movie', body=body)
    print("--- %s seconds ---" % (time.time() - start))

现在，我已经从json文件的动态映射中获得了mapping。我只是将其保存回json文件，以便于处理(编辑)。这是因为我有40多个字段要映射，手工完成会很累人。

mapping = es.indices.get_mapping(index='tmdb')

这是如何指定title密钥以使用english分析器的示例

'title': {'type': 'text', 'analyzer': 'english','fields': {'keyword': {'type': 'keyword', 'ignore_above': 256}}}

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60479644

复制

相似问题

问Elasticsearch -使用Python对具有不同分析器的单个字段进行重新索引
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Elasticsearch -使用Python对具有不同分析器的单个字段进行重新索引EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Elasticsearch -使用Python对具有不同分析器的单个字段进行重新索引
EN