首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在Elasticsearch中根据最大词数对句子进行标记化?

如何在Elasticsearch中根据最大词数对句子进行标记化?
EN

Stack Overflow用户
提问于 2019-12-16 16:43:45
回答 2查看 63关注 0票数 1

我有一个字符串,比如“这是一个美丽的一天”,我应该使用什么分词器或者分词器和分词过滤器之间的什么组合来生成包含最多2个单词的输出?理想情况下,输出应该是:" This,This,is,a,漂亮的一天,“到目前为止,我已经尝试了所有内置的记号赋予器,' pattern‘记号赋予器似乎是我可以使用的,但是我不知道如何为我的情况编写正则表达式模式。有什么帮助吗?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-12-16 17:33:48

看起来你在找shingle token filter,它做的正是你想要的。

票数 1
EN

Stack Overflow用户

发布于 2019-12-16 18:32:04

正如@Oleksii所说的那样。在本例中,max_shingle_size =2(默认值),min_shingle_size = 1。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59353059

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档