首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >有没有办法从Solr中的WhitespaceTokenizerFactory中删除最后一个令牌?

有没有办法从Solr中的WhitespaceTokenizerFactory中删除最后一个令牌?
EN

Stack Overflow用户
提问于 2017-07-22 02:25:37
回答 1查看 135关注 0票数 1

在索引分析器中,我使用WhitespaceTokenizerFactory进行标记。通常,字符串被分成两个标记,事实证明,我的分析器的其余步骤只适合第一个标记,而不是两个都适合。

有没有办法将第二个令牌从剩余的分析器中删除?

谢谢你的见解。

EN

回答 1

Stack Overflow用户

发布于 2017-07-23 00:15:25

我不熟悉任何允许您删除任意标记的过滤器(尽管它应该不是很难编写),但是您可以通过使用PatternReplaceCharFilter来解决它。

如果你有一个公共的分隔符(即一个空格/空白),你可以删除分隔符之后的任何东西,只留下第一个标记。如果您需要更高级的标记化,这将不起作用,但只要您将其表示为正则表达式,就应该可以。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45244404

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档