首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Lucene 4.0+中的词干+停止词过滤

Lucene 4.0+中的词干+停止词过滤
EN

Stack Overflow用户
提问于 2013-08-30 08:56:35
回答 1查看 856关注 0票数 0

我曾使用SnowBallAnalyzer将自定义停用词过滤与基本词干组合在一起,但它已被弃用。例如,在索引配置中,我可以很容易地指定:

代码语言:javascript
复制
IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_32,
                new SnowballAnalyzer(Version.LUCENE_32, "name", stopSet));

其中stopSet是我的自定义停用词列表。

我现在如何创建一个分析器,使我能够过滤停用的单词并进行基本的英语词干分析?

谢谢。

EN

回答 1

Stack Overflow用户

发布于 2013-08-30 23:54:13

使用EnglishAnalyzer

代码语言:javascript
复制
new EnglishAnalyzer(Version.LUCENE_32, stopSet)

如果您没有将有效的词干分析器名称传递到SnowballAnalyzer构造函数中,我对您列出的代码如何做一些特别有用的事情感到有点困惑。似乎它应该在这里抛出一个异常:

代码语言:javascript
复制
 Class<?> stemClass = Class.forName("org.tartarus.snowball.ext." + name + "Stemmer");

因为没有名为"org.tartarus.snowball.ext.nameStemmer“的词干分析器。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/18523273

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档