我需要帮助索引和搜索英文文本使用Java Lucene通过谷歌应用程序引擎。到目前为止,我找到的唯一解决方案是SnowballAnalyzer (在contrib包中),但它只支持Lucene 3.0,而GAELucene只支持lucene 2.3.1。仅仅更换jars并不能真正起作用。
有人能帮我用英文词干分析器给我的文本建立索引吗?
发布于 2010-01-10 04:48:43
SnowballAnalyzer已经伴随Lucene很长一段时间了,包括2.x版本(参见2.4.1API文档中的its entry )。
奇怪的是,它并不是标准Lucene发行版的一部分,即使在文档中也是如此。您必须找到用于2.3.1的contrib包的一个版本。
编辑:看起来有一个副本here。
发布于 2010-01-10 07:52:50
PorterStemFilter位于lucene内核中。它可以与StandardAnalyzer一起用于英语词干分析。
发布于 2010-01-10 05:44:15
许多公司还出售在Snowball解释器中实现的Porter词干分析器的更复杂和/或更快的替代品。如果你在这方面有需求,请发表评论,我会详细说明,但我不想被指责为不合理的广告,所以我现在就把它留在那里。
https://stackoverflow.com/questions/2034815
复制相似问题