首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在TERRIER信息检索系统中如何使用YASS或GRAS等统计词干代替Porter词干

在TERRIER信息检索系统中如何使用YASS或GRAS等统计词干代替Porter词干
EN

Stack Overflow用户
提问于 2015-09-15 14:12:30
回答 1查看 193关注 0票数 1

Terrier IR系统默认使用Porter Stemmer。我们如何在Terrier中使用统计词干分析器输出?我已经使用统计词干分析器生成了词干列表,并希望将其嵌入到TERRIER IR中。

EN

回答 1

Stack Overflow用户

发布于 2015-11-19 01:13:56

您必须创建一个类,将StemmerTermPipeline扩展到org.terrier.terms包中。

例如:

公共类StatisticalStemmer扩展了StemmerTermPipeline {

代码语言:javascript
复制
public StatisticalStemmer(TermPipeline next) {
    super(next);
}

@Override
public String stem(String word) {
   // your method implementation
}

}

然后,您需要重新编译核心组件并替换lib目录中的terrier-4.0-core.jar文件。

最后,您需要在属性文件中更新术语Pipeline:

termpipelines=Stopwords,StatisticalStemmer

通过这种方式,Terrier将使用您的词干分析器来代替PorterStemmer。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32578889

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档