首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用JWI和Wordnet获取词干

使用JWI和Wordnet获取词干
EN

Stack Overflow用户
提问于 2012-07-06 20:25:18
回答 3查看 3.8K关注 0票数 4

如何正确使用麻省理工学院的JWI (Java API for WordNet)中实现的stemmer method来获取单词的词干?我不确定如何初始化词干分析器并使用findStems方法。

EN

回答 3

Stack Overflow用户

发布于 2014-04-16 00:25:32

你不需要额外的库,但是你需要一个字典。你可以从普林斯顿大学下载一个:https://wordnet.princeton.edu/wordnet/download/current-version/

我建议仅从“仅限WordNet 3.1数据库文件”一节下载字典解压归档文件。假设PATH/dict是输出的位置,您可以使用以下代码:

代码语言:javascript
复制
Dictionary dict = new Dictionary(new File("PATH/dict"));
dict.open();
WordnetStemmer stemmer = new WordnetStemmer(dict);

List<String> test = stemmer.findStems("feet", POS.NOUN);
for (int i = 0; i < test.size(); i++) {
    System.out.println(test.get(i));
}

这个例子的输出是"foot“。

票数 6
EN

Stack Overflow用户

发布于 2012-11-15 16:32:30

这是对sakthi答案的一种评论:你实际上必须精确地定位你正在寻找的POS (名词,形容词,动词等)。在调用findStems方法(JWI v2.2.3)时:http://projects.csail.mit.edu/jwi/api/edu/mit/jwi/morph/IStemmer.html

票数 1
EN

Stack Overflow用户

发布于 2012-10-17 01:38:24

使用的jar文件是edu.mit.jwi_2.1.4.jar和edu.susex.nlp.jws.beta.11.jar

代码语言:javascript
复制
JWS ws = new JWS("C:/Program Files/WordNet","2.1");  
WordnetStemmer stem =  new WordnetStemmer(ws.getDictionary());
System.out.println("test" + stem.findStems("reading") );
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11362168

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档