文章/答案/技术大牛

发布

社区首页 >问答首页 >如何从Wordnet获取同义词的出现概率排序

问如何从Wordnet获取同义词的出现概率排序
EN

Stack Overflow用户

提问于 2010-07-13 05:16:45

回答 2查看 2K关注 0票数 3

我在Wordnet中搜索一大串单词的同义词。按照我的做法，当某个单词有多个同义词时，结果会按字母顺序返回。我需要的是让他们按照发生的概率排序，我只取前1的同义词。

我使用prolog数据库和Syns2Index将其转换为Lucene类型索引，以查询同义词。有没有办法让他们按照自己的概率来排序，还是我应该用另一种方法？

速度不重要，这个同义词查找不会在网上完成。

wordnet

java

nlp

回答 2

Stack Overflow用户

发布于 2010-07-27 21:01:23

如果有人无意中发现了这条线索，这就是我要走的路(至少是我需要的)：

http://lyle.smu.edu/~tspell/jaws/doc/edu/smu/tspell/wordnet/impl/file/ReferenceSynset.html#getTagCount%28java.lang.String%29

tagCount方法为每个单词提供最有可能的synset组。同样的问题是，同步器与高概率的同步又会有几个单词。但我想没有机会避免这件事

票数 5

Stack Overflow用户

发布于 2010-07-13 07:53:32

我认为你应该再走一步(只要速度不重要)。

在Lucene索引中，您应该构建另一个字典，其中每个单词都映射到一个小对象，该对象包含它的唯一同义词，该同义词的出现概率、词义和出现概率都较高。也就是说，考虑到这个密码：

class Synonym {
public:
    String name;
    double probability;
    String meaning;
}

Map<String, Synonym> m = new HashMap<String, Synonym>();

..。你只需要用Lucene指数来填充它。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/3234371

复制

相似问题

问如何从Wordnet获取同义词的出现概率排序
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何从Wordnet获取同义词的出现概率排序EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何从Wordnet获取同义词的出现概率排序
EN