首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在wordnet中获取祖父母上位词的所有孙子全称

在wordnet中获取祖父母上位词的所有孙子全称
EN

Stack Overflow用户
提问于 2014-06-14 15:46:53
回答 2查看 375关注 0票数 0

我想为一个单词创建一组替代单词。替代的单词必须适当地不同,以便将'dog‘替换为'dalmatian’过于相似--我想将'dog‘替换为'cat’。虽然不是万无一失,但我认为我可以通过获取一个单词的上位词和十个那个上位词的上位词(即祖父母同义词集),最终获得该祖父母的所有孙子单词。

希望这是有意义的。在伪代码中,它应该读作

代码语言:javascript
复制
for each i as hypernym (synset)
     for each j as i.hypernym
         get all the holonyms for j as s
              for each s get all the holonyms as x
                 print x

这可行吗?

EN

回答 2

Stack Overflow用户

发布于 2014-06-28 02:16:07

代码语言:javascript
复制
from itertools import chain
from collections import defaultdict
from nltk.corpus import wordnet as wn


gflemma_holonym = defaultdict(set)
for ss in wn.all_synsets():
    if ss.part_holonyms() and ss.hypernyms() and ss.hypernyms()[0].hypernyms():
        grandfather = ss.hypernyms()[0].hypernyms()[0] # grandfather concept.
        holonyms = list(chain(*[i.lemma_names() for i in ss.part_holonyms()]))
        for lemma in grandfather.lemma_names():
            gflemma_holonym[lemma].update(holonyms)


print gflemma_holonym[u'edible_nut']
print
print gflemma_holonym[u'geographical_area']

输出

代码语言:javascript
复制
set([u'black_hickory', u'black_walnut', u'Juglans_nigra', u'black_walnut_tree'])

set([u'battlefield', u'fair', u'infield', u'field_of_honor', u'field_of_battle', u'battleground', u'city', u'bowl', u'field', u'stadium', u'funfair', u'outfield', u'diamond', u'urban_area', u'populated_area', u'desert', u'arena', u'carnival', u'baseball_diamond', u'sports_stadium', u'ball_field', u'baseball_field'])

请注意wordnet库存是有限的。尤其是当你在寻找概念/引理的关系时(例如,从同义词集的祖父到同义词集的全义词)

票数 2
EN

Stack Overflow用户

发布于 2014-06-14 21:37:48

您可以使用以太列表或字典来完成此操作(字典更具pythonic风格)。以dictionnary为例,如下所示:

代码语言:javascript
复制
dictionnary={"dog": {"dalmatian","stuff"}, "singer": {"rihanna","eminem"}, "country": {"United states","England"}} 
print(dictionnary['dog'])
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24217776

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档