我开始处理WSD和WordNet,并试图找出它们输出不同结果的原因。我在使用以下代码时的理解是,消歧命令指定最有可能的Synset:
from pywsd import disambiguate
from nltk.corpus import wordnet as wn
mysent = 'I went to have a drink in a bar'
wsd = disambiguate(mysent)这给了我下面的输出
('I', None)
('went', Synset('travel.v.01'))
('to', None)
('have', None)
('a', None)
('drink', Synset('swallow.n.02'))
('in', None)
('a', None)
('bar', Synset('barroom.n.01'))因此,我觉得奇怪的是,当在WordNet中查找这个词时,我得到了四种可能的解释之一。当然,“我”至少应该对应其中的一个?
wordnet.synsets('I')
Out:
[Synset('iodine.n.01'), Synset('one.n.01'), Synset('i.n.03'), Synset('one.s.01')]发布于 2019-10-23 11:48:11
在你上面的句子中,I是代词。wordnet常见问题指出:
问:为什么WordNet不存在: of,an,the,and,约,of,WordNet等。A: WordNet只包含“公开类单词”:名词、动词、形容词和副词。因此,排除词包括限定词、介词、代词、连词和助词。
https://stackoverflow.com/questions/58506951
复制相似问题