我正在Python语言中使用gensim开发word2vec模型,但我发现结果是具有相同主题的单词,同义词只是结果的一部分。
我能根据我所做的工作找到一个单词的同义词吗?
任何回复都将不胜感激!
发布于 2017-06-12 11:44:46
Word2vec倾向于指示相似的单词-但正如您可能已经看到的那样,它学习到的相似性不仅仅包括纯粹的同义词。
例如,word2vec相似度包括出现在相似上下文中的单词,例如甚至包括对立面的备选单词。(毕竟,“热”和“冷”在许多方面都是非常相似的词--这两个形容词都主要与温度有关,也比喻地用于相同种类的非温度上下文中。只有在它们的对比中它们才是反义词。)
您可能需要使用其他技术(可能与word2vec配合使用)来发现纯同义词。
发布于 2021-11-18 02:10:56
import nltk
import gensim
nltk.download('word2vec_sample')
word2vec_sample = str(find('models/word2vec_sample/pruned.word2vec.txt'))
model = gensim.models.KeyedVectors.load_word2vec_format(word2vec_sample, binary=False)
top=model.most_similar(positive=['cricket'], topn = 3)
print(top)https://stackoverflow.com/questions/44386503
复制相似问题