你好,我正在构建一个用于文本旋转的python程序。我读过关于GloVe,word2vec,doc2vec或text2vec的文章。我知道他们所做的就是把每个词表示成一个语义向量。
所以我想,如果我训练一个GloVe,我可以用它来寻找同义词,或者更多的东西?
编辑:我想出了一个策略:
你觉得怎么样?
发布于 2018-04-15 19:10:39
所以我想,如果我训练一个GloVe,我可以用它来寻找同义词,或者更多的东西?
如果要找到同义词,GloVe (向量)并不是完美的单词表示。由于GloVe向量是根据它们出现的上下文生成的(上下文意味着一个句子中的单词之前和后面的单词),您可能会发现反义词也会有类似的GloVe向量,因为它们也会出现在相同的上下文中。就像。
考虑一下在以下句子中使用的两个单词“好”和“坏”:
约翰是个好孩子,在战争中受伤了。约翰是个在战争中受伤的坏男孩。
在这里,“好”和“坏”这两个词出现在同一个上下文中。之前的上下文是"John is a“,后面的是”在战争中受伤的人“。
因此,他们的GloVe向量不会有很大的区别,当你旋转一个新单词时,你可能会完全改变你句子的意思。
为了解决上述问题,GloVe向量的一个很好的替代方案是“追溯拟合向量”。这是原始文章的链接。和这是实际向量的GitHub链接.,因为它们是为了语义相似性而学习的。我建议使用这些追溯拟合向量,因为你似乎对同义词的词汇替代感兴趣。
https://datascience.stackexchange.com/questions/12585
复制相似问题