首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用GloVe进行文本旋转?

如何使用GloVe进行文本旋转?
EN

Data Science用户
提问于 2016-07-04 11:11:42
回答 1查看 926关注 0票数 3

你好,我正在构建一个用于文本旋转的python程序。我读过关于GloVe,word2vec,doc2vec或text2vec的文章。我知道他们所做的就是把每个词表示成一个语义向量。

所以我想,如果我训练一个GloVe,我可以用它来寻找同义词,或者更多的东西?

编辑:我想出了一个策略:

  1. 首先,我训练一个doc2vec模型。目标是建立词组的语义向量。
  2. 然后我使用我原来的段落输入。逐字逐句地用同义词(由nltk或其他同义词db提供)随机更改它。最后,在旋转一个单词之前,我计算更改段落的doc2vec,并计算原始段落矢量化的距离。只有当距离很小时,我才会改变同义词。

你觉得怎么样?

EN

回答 1

Data Science用户

发布于 2018-04-15 19:10:39

所以我想,如果我训练一个GloVe,我可以用它来寻找同义词,或者更多的东西?

如果要找到同义词,GloVe (向量)并不是完美的单词表示。由于GloVe向量是根据它们出现的上下文生成的(上下文意味着一个句子中的单词之前和后面的单词),您可能会发现反义词也会有类似的GloVe向量,因为它们也会出现在相同的上下文中。就像。

考虑一下在以下句子中使用的两个单词“好”和“坏”:

约翰是个好孩子,在战争中受伤了。约翰是个在战争中受伤的坏男孩。

在这里,“好”和“坏”这两个词出现在同一个上下文中。之前的上下文是"John is a“,后面的是”在战争中受伤的人“。

因此,他们的GloVe向量不会有很大的区别,当你旋转一个新单词时,你可能会完全改变你句子的意思。

为了解决上述问题,GloVe向量的一个很好的替代方案是“追溯拟合向量”。这是原始文章的链接。这是实际向量的GitHub链接.,因为它们是为了语义相似性而学习的。我建议使用这些追溯拟合向量,因为你似乎对同义词的词汇替代感兴趣。

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/12585

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档