首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用GloVe获取最相似的单词

使用GloVe获取最相似的单词
EN

Stack Overflow用户
提问于 2017-11-18 11:25:19
回答 1查看 2.7K关注 0票数 1

我是GloVe的新手。我在他们的网站上成功地运行了他们的demo.sh。在运行演示之后,我得到了一些文件,如vocabvectors等,但是它们没有任何文档或任何东西来描述我们需要使用哪些文件,以及如何使用这些文件来查找最相似的单词。

因此,请帮助我找到GloVe中给出的最相似的单词(使用余弦相似度)?(例如,类似于Gensim word2vec中的word2vec)

请帮帮我!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-11-21 08:54:23

单词向量是如何生成的并不重要,你总是可以计算单词之间的余弦相似度。实现您所要求的目标的最简单方法是(考虑到您有gensim):

代码语言:javascript
复制
python -m gensim.scripts.glove2word2vec –input <GloVe vector file> –output <Word2vec vector file>

这将把手套矢量文件转换成w2v格式。您也可以手动完成此操作--只需在GloVe文件中添加额外的一行,其中包含向量的总数及其在文件顶部的维度。它看上去有点像:

代码语言:javascript
复制
180000 300
<The rest of your file>

在此之后,您只需将文件加载到gensim中,一切都会正常工作,就好像它是一个常规的w2v模型。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47365480

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档