我是GloVe的新手。我在他们的网站上成功地运行了他们的demo.sh。在运行演示之后,我得到了一些文件,如vocab、vectors等,但是它们没有任何文档或任何东西来描述我们需要使用哪些文件,以及如何使用这些文件来查找最相似的单词。
因此,请帮助我找到GloVe中给出的最相似的单词(使用余弦相似度)?(例如,类似于Gensim word2vec中的word2vec)
请帮帮我!
发布于 2017-11-21 08:54:23
单词向量是如何生成的并不重要,你总是可以计算单词之间的余弦相似度。实现您所要求的目标的最简单方法是(考虑到您有gensim):
python -m gensim.scripts.glove2word2vec –input <GloVe vector file> –output <Word2vec vector file>这将把手套矢量文件转换成w2v格式。您也可以手动完成此操作--只需在GloVe文件中添加额外的一行,其中包含向量的总数及其在文件顶部的维度。它看上去有点像:
180000 300
<The rest of your file>在此之后,您只需将文件加载到gensim中,一切都会正常工作,就好像它是一个常规的w2v模型。
https://stackoverflow.com/questions/47365480
复制相似问题