我希望使用GloVe为文档构造word嵌入。我知道如何获得单个单词(单字)的向量嵌入,如下所示(例如文本文档)。
$ git clone http://github.com/stanfordnlp/glove
$ cd glove && make
$ ./demo.sh现在,我想为bigram获取向量嵌入。例如;
在GloVe中可以做吗?如果是,怎么做?
发布于 2017-10-25 13:01:55
我不认为他们有可用的双标载体,但是你可以通过预处理一个语料库来自己制作它们。例如,如果您的语料库中的文档如下所示:
GloVe is love您可以将其格式化如下:
START_GloVe GloVe_is is_love love_END并像往常一样在这个语料库上训练一组嵌入。您也可以看看Word2vec,就像this post中类似的。
https://stackoverflow.com/questions/46914400
复制相似问题