我从https://code.google.com/archive/p/word2vec/获得了freebase-vectors skipgram1000 1000-en.bin.gz,然后将其重命名为freebase-vectors skipgram1000 1000-en.bin,并在我的代码中使用它
import gensim.models.keyedvectors as word2vec
gvc='freebase-vectors-skipgram1000-en.bin'
model=word2vec.KeyedVectors.load_word2vec_format(gvc,binary=True)它给出了这个错误
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte我将非常感谢在这个问题上的任何帮助。
发布于 2018-12-09 01:20:09
不要重命名您下载的内容,而是使用以下命令正确地将其解压:
$ gunzip -v freebase-vectors-skipgram1000-en.bin.gzhttps://stackoverflow.com/questions/53683918
复制相似问题