我有一组用神经网络训练的嵌入,与gensim的word2vec无关。
我想使用这些嵌入作为gensim.Word2vec中的初始权重。
现在我看到的是,我可以model.load(SOME_MODEL),然后继续训练,但它需要一个gensim模型作为输入。此外,reset_from()似乎只接受其他gensim模型。但是在我的例子中,我没有一个gensim模型,而是一个嵌入的word2vec格式的文本文件。
那么,如何开始将学习从word2vec文本文件迁移到gensim.Word2vec呢
发布于 2017-12-24 22:55:48
您可以使用原始Word2Vec模型的键向量格式加载其他模型
import io
from gensim.models.keyedvectors import KeyedVectors
# first line is vocab size and vector dim
model_buf = io.StringIO("""
2 3
word0 -0.000737 -0.002106 0.001851
word1 -0.000878 -0.002106 0.002834
""".lstrip())
model = KeyedVectors.load_word2vec_format(model_buf, binary=False)
model['word0']https://stackoverflow.com/questions/47959639
复制相似问题