首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >gensim word2vec给出不一致的结果

gensim word2vec给出不一致的结果
EN

Stack Overflow用户
提问于 2016-03-28 21:41:49
回答 1查看 813关注 0票数 1

版本为0.12.4。我的word2vec模型不一致。每次我基于相同的句子和相同的参数构建模型时,它仍然有不同的单词表示。

这是代码(我从最初的帖子中偷来的)

代码语言:javascript
复制
>>> from nltk.corpus import brown
>>> from gensim.models import Word2Vec
>>> sentences = brown.sents()[:100]
>>> model = Word2Vec(sentences, size=10, window=5, min_count=5, workers=4)
>>> model[sentences[0][0]]
array([ 0.04913874,  0.04574081, -0.07402877, -0.03270053,  0.06598952,
        0.04157289,  0.05075986,  0.01770534, -0.03796235,  0.04594197], dtype=float32)
>>> model = Word2Vec(sentences, size=10, window=5, min_count=5, workers=4)
>>> model[sentences[0][0]]
array([ 0.04907205,  0.04569579, -0.07379777, -0.03273782,  0.06579078,
        0.04167712,  0.05083019,  0.01780009, -0.0378389 ,  0.04578455], dtype=float32)
>>> model = Word2Vec(sentences, size=10, window=5, min_count=5, workers=4)
>>> model[sentences[0][0]]
array([ 0.04906179,  0.04569826, -0.07382379, -0.03274316,  0.06583244,
        0.04166647,  0.0508585 ,  0.01777468, -0.03784611,  0.04578935], dtype=float32)

我也试着给一些固定的int设置种子,但这似乎没有帮助。我也尝试重新安装gensim,但也没有帮助。

你知道怎么稳定我的模型吗??

EN

回答 1

Stack Overflow用户

发布于 2017-03-22 18:38:11

尝试按照此处的说明设置PYTHONHASHSEED环境变量https://github.com/gojomo/gensim/blob/develop/gensim/models/doc2vec.py#L566

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36263594

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档