正如gensim mailing list上建议/报告的那样，关键问题是仅仅在Phrases中包装语料库会导致迭代器只提供一次数据传递。Word2Vec模型需要一个语料库，它可以在语料库上进行多次遍历以进行词汇表发现，然后进行多次遍历训练。(如果密切关注信息级日志记录，应该有迹象表明，在这种情况下，“培训”几乎立即结束。)

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/43186733

复制

相似问题

问在2D中可视化Gensim短语的向量
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在2D中可视化Gensim短语的向量EN