对于如何将Doc2Vec(使用Gensim)用于IMDB情感分类数据集,我感到困惑。在对语料库进行训练后,得到了Doc2Vec嵌入,并利用该模型建立了Logistic回归模型。我如何使用它来为新的评论做预测?sklearn -以色列国防军有一种转换方法,可用于训练数据训练后的测试数据,其在Gensim Doc2Vec中的等效性是什么?
发布于 2019-12-27 17:27:22
您见过通过gensim-3.8.1将Doc2Vec应用于IMDB数据集的gensim源代码中包含的演示笔记本吗?
https://github.com/RaRe-Technologies/gensim/blob/3.8.1/docs/notebooks/doc2vec-IMDB.ipynb
发布于 2019-12-27 14:00:40
要获取未见文档的向量,请使用vector = model.infer_vector(["new", "document"]),然后将vector输入分类器:preds = clf.predict([vector])。
https://stackoverflow.com/questions/59501121
复制相似问题