我同时使用sklearn和gensim应用了lda。然后,我检查了保留的数据的困惑。
对于gensim的困惑,我得到了负值,对于sklearn,我得到了正值。如何比较这些值。
sklearn困惑= 417185.466838
gensim困惑= -9212485.38144
发布于 2016-11-16 01:52:49
为了比较困惑,您需要使用np.exp(-1. * gensim_model.log_perplexity(train_corpus))转换gensim的困惑。
有关Gensim和Sklearn LDA实现的一般比较,请参阅here。
https://stackoverflow.com/questions/40524768
复制相似问题