我的问题与这篇名为Document topical distribution in Gensim LDA的文章有关,gensim.models.ldamodel的文档指出"minimum_probability控制过滤为文档(Bow)返回的主题。“然而,ldamodelcorpus返回所有可能的主题及其概率(甚至低于minimum_probability中设置的数字)。这两者之间的区别是什么?python 2.7.5 gensim 0.13.3
谢谢
发布于 2017-09-13 21:08:13
我对the documentation的理解是,minimum_probability既可以是模型生成的参数(应用于之后的所有查询),也可以是查询接口,例如get_document_topics(bow, minimum_probability=None, ....)。因此,除非您使用minimum_probability参数进行训练,否则model[doc_bow]不会对概率进行修剪。
https://stackoverflow.com/questions/40660127
复制相似问题