我正在使用topicmodels包运行LDA。
lda.model = LDA(dtm, k,control = list(em = list(iter.max = 1000, tol = 10^-4)))
apps.terms<-terms(lda.model,15)
head(apps.terms)
Topic.1 Topic.2 Topic.3 Topic.4 Topic.5
1 38 55 187 38 38
2 40 38 171 40 35
3 55 35 178 56 44
4 49 49 74 35 55
5 35 44 177 190 52
6 44 53 80 55 49这些代码按照它们的比例对15个术语进行排序。如果我不是很了解LDA算法的话。每个主题都是在terms.So上的分布,我想知道这些术语的确切分布。例如。主题1与38相关的比例为30%,与40 ..etc相关的比例为20%。有没有办法通过使用topicmodels包来获取?
发布于 2016-01-01 03:12:28
听起来你想要每个文档的后验概率。
lda.inf <- posterior(lda.model,dtm)https://stackoverflow.com/questions/31959456
复制相似问题