首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何定义参数,lda算法的最佳解?

如何定义参数,lda算法的最佳解?
EN

Stack Overflow用户
提问于 2019-08-18 07:21:59
回答 1查看 127关注 0票数 1

利用lda主题分析,如何能够对lda算法的性能进行度量?

代码语言:javascript
复制
 library(topicmodels)
    # parameters for Gibbs sampling
    burnin <- 4000
    iter <- 2000
    thin <- 500
    seed <-list(1969,5,25,102855,2012)
    nstart <- 5
    best <- TRUE
    #Number of topics
    k <- 10
library(topicmodels)
data("AssociatedPress", package = "topicmodels")



    #Run LDA with Gibbs
    ldaOut <-LDA(AssociatedPress[1:20,], k, method="Gibbs", control=list(nstart=nstart, seed = seed, best = best, burnin =
    burnin, iter = iter, thin=thin)) 

例如,是否有任何类型的精确性、召回或F-度量?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-08-18 08:50:46

请注意,LDA是一种无监督的学习算法,因此不可能获得像F1分数或准确性这样的度量,因为我们无法将它与真正的标签进行比较。因此,通常通过比较概率模型在训练过程中的分布和测试集的对数似然度来评估算法的性能。

最常见的监测LDA性能的指标是困惑和。该模型具有较高的对数似然性和较低的困惑度,是一种较好的模型.

topicmodels库中,您可以找到perplexitylogLik函数来提取这两个度量。在您的例子中,它将类似于:

代码语言:javascript
复制
perplexity(ldaOut, newdata = AssociatedPress[1:20,]) 

对于计算logLik,您需要从合适的模型中传递Gibs列表,请看这里的文档(pg8):https://cran.r-project.org/web/packages/topicmodels/topicmodels.pdf

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57542504

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档