首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >主题建模中的LSA、LDA或NMF?

主题建模中的LSA、LDA或NMF?
EN

Data Science用户
提问于 2020-06-19 14:08:45
回答 2查看 1.9K关注 0票数 2

我正试图通过Python & NLP实现主题建模,但无法确定我应该使用哪种算法。我研究过潜在语义分析(LSA)、潜在Dirichlet分配(LDA)和非负矩阵因式分解(NMF),但是如何确定哪一种算法最适合于特定任务?如果我只是连续地尝试所有这些,那么如何衡量结果呢?

EN

回答 2

Data Science用户

发布于 2020-06-20 00:30:28

据我所知,LDA是最先进的主题建模方法,但我并没有非常密切地关注这个领域。所以我想说使用LDA是非常安全的,我猜不同的方法可能会给出类似的结果。

如果您想尝试不同的方法,评估主题模型的问题是相当复杂的。这篇文章可能会有帮助。

附带注意:有一个名为递阶Dirichlet过程的非参数变量(不需要选择主题数量)。

票数 1
EN

Data Science用户

发布于 2020-12-30 14:59:55

因为这三种算法都有Python的标准实现,所以您应该尝试这三种方法。

评估主题建模的最佳方法之一是随机抽样主题并查看它们是否“有意义”。手动检查哪些文档在哪个集群中是一个很好的方法,可以查看主题建模是否在做您想做的事情。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/76298

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档