我正在考虑使用层次化的dirichlet过程来建模专利数据集。我已经看到HDP使用基本发行版,并假设每个主题都来自该基本发行版。
问题是:首先,我想知道HDP过程的主要结果是什么(在LDA的情况下,我们得到了两个矩阵,可以用来构造字云和图,但在这种情况下,我不确定结果),确切的过程是什么?
发布于 2020-11-08 11:34:34
Ist博士只是一个贝叶斯变量,它概括了LDA。
请参阅这里
基本上,在bayesian设置中,您不需要参数,但是您可以从数据中推断它们。使用相同的dirichlet生成过程逻辑,可以对分组数据进行聚类。
https://datascience.stackexchange.com/questions/85083
复制相似问题