文章/答案/技术大牛

发布

社区首页 >问答首页 >无topicDistributions(..)ml.clustering.LocalLDAModel中的方法

问无topicDistributions(..)ml.clustering.LocalLDAModel中的方法
EN

Stack Overflow用户

提问于 2017-02-08 21:04:26

回答 1查看 145关注 0票数 1

我正在使用org.apache.spark.ml.clustering.LDA进行主题建模(通过在线优化器)，它返回org.apache.spark.ml.clustering.LocalLDAModel。然而，使用这种模型似乎没有任何方法来获得文档上的主题分布。而较早的mllib应用程序接口(org.apache.spark.mllib.clustering.LocalLDAModel )确实有这样的方法，即org.apache.spark.mllib.clustering.LocalLDAModel.topicDistributions(..)

我不知道为什么会这样。特别是，考虑到新的ml.LDA使用旧的mllib.LDA，并将旧的mllib.LocalLDAModel本身包装在新的ml.LocalLDAModel中。

那么，有没有人可以澄清一下: 1.为什么会这样? 2.在新的ml.LocalLDAModel中获得主题分布的正确方法是什么

另外，我总是可以修改spark代码来暴露旧的API，但我不确定为什么它一开始就被隐藏了。

apache-spark-2.0

apache-spark

apache-spark-mllib

apache-spark-ml

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-04-04 21:20:41

考虑一下ldaModel.transform(dataset)，它用一个额外的列topicDistribution扩展了您的数据集，您可以在其中获得所需的内容(dataset是您传递给LDAModel实例的fit()方法的数据集。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/42113963

复制

相似问题

问无topicDistributions(..)ml.clustering.LocalLDAModel中的方法
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问无topicDistributions(..)ml.clustering.LocalLDAModel中的方法EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问无topicDistributions(..)ml.clustering.LocalLDAModel中的方法
EN