首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >R中的Mclust :如何输出集群中心

R中的Mclust :如何输出集群中心
EN

Stack Overflow用户
提问于 2018-03-06 16:49:11
回答 2查看 478关注 0票数 0

我目前正在使用RStudio在支持票据上进行文本挖掘,根据它们的描述对它们进行聚类(freetext)。为此,我将kmeans与EM算法进行了比较。我用tm包准备了数据,现在我尝试将聚类算法应用于数据矩阵。

使用kmeans()函数,我可以使用以下代码片段输出文本集群中最常用的5个术语(kmeans21):

代码语言:javascript
复制
> for (i in 1:num_cluster) {
     cat(paste("cluster ", i, ": ", sep = ""))
     s <- sort(kmeans21$centers[i, ], decreasing = T)
     cat(names(s)[1:5], "\n")
 }

到目前为止,我还找不到一个函数来在mclust包中做同样的事情。我的数据格式如下:

代码语言:javascript
复制
> bic21 <- MclustBIC(m1, G=21)
> emmodel21 <- summary(bic21, data = m1)

使用命令

代码语言:javascript
复制
> emmodel21$classification

我可以看到每个supportticket的集群,但是否也有可能输出最频繁的术语,就像第一个代码块中的kmeans一样?

EN

回答 2

Stack Overflow用户

发布于 2018-03-06 18:19:31

我想你可以试试

代码语言:javascript
复制
summary(mod1, parameters = TRUE)

我刚刚在链接中尝试了相同的示例

代码语言:javascript
复制
library(mclust)
data(diabetes)
X <- diabetes[,-1]
BIC <- mclustBIC(X)
mod1 <- Mclust(X, x = BIC)
summary(mod1, parameters = TRUE)
票数 0
EN

Stack Overflow用户

发布于 2018-06-14 02:06:36

稍微修改一下小插曲中的第一个示例:

代码语言:javascript
复制
data(diabetes)
X <- diabetes[,-1]
mod <- mclust(X)
means <- mod$parameters$means

means对象现在是一个包含簇均值的矩阵。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/49126690

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档