首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何确定R中分类数据的聚类方法?

如何确定R中分类数据的聚类方法?
EN

Stack Overflow用户
提问于 2019-10-10 18:33:14
回答 1查看 82关注 0票数 0

我正在尝试对混合数据执行聚类分析(人口统计变量+ Likert从1到10个偏好)。我尝试使用daisy()函数对混合数据应用层次聚类,但当我计算拟合-共生相关性的优度时,得分为0.60,这不是很高。

我怎样才能提高拟合的优度?分层方法是否适用于此数据?Likert scale数据应该被视为因子还是数字?另外,当调用- hclust(seg.dist,method="complete")时,这种方法适合我的数据吗?

我也尝试了潜在类分析,但结果并不有趣(除非我做错了)

代码语言:javascript
复制
seg.dist <- daisy(EUR_data)
as.matrix(seg.dist)
seg.hc <- hclust(seg.dist, method="complete")

要计算共生相关性,请执行以下操作:

cor(cophenetic(seg.hc), seg.dist)

EN

回答 1

Stack Overflow用户

发布于 2019-10-12 19:19:12

改进数据的预处理。

有些属性会比其他属性更重要。

Likert属性通常也不能被视为区间标度,因为由于文化原因,人们给7的可能性比给6或8的少:7代表坏运气。

聚类效果取决于您的距离,因此请改进预处理和距离计算!

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58320893

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档