我正在尝试对混合数据执行聚类分析(人口统计变量+ Likert从1到10个偏好)。我尝试使用daisy()函数对混合数据应用层次聚类,但当我计算拟合-共生相关性的优度时,得分为0.60,这不是很高。
我怎样才能提高拟合的优度?分层方法是否适用于此数据?Likert scale数据应该被视为因子还是数字?另外,当调用- hclust(seg.dist,method="complete")时,这种方法适合我的数据吗?
我也尝试了潜在类分析,但结果并不有趣(除非我做错了)
seg.dist <- daisy(EUR_data)
as.matrix(seg.dist)
seg.hc <- hclust(seg.dist, method="complete")要计算共生相关性,请执行以下操作:
cor(cophenetic(seg.hc), seg.dist)
发布于 2019-10-12 19:19:12
改进数据的预处理。
有些属性会比其他属性更重要。
Likert属性通常也不能被视为区间标度,因为由于文化原因,人们给7的可能性比给6或8的少:7代表坏运气。
聚类效果取决于您的距离,因此请改进预处理和距离计算!
https://stackoverflow.com/questions/58320893
复制相似问题