文章/答案/技术大牛

发布

社区首页 >问答首页 >K均值聚类PCA后的标准化

问K均值聚类PCA后的标准化
EN

Data Science用户

提问于 2019-06-13 08:24:00

回答 2查看 1.2K关注 0票数 2

在主成分分析降维后，我想将K均值应用于聚类。在主成分分析之前，我已经用StandardScaler标准化了数据，然后我想训练Kmeans来找到簇。然而，PCA组分之间的差异不可能是相同的数量级。

聚类前对PCA组件进行标准化是一个很好的实践吗？

clustering

k-means

unsupervised-learning

pca

回答 2

Data Science用户

回答已采纳

发布于 2019-06-13 08:46:34

如果用于k-均值聚类的变量在不同的尺度上，方差较高的变量将通过驱动k-质心的收敛来控制算法。

根据你的研究目标，这是你可以允许的吗？相反，如果您希望所有的因素在集群中具有相同的权重，那么您应该对它们进行缩放。

票数 1

Data Science用户

发布于 2019-06-13 18:22:27

通常PCA已经返回标准化组件。

你计算了每个组件的方差吗？通常情况下，是1。

更棘手的问题是在进行PCA之前是否使用标准化。我不认为这是一个普遍的答案。

票数 2

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/53688

复制

相似问题

问K均值聚类PCA后的标准化
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问K均值聚类PCA后的标准化EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问K均值聚类PCA后的标准化
EN