首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >不知道簇数的聚集聚类

不知道簇数的聚集聚类
EN

Data Science用户
提问于 2017-07-07 20:03:58
回答 2查看 2.3K关注 0票数 1

我想要进行聚类,但我不知道前面有多少簇。但我希望每个集群至少有40个数据点。如何将此应用于sklearn.agglomerative集群?我应该用树状图并以某种方式剪掉它吗?我不知道如何把树状图和它联系起来,然后把它切掉。任何帮助都将不胜感激!

EN

回答 2

Data Science用户

发布于 2017-07-08 07:31:35

在层次聚类中,最小聚类大小一般不能满足。相反,您必须期望许多集群只有一个点。

ELKI有一些非常有趣的技术来切割树状图。检查clustering.hierarchical.extraction (大约)包。如果我没记错的话,有些允许您设置最小大小(但是会有一个“噪音”集群和所有剩馀的)。

票数 1
EN

Data Science用户

发布于 2017-07-08 12:48:12

如果你不知道集群的数量,我鼓励你看看那些基于密度的算法:均值偏移,DBSCAN,光学。它们不假定簇数,能够找到随机形状的簇。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/20248

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档