文章/答案/技术大牛

发布

问DBSCAN聚类
EN

Data Science用户

提问于 2020-07-27 17:36:45

回答 1查看 277关注 0票数 0

我使用K-方法来获取我的数据的簇数(弯头法)。然后，我试图看看对于某些特定的超参数，DBSCAN是否能得到相同数量的集群。我尝试了Brute来获得参数值，并得到了不同数据集的值。

然而，我想知道是否有理由这样做，还是这只是一个侥幸？

编辑-所有的数据集是二维的。

发布于 2020-07-27 18:18:15

首先，K-均值是一种划分算法，其中DBSCAN是一种密度聚类算法。

K-指的是寻找代表数据某些区域的聚类中心。DBSCAN不要求将每个点分配给集群，因此不对数据进行分区，而是提取密集的聚类，并留下稀疏的背景分类为噪声。它使用了可达性的概念，即在一个半径内有多少个邻居有一个点。

假设通过蛮力，可以得到相同数量的集群，但是Rand_score会有很大的不同，因为如果数据集非常琐碎(我们得到数据点的簇距离相等，密度相等)，那么两个集群都会得到相同数量的集群。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/78378

复制

相似问题

问DBSCAN聚类EN