我使用K-方法来获取我的数据的簇数(弯头法)。然后,我试图看看对于某些特定的超参数,DBSCAN是否能得到相同数量的集群。我尝试了Brute来获得参数值,并得到了不同数据集的值。
然而,我想知道是否有理由这样做,还是这只是一个侥幸?
编辑-所有的数据集是二维的。
发布于 2020-07-27 18:18:15
首先,K-均值是一种划分算法,其中DBSCAN是一种密度聚类算法。
K-指的是寻找代表数据某些区域的聚类中心。DBSCAN不要求将每个点分配给集群,因此不对数据进行分区,而是提取密集的聚类,并留下稀疏的背景分类为噪声。它使用了可达性的概念,即在一个半径内有多少个邻居有一个点。
假设通过蛮力,可以得到相同数量的集群,但是Rand_score会有很大的不同,因为如果数据集非常琐碎(我们得到数据点的簇距离相等,密度相等),那么两个集群都会得到相同数量的集群。
https://datascience.stackexchange.com/questions/78378
复制相似问题