首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >DBSCAN聚类

DBSCAN聚类
EN

Data Science用户
提问于 2020-07-27 17:36:45
回答 1查看 277关注 0票数 0

我使用K-方法来获取我的数据的簇数(弯头法)。然后,我试图看看对于某些特定的超参数,DBSCAN是否能得到相同数量的集群。我尝试了Brute来获得参数值,并得到了不同数据集的值。

然而,我想知道是否有理由这样做,还是这只是一个侥幸?

编辑-所有的数据集是二维的。

EN

回答 1

Data Science用户

发布于 2020-07-27 18:18:15

首先,K-均值是一种划分算法,其中DBSCAN是一种密度聚类算法。

K-指的是寻找代表数据某些区域的聚类中心。DBSCAN不要求将每个点分配给集群,因此不对数据进行分区,而是提取密集的聚类,并留下稀疏的背景分类为噪声。它使用了可达性的概念,即在一个半径内有多少个邻居有一个点。

假设通过蛮力,可以得到相同数量的集群,但是Rand_score会有很大的不同,因为如果数据集非常琐碎(我们得到数据点的簇距离相等,密度相等),那么两个集群都会得到相同数量的集群。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/78378

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档