DBSCAN(ε,minPts = 2)与单连锁聚类相关,minPts=2也与单连锁聚类相关。
我的问题是:如何使用这些设置获得相同的聚类结果?或者需要在hdbscan中设置其他参数(hdbscan库中有很多参数)?
发布于 2020-06-22 05:40:41
DBSCAN和HDBSCAN在处理边界点方面有所不同,因此实际上不可能从它们那里获得完全相同的答案。尽管如此,您仍然可以执行一些操作来获得类似于DBSCAN的HDBSCAN结果。
clusterer = hdbscan.HDBSCAN(
min_samples=2, match_reference_implementation=True
).fit(X)
clusters = clusterer.single_linkage_.get_clusters(
cut_distance=0.25, min_cluster_size=2
)您可以将cut_distance更改为所需的值( DBSCAN中的等效参数为epsilon。请注意,您可以运行HDBSCAN一次,然后选择您想要的任何cut_distance (一个非常便宜的计算)。
https://stackoverflow.com/questions/62386993
复制相似问题