我有一个33707行的数据集。我想使用DBSCAN聚类算法对我的数据集进行聚类,并使用haversine距离度量。我的代码在图像中给出了。我只得到一个集群。为了得到准确的聚类数,我应该改变eps或min_samples的值。
kms_per_radian = 6371.0088
epsilon = 0.5 / kms_per_radian
model = DBSCAN(eps=epsilon,min_samples=300,algorithm='ball_tree', metric='haversine').fit(np.radians(X))
class_predictions = model.labels_
df['CLUSTERS_DBSCAN']=class_predictions 发布于 2022-11-15 15:43:38
请尽量将min_samples减少到小数目。
https://stackoverflow.com/questions/64193057
复制相似问题