首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何研究eps在sklearn.cluster.DBSCAN中的作用?

如何研究eps在sklearn.cluster.DBSCAN中的作用?
EN

Data Science用户
提问于 2020-11-02 10:04:46
回答 1查看 43关注 0票数 0

我在这个问题上发布了stackoverflow.com,但没有收到任何答复。如果我从其中一个得到答复,我会通知另一个。

我有一个数据集,我的教授要求我研究epssklearn.cluster import DBSCAN中的作用?你能提出一些衡量它的效果的方法吗?我生成了eps = np.arange(start = .1, stop = 1, step = .1),但我不知道应该比较什么。

代码语言:javascript
复制
import numpy as np 
import pandas as pd
import matplotlib.pyplot as plt 
from sklearn.cluster import DBSCAN
%config InlineBackend.figure_format = 'svg' # Change the image format to svg for better quality
don = pd.read_csv('https://raw.githubusercontent.com/leanhdung1994/Deep-Learning/main/donclassif.txt.gz', sep=';')

kmeans = DBSCAN(eps = .2)
y_kmeans = kmeans.fit_predict(don)

plt.figure(figsize = 1.5 * np.array(plt.rcParams['figure.figsize'])) # This is to have bigger plot
plt.scatter(don['V1'], don['V2'], c = y_kmeans, cmap = 'viridis')

eps = np.arange(start = .1, stop = 1, step = .1)
EN

回答 1

Data Science用户

回答已采纳

发布于 2020-11-02 11:19:52

\epsilon的意思是邻域的大小。点p的邻域(由N_{\epsilon}(p)表示)被定义为N_{\epsilon}(p) = \{q \in D | dist(p,q) \leq \epsilon \}。这里,D是一个n对象(点)的数据库,q是一个查询点。

因此,您教授可能希望您做的是根据其输入参数Epsilon评估聚类优度算法(DBSCAN)。例如,您可以使用剪影评分来度量这种合适性。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/84827

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档