我有一些属于群体的观察,我想计算它们在不同群体中的相似性,以便判断哪些观测在特定群体中有类似的特性。
哪些指标可以用来做这样的事情?在什么条件下?
我知道有很多度量来计算一个组中个体之间的相似性,但是没有阈值来判断集群中的个体是否有相似的模式。
发布于 2018-05-21 13:37:03
我想知道哪些指标可以用来做这样的事情
既然您正在对数据进行聚类,那么为什么不使用与集群期间用于比较集群内数据的相同的度量呢?我想从技术上讲,这应该能满足你的需要。
没有阈值可以判断集群中的个人是否有相似的模式。
这很难取决于你的数据和你想做什么与你的相似性。如果您只想检索最相似的点,您可以非常直接地进行。
另一方面,如果您想使用此度量来删除异常值,您当然也可以这样做,但是您最好首先使用一种处理异常值的算法。
https://datascience.stackexchange.com/questions/29408
复制相似问题