我一直在使用HDBSCAN,并且有几百个基于我的数据的集群。我正在尝试选择一些集群组进行进一步的分析。寻找具有较高的簇间距离的集群,如在更多的分布和行为比集群的其他部分更离群。到目前为止,我正在处理(-1)集群类别,但意识到这些集群的cluster.probabilities_是0。我需要这个价值来进一步分析。
我的问题是
cluster.probabilities_得分如何?-1集群类别之外),我可以选择其他可能出现异常值的集群吗?比如计算簇间距离或者其他方法?发布于 2021-04-07 21:15:16
cluster.probabilities_表示给定数据点属于该集群的概率。https://stackoverflow.com/questions/64856656
复制相似问题