它需要导入hdbscan模块。因此,我希望将其安装在我的虚拟机上。按照来自Pypi.org的关于这个库的documentation,我简单地运行: pip install hdbscan 几分钟后,它返回: Succesfully built hdbscan
Installing'hdbscan'“。我尝试过pip uninstall hdbscan,但是它返回了: WARNING : Skipping hdbscan as it is not installed.&
我正在尝试使用HDBSCAN算法在一个由146,000个观测数据组成的大型数据集上实现一个集群。然而,这让我想知道如何使用默认的度量没有这样的问题,同时查看HDBSCAN源代码显示,在这种情况下也调用Sklearn的配对距离,这将返回整个矩阵。我的度量和一些结果的代码:import pandas as pdimport numpy as np small_data