我有ASCII数据,需要使用HDBSCAN对数据进行集群。我得到了标签,但我不知道如何打印输出的集群结果,即来自hdbscan的唯一和分离的结果。
代码片段:
import hdbscan
import numpy as np
datafile = "ascii.txt"
data = np.loadtxt(datafile, dtype = np.uint8)
clusterer = hdbscan.HDBSCAN(min_cluster_size = 20)
clusterer.fit(data)
print (np.unique(clusterer.labels_, return_counts = True))发布于 2019-04-18 16:20:42
您可以使用Pandas读取该文件,然后打印出集群标签以及作为输入的数据集。尝试如下所示:
import pandas as pd
df = pd.read_csv("ascii.txt")
clusterer = hdbscan.HDBSCAN().fit_predict(df.ColumnName)
df_pd = pd.DataFrame({'Datapoints:' df.ColumnName, 'Cluster Labels:' clusterer)发布于 2019-07-27 03:58:35
导入hdbscan
将numpy导入为np
数据文件= "ascii.txt“
data =np.loadtxt(数据文件,dtype = np.uint8)
Modified_data=pd.DataFrame(数据)
集群器= hdbscan.HDBSCAN(min_cluster_size = 20)
clusterer.fit(Modified_data)
Modified_data‘’Clusters‘=clusterer.labels_
现在,Modified_data返回一个pandas数据帧,其中有一个名为" Clusters“的列,每个实例对应的集群将在Clusters列中指定。您可以根据需要操作此数据帧
https://stackoverflow.com/questions/55609827
复制相似问题