我正在做一个关于层级聚类的项目,我正在编写一些代码,在这些代码中,我使用“亲和力”和“链接”的每一种可能的组合来执行AgglomerativeClustering,这是可以设置的两个参数。当我尝试将数据与算法拟合时,问题就出现了。数据集具有以下形状(1300,8),并使用'index_col=0‘进行索引,以便删除第一个无用的列(删除无用的列后,列数最多为8)
如果单独运行,for fine循环实际上工作得很好,问题是关于亲和性的循环。
dataset = #csv file
aff = ["l1", "l2", "manhattan", "cosine", "precomputed", "euclidean"]
link = ["complete", "average", "single"]
for a in aff:
for l in link:
ds=dataset
ac_tune=AgglomerativeClustering(n_clusters=5, affinity=a, linkage=l)
ac_tune.fit(ds)错误如下:
IndexError: index 8 is out of bounds for axis 1 with size 8发布于 2019-06-21 05:36:35
当您尝试执行“预计算”亲和性时,它会失败。对于此选项,数据集需要是距离矩阵,而不是原始数据。
https://scikit-learn.org/stable/modules/generated/sklearn.cluster.AgglomerativeClustering.html
https://stackoverflow.com/questions/56693919
复制相似问题