我用Spark来运行Kmeans。我有大量的数据和三个现有的中心,例如,三个中心是:[1.0,1.0,1.0],[5.0,5.0,5.0],[9.0,9.0,9.0].,所以我怎样才能表明Kmeans中心是上面的三个向量。我看到Kmean对象有种子参数,但是种子参数是一个长类型而不是数组。那么,我如何告诉Spark只使用现有的中心进行聚类。
或者说,我不明白种子在星火中意味着什么,我认为种子应该是一个向量数组,它在运行聚类之前代表指定的中心。
https://stackoverflow.com/questions/43483011
复制相似问题