如果我没有使用DTW作为距离度量,那么tslearn.clustering.TimeSeriesKMeans和sklearn.cluster.KMeans是等价的吗?
如果没有,谁能告诉我这两个包的主要区别是什么?
发布于 2019-06-06 20:40:18
主要的区别只是你可以在tslearn Kmeans中使用"dtw“作为度量标准,这对聚类不同长度的时间序列数据很有帮助,而在sklearn中,如果你的时间序列数据具有不同的长度,它会给出错误,主要是因为它将每个时间戳视为新的特征,当你的数据不是矩阵格式时,它会认为它是错误的格式。
有趣的是,tslearn本身在后台使用sklearn。
但是,/it在对不同的"n_clusters“数据进行聚类时可能会出现问题,例如,3。tslearn有时只预测2个标签。here I mentioned make 4 clusters but it gave only 2 labels
https://stackoverflow.com/questions/55921381
复制相似问题