我正在使用dtwclust包对时间序列数据进行分类。我已经使用单变量数据对它进行了广泛的尝试,并已经弄清楚了它的详细情况。使用多变量数据的文档有点少,但我能够使用DTW和层次聚类来实现它。当我尝试使用DTW和分区聚类时,绘图函数返回一个警告,并且绘图本身非常难以理解。这与他们在参考手册中引用的示例数据相同:
# Multivariate series, provided as a list of matrices
mv <- CharTrajMV[1L:20L]
# Using GAK distance
mvc <- tsclust(mv, k = 4L, distance = "gak", seed = 390,
args = tsclust_args(dist = list(sigma = 100)))
# Note how the variables of each series are appended one after the other in the plot
plot(mvc)
Warning messages:
1: In data.frame(dfm, do.call(rbind, dfm_tcc)) :
row names were found from a short variable and have been discarded
2: In data.frame(dfcm, do.call(rbind, dfcm_tc)) :
row names were found from a short variable and have been discarded

似乎在行下面添加了填充,而在单变量情况下没有添加填充。系列也不是“一个接一个地追加”,我仍然不清楚这到底是什么意思。
在我在Github上报告这是一个bug之前,我希望有经验的人能解释一下我在这里可能做错了什么。
发布于 2017-07-22 06:37:07
我刚刚收到作者的来信,事实上,这是一个bug。一个问题已经发布到GitHub上,将来应该会有修复。
https://stackoverflow.com/questions/45245177
复制相似问题