有什么方法可以用imputeTS来预测多个回归变量的时间序列吗?我的所有X(x1,x2,. )都是用NAs表示的一分钟级数据。xn)是不带NAs的连续变量ae。
DateTime Processed Avg 1_Q Median 3_Q
04/01/20 3:22 3 1.8 1 2 2.5
04/01/20 3:23 3 1.6 1 1 2
04/01/20 3:24 1 1.5 1 1 2
04/01/20 3:25 1 1.2 1 1 1
04/01/20 3:28 1 1.1 1 1 1
04/01/20 3:29 1 1.7 1 1.5 2.8
04/01/20 3:32 1 1.6 1 1 2
04/01/20 3:33 2 1.4 1 1 2
04/01/20 3:35 1 1.4 1 1 1.8
04/01/20 3:38 1.4 1 1 2
04/01/20 3:39 2 1.4 1 1 2
04/01/20 3:41 1.2 1 1 2
04/01/20 3:42 1.2 1 1 1.8
04/01/20 3:44 1 1.3 1 1 2
04/01/20 3:45 1 1.2 1 1 1
04/01/20 3:46 1 1.6 1 2 2
04/01/20 3:47 1 1.8 1 2 2
04/01/20 3:48 1.2 - 1 2
04/01/20 3:52 1.3 1 1 1.3
04/01/20 3:53 2 1.9 1 2 2
04/01/20 3:54 1 0.9 1 1 1
04/01/20 3:56 1 1.3 1 1 1
04/01/20 3:57 2 1.1 1 1 1一个完整的数据集可以找到这里
发布于 2020-12-06 16:18:16
imputeTS用于时间序列计算(在时间上使用一个变量的相关性)。
在您的例子中,在其他变量中有很多有用的信息(变量间的相关性)。imputeTS进行单变量时间序列计算,因此它只考虑每个变量及其在时间上的相关性。
由于变量Avg、1_Q、Median、3_Q似乎与Processed高度相关(您丢失的数据所在),所以另一个包可能是更好的选择。missForest、imputeR和其他采用变量相关性(但不采用时间相关性)的软件包将是一个更好的选择。
也许,如果您为丢失的数据提出自己的估算例程,您将得到更好的结果。缺少的数据似乎总是在Processed和Avg中,Median,3_Q似乎是关于Processed的统计数据。例如,将Avg舍入到最近的数字作为Processed的替代品可能已经相当不错了。
https://stackoverflow.com/questions/65137143
复制相似问题