我有一个问题,我有很多关于1年来恒温器记录的数据,其中每小时都会给出那个家庭的平均温度。但由于他们在年中才安装恒温器或关闭恒温器一周或一周,因此无法获得许多数据。但这些恒温器的许多数据实际上是相似的。我想做的是使用类似的时间序列来估算丢失的数据。
假设房屋A在7月份才开始,但从那里开始,它们与家庭B非常相似,然后我想使用来自家庭B的信息来预测房屋A在7月之前的数据。
我正在考虑训练一个可以为我做这件事的递归神经网络,但我不确定有什么可以做到这一点,当我搜索论文时,他们几乎只在多年的数据集上工作,并使用前几年的数据来推算数据。我没有这个数据,所以这不是一个选择。
有没有人知道如何解决这个问题,或者我可以用来解决类似问题的参考资料?
发布于 2020-12-30 06:05:56
据我所知,您希望使用横截面数据而不是时间序列信息来估算数据。
实际上,在R中有相当多的估算包可以帮你做到这一点(如果你正在使用R)。
你需要等间距的数据。因此,每小时有1个值,如果不存在,则需要为NA。所以理想情况下,你有多个等长的时间序列。
然后根据时间戳/小时合并这些时间序列。
然后,你可以应用一个像mice,missForest,imputeR这样的包,基本上只需要一行代码。这些软件包将使用不同时间序列之间的相关性来估计这些序列中的缺失值。
https://stackoverflow.com/questions/64634524
复制相似问题