在这篇关于静态和差异的链接中,人们提到像ARIMA这样的模型需要一个平稳的时间序列来进行预测,因为它的统计特性如均值、方差、自相关等随着时间的推移是恒定的。由于RNN具有更好的学习非线性关系(如下所述:递归神经网络在时间序列预测中的应用前景)的能力,并且在数据大的情况下比传统的时间序列模型表现得更好,因此了解平稳数据对其结果的影响是非常必要的。我需要知道的问题如下:
发布于 2017-11-17 05:49:05
一般来说,时间序列和其他机器学习问题并没有什么区别--你希望你的测试集看起来像你的训练集,因为你希望你在训练集上学到的模型仍然适合你的测试集。这是关于平稳性的重要的基本概念。时间序列具有额外的复杂性,即您的数据中可能存在长期结构,而您的模型可能不够复杂,无法学习。例如,当使用N的自回归滞后时,我们不能学习间隔比N更长的依赖关系,因此,当使用像ARIMA这样的简单模型时,我们希望数据也是局部平稳的。
最终的证据是布丁。也就是说,进行模型验证,就像对任何其他机器学习项目一样。如果您的模型对持久数据有很好的预测,那么您可以对使用它有一定的信心。但是,就像任何其他ML项目一样--如果您的测试数据与您的培训数据有很大的不同,那么您的模型的性能就不会很好。
https://datascience.stackexchange.com/questions/24800
复制相似问题