我有一个两个月的数据集,我每2分钟就能阅读一次。statsmodel.tsa.seasonal_decompose方法请求频率的数值。这些数据的数值是多少,在这样的时间序列数据中计算freq的合适方法是什么。
发布于 2017-07-25 05:00:01
你需要自己确定季节性的频率。这通常是使用数据集的知识或通过直观地检查部分自相关图来完成的,状态模型库提供了这样的图形:状态模型.部分自相关。
如果数据有每小时的季节性,您可能会看到一个显著的偏相关滞后30 (因为这一小时的前2分钟和最后一小时的前2分钟之间有30个数据点)。我假设状态模型会期望这个值;我假设如果你有每月的数据,它会期望一个12,或者如果你有每日数据,它会期望每周的形状为7等等。
听起来你有多个季节要考虑从你的另一个帖子来判断。您可能会看到一个与前几个小时、前几天和/或前几周相同的2分钟相对应的显著滞后。这种季节性分解的方法被认为是幼稚的,只解决了它的文档中描述的一个季节性问题:季节分解。
如果您想继续进行季节性分解,您可以尝试最近发布的由facebook发布的双季节模型。它是专门设计的,很好地处理日常数据,其中它模拟了年内和周内的季节性。也许它可以适应你的问题。预言家
季节性分解模型的缺点是,它不能反映一个季节可能随着时间的变化。例如,夏季一周电力需求的特点与冬季大不相同。该方法将确定一个平均季节模式,并将剩余信息留在残差中。因此,考虑到你的特性在一周中的每一天都不同(在你的另一篇文章中提到过),这并不能捕捉到这一点。
如果你想把你的资料寄给我,我会有兴趣看一看。根据我的经验,你已经跳入了时间序列预测的深度,不一定有一个容易使用的现成解决方案。如果你确实提供了它,也请澄清你的目标是:
https://stackoverflow.com/questions/45284122
复制相似问题