首页
学习
活动
专区
圈层
工具
发布

ARIMA预测
EN

Stack Overflow用户
提问于 2018-06-07 17:31:59
回答 1查看 152关注 0票数 0

我有一个时间序列数据,看起来像这样 Loan_drawn_date Loan_id Loan_amount id_001 2000000 2015-7-15 id_003 100 2014-7-8 id_009 78650 2012-12-23 id_990 100 2018-11-12 我试图在这个数据上建立一个Arima预测模型,这个模型大约有550个观测数据。以下是我所遵循的步骤

将时间序列数据转换为每日数据,并将NA值替换为0。数据如下所示

Loan_drawn_date Loan_id Loan_amount

id_001 2000000 2015-7-15

id_001 0 2015-7-16

id_001 0 2015-7-17

id_001 0 2015-7-18

id_001 0 2015-7-19

id_001 0 2015-7-20

……

id_003 100 2014-7-8

id_003 0 2014-7-9

id_003 0 2014-7-10

id_003 0 2014-7-11

id_003 0 2014-7-12

id_003 0 2014-7-13

……

id_009 78650 2012-12-23

id_009 0 2012-12-24

id_009 0 2012-12-25

id_009 0 2012-12-26

id_009 0 2012-12-27

id_009 0 2012-12-28

..。

id_990 100 2018-11-12

id_990 0 2018-11-13

id_990 0 2018-11-14

id_990 0 2018-11-15

id_990 0 2018-11-16

id_990 0 2018-11-17

id_990 0 2018-11-18

id_990 0 2018-11-19

有人能建议我现在如何处理这些0值吗?

看到贷款金额数字的差异,我将获取贷款金额的日志。我第一次尝试建立ARIMA模型,我已经读过所有的归责方法,但是我什么也找不到。有人能告诉我如何处理这些数据吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-06-09 13:44:05

我不清楚具体的领域问题,但这些问题通常适用于一般情况:

  1. 如果NA值表示域特定问题的0值,则将其替换为0,然后拟合ARIMA模型(例如,如果您查看每天的销售情况,有时您的销售额为0)
  2. 如果NA值表示域特定问题的未知值,则不要替换它们,并与您的ARIMA模型相匹配。(如果在某一天,员工忘了记录销售额,而且可能是任何数字,情况就是如此)。

我可能根本就不会使用归罪。对于有缺失值的时间序列,有一些方法可以拟合ARIMA模型。通常,这些算法也应该在python中实现。(但我不知道,因为我主要是用R)

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50747097

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档