我有一个时间序列数据,看起来像这样 Loan_drawn_date Loan_id Loan_amount id_001 2000000 2015-7-15 id_003 100 2014-7-8 id_009 78650 2012-12-23 id_990 100 2018-11-12 我试图在这个数据上建立一个Arima预测模型,这个模型大约有550个观测数据。以下是我所遵循的步骤
将时间序列数据转换为每日数据,并将NA值替换为0。数据如下所示
Loan_drawn_date Loan_id Loan_amount
id_001 2000000 2015-7-15
id_001 0 2015-7-16
id_001 0 2015-7-17
id_001 0 2015-7-18
id_001 0 2015-7-19
id_001 0 2015-7-20
……
id_003 100 2014-7-8
id_003 0 2014-7-9
id_003 0 2014-7-10
id_003 0 2014-7-11
id_003 0 2014-7-12
id_003 0 2014-7-13
……
id_009 78650 2012-12-23
id_009 0 2012-12-24
id_009 0 2012-12-25
id_009 0 2012-12-26
id_009 0 2012-12-27
id_009 0 2012-12-28
..。
id_990 100 2018-11-12
id_990 0 2018-11-13
id_990 0 2018-11-14
id_990 0 2018-11-15
id_990 0 2018-11-16
id_990 0 2018-11-17
id_990 0 2018-11-18
id_990 0 2018-11-19
有人能建议我现在如何处理这些0值吗?
看到贷款金额数字的差异,我将获取贷款金额的日志。我第一次尝试建立ARIMA模型,我已经读过所有的归责方法,但是我什么也找不到。有人能告诉我如何处理这些数据吗?
发布于 2018-06-09 13:44:05
我不清楚具体的领域问题,但这些问题通常适用于一般情况:
我可能根本就不会使用归罪。对于有缺失值的时间序列,有一些方法可以拟合ARIMA模型。通常,这些算法也应该在python中实现。(但我不知道,因为我主要是用R)
https://stackoverflow.com/questions/50747097
复制相似问题