我建立了一个时间序列模型,对具有年度季节性的作物科学数据进行月度观测(2012至2018年的月度观测值)。购买植保产品的农民还取决于降雨时间。同样的产品在11月份、12月份和1月份也有高峰。
我已经构建了一个SARIMA模型(没有协变量)和SARIMAX模型(有协变量)。协变量为平均降雨量、累计降雨量、平均温度、最低温度、最高温度、平均湿度等
这里的主要问题是,我的SARIMAX模型应该比SARIMA模型提供更好的精度,因为我们有协变量帮助模型更好地预测。我的假设正确吗?
目前,SARIMA在这里给了我更好的准确性。
发布于 2019-12-19 12:27:24
我想你可以使用MLE来估计SARIMA和SARIMAX。但我不确定你使用的准确度是多少,所以我猜是RMSE。
MLE将最大化可能性,因此从数学上讲,SARIMAX肯定会在相同样本上提供比SARIMA更高的可能性(无约束优化总是比有约束优化提供更好的结果)。
然而,它不能保证更好的RMSE,因为RMSE是线性残差的平方,并且在SARIMA的情况下(由于MA部分),与线性回归的情况下的对数似然不完全相关。
因此,对于SARIMAX,具有较高的对数似然,但也有较高的RMSE (和较低的R平方)是完全正常的。在这种情况下,你有一个过度拟合的SARIMAX,而X似乎在预测y方面提供的信息不是很多。
您可能还想检查其他一些东西:
可能存在问题
https://stackoverflow.com/questions/59403152
复制相似问题