首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >缺少节假日的Xgboost预测模型

缺少节假日的Xgboost预测模型
EN

Stack Overflow用户
提问于 2017-08-11 00:17:46
回答 1查看 455关注 0票数 0

我正在构建一个预测系统,以预测在给定时间点断开连接的有线电视用户的数量。我使用的是Python,在我尝试过的不同模型中,XGBoost执行得最好。

我有一个以移动窗口方式工作的自我参照系统,例如,当我用完实际数据时,我开始在我的滞后中使用预测数字。

为了建立预测系统,我使用了之前800天的滞后(一天断开连接)、移动平均值、比率、季节性、年、月、日、周等指标。然而,假日是is有点混乱的地方。最初我只用一列来表示各种节假日,但后来我发现不同的节假日可能会有不同的影响(一些节假日会导致高销售额,一些节假日会造成流失),所以我为每个节假日添加了一个列,我还添加了长周末、周日等节假日的指标。我还添加了一个“季节”列来表示节日期间,如感恩节、新年假期等。

即使在添加了这么多与假日相关的专栏之后,我仍然很怀念感恩节和新年期间。虽然它确实在一定程度上照顾到了假日,但它完全忽略了峰值。从图表中可以看出,尖峰是一种趋势,每年都会出现(橙色)。我的预测(灰色)确实提到了12月17日的假期,但它低于预测,任何关于如何处理这一问题的想法。

附注:我使用gridsearch调优了xgboost超参数。

EN

回答 1

Stack Overflow用户

发布于 2017-08-11 03:22:56

据我所知,如果你清理了你的数据,去除了异常值,你的模型将给出一个更稳定的预测集,但它将无法预测所说的异常值。

如果你确实清理了数据,我会玩弄阈值,看看更广泛的常规日误差是否与预测更高峰值的能力相平衡。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45618824

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档