我正在尝试重新训练一个回归模型(XGB回归器),它是在前人类时代(2020年2月)使用的。
模型的因变量是预定量,由于贪心,预订量受到影响,影响了模型的精度。
有什么建议,我可以如何设法重新培训我的模型上的贪得无厌的数据,但仍然设法获得体面的准确性?
发布于 2021-02-25 10:58:08
你以前的模型是没用的。在我看来,你不能用它来预测科维德大流行,因为所有的预订都大幅减少了。
我建议建立一个新的模型,只使用科维德大流行时间的数据。然后,您将有一个更准确的模型,为这些时间。如果您有较少的历史数据,但当然,唯一的问题是,与不代表当前时代的庞大数据集相比,拥有更少的数据却更有用。
请注意,您可能可以在这个新模型中添加一些有用的特性,例如,该国每天Covid的死亡人数。当然,这个功能会对你有帮助,因为如果你每天有大量的死亡,你可能会有更少的预订,否则,如果有更少的死亡,应该有更多的预订。
https://datascience.stackexchange.com/questions/89895
复制相似问题