我的工作是车辆占用率预测,我对此非常陌生,我使用随机森林回归来预测入住率。
有大约48M行,我已经使用所有的数据来预测入住率,因为人口和占用率都是标准化的,因为我已经预测了更高的数量。我确信模型不好,如何解释RMSE和MAE的结果。此外,这幅图也显示出这并不是很好的预测,我是否用正确的方法来预测车辆的占用率。
请帮我做以下几件事
发布于 2021-07-27 12:07:24
随机森林回归是解决这一问题的好方法吗?
总的来说,决策树往往不是很好的回归者。但对你的情况来说,效果很好。您需要评估与度量对应的结果,然后比较不同的模型。
我喜欢回归模型中的MAE,因为它非常直观。
如何改进模型的结果?
请注意,决策树不需要缩放值才能获得良好的性能。考虑一下
确保模型中有有意义的功能。
尝试不同的模式与不同的超参数。
如果您有分类特性,请使用https://contrib.scikit-learn.org/category_编码器/
如何解释结果
如果您没有缩放目标。你在测量梅。
假设你的MAE = 2,那么你预测的平均误差是2名乘客。
https://datascience.stackexchange.com/questions/98356
复制相似问题