我正试图对房地产(以百万计的价格)进行预测。
数据集的平均price为400万。
我的数据集中没有任何负值,但是有一些预测值是负的,大约为-1千万。
Xgboost还预测了负值:
Xgboost: RMSE为1.24,R^2为0.81
线性回归: RMSE为1.54,R^2为0.74
我做错了什么?我试着使用\log(\text{price}),但是RMSE更大。对于这类问题,有什么解决办法?
发布于 2022-06-18 16:44:32
这可能发生在回归中,特别是当训练数据太小和/或测试数据与训练数据有重要差异时。它可能是由偏倚或过度拟合引起的,但在您的情况下,它更可能是过度拟合,因此解决方案要么是改进培训数据,要么简化模型,例如删除一些特性。
https://datascience.stackexchange.com/questions/111927
复制相似问题