我建立了一个机器学习模型来预测短期租金的日租金。我有大约两千行的csv数据,关于短期租金和大量的功能。
然而,影响预测每日房价的唯一特征是卧室#和房产类型(公寓、房屋等)。起初,这对我来说是有意义的,直到我看到从模型中删除这些特性降低了R2。同样奇怪的是,一处以游泳池为便利设施的房产不会收取更多的费用。我试图改变估值器和一些特征工程,以增加R2,但没有效果。
有人能解释为什么我的模型在不影响预测的特性上会有较低的R2吗?我还有什么其他选择来提高我的准确性呢?
发布于 2022-02-21 19:22:56
增加更多的特征将增加R-平方值,而删除特征将减少R-平方值。R-平方是评价回归模型的一种误导性测度.试着调整R平方分数来评价模型。如果你调整了R-平方值大于0.50,那么你可以依赖该模型,否则它将只是一个垃圾模型。
https://stackoverflow.com/questions/71188568
复制相似问题