文章/答案/技术大牛

发布

社区首页 >问答首页 >房屋预测中均方根值的推断

问房屋预测中均方根值的推断
EN

Data Science用户

提问于 2018-07-14 22:50:33

回答 1查看 471关注 0票数 0

这项任务的目的是预测房价。根据加州住房数据集建立了一个预测房价的模型，并使用以下代码进行了评估。

    from sklearn.metrics import mean_squared_error

    housing_predictions = lin_reg.predict(housing_prepared)
    error = mean_squared_error(housing_labels,housing_predictions)
    rmse = np.sqrt(error) --> prediction error

    // value I got for rmse was - 68628.1981

平均房价在12万到265,000之间。但rmse值为68628.1981。

问题

通过查看rmse值，我应该推断什么？我知道模特不合身。我想知道rmse价值背后的直觉。

predictive-modeling

prediction

model-selection

回答 1

Data Science用户

回答已采纳

发布于 2018-07-14 23:52:30

RMSE是一种衡量回归模型预测的“错误”程度的方法，它主要是作为一组模型中哪一组最好的相对度量来使用的。如果您想要一个绝对基线来比较任何给定的模型，您总是可以计算目标的标准偏差，这是一个模型的RMSE，它预测每个观测的$y$平均值。

我还认为，对于像房价这样的东西，一个更有意义的误差度量是均方对数误差，它是在取$y$ (或$y + 1$ $y$包含零)的日志和预测值之后的均方对数误差。原因是我们对错误与目标的比例感兴趣(对于10万美元的房屋，50,000美元的错误要比1,000,000的房子严重得多)，而采取日志是调整这种错误的方式。此外，一定要集中于测试或交叉验证错误，否则，您将始终选择您最适合的模型。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/35476

复制

相似问题

问房屋预测中均方根值的推断
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问房屋预测中均方根值的推断EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问房屋预测中均方根值的推断
EN