我应用线性回归的一些特征,预测目标的交叉验证10倍。
特征和目标均采用MinMax量表。
然后特征标准化。
当我运行该模型时,r2 = 0.65,最小均方误差为0.02。
但是,当我使用目标,因为它们没有MinMax缩放,我得到了相同的r2,但MSE大幅度增加到18。
我的问题是,我们是否必须在数据预处理方面处理目标,就像对待特征一样?以上哪个值是正确的?因为mse在没有缩放目标的情况下退出得更大。
有些人说我们必须扩大目标,而另一些人则说不。
提前谢谢。
发布于 2020-02-07 13:37:24
无论你是否缩放你的目标,都会改变你错误的“意义”。例如,考虑两个不同的目标,一个是0,100,另一个是0,10000。如果您针对它们运行模型(没有缩放),那么MSE为20对于这两个模型来说意味着不同的事情。在前一种情况下,这将是灾难性的,而在后一种情况下,它将相当体面。
因此,目标范围为0,1的MSE比原来的要低,这并不令人惊讶。
同时,r2值与范围无关,因为它是用方差计算的。
缩放允许您比较不同目标的模型性能,除其他外。
此外,对于某些模型类型(如NNs),缩放将更为重要。
希望能帮上忙!
https://stackoverflow.com/questions/60111980
复制相似问题