我正在处理一个回归预测挑战,其中评价指标是(pearson)相关性。然而,我的印象是,这个指标有点武断。虽然我可以保持RMSE的稳定,但相关性可以有很大的变化。
有人能解释一下这个指标吗?如何对其进行优化?
发布于 2016-01-24 19:36:38
组织者可能认为预测变化的方向比震级更重要,也就是说,当已知值较高时(反之亦然),你的预测值要比尽可能接近已知值更重要。不管怎么说,测量结果可能会很吵。
一种比较健壮的优化方法是通过网格搜索对局部最优进行优化,比如在这个QA中。
但是,您也应该注意到,算法在根据某些损失函数进行拟合时会调整内部参数。一些算法是接受自定义成本函数和衍生产品接受自定义成本函数和衍生产品,但是一些实现 别。信息论测度在分类上是标准的,而在回归中是标准的。
理论上,您应该能够告诉您的随机森林(或其他相应的算法),什么是最优分割是皮尔逊相关的一个函数。
https://datascience.stackexchange.com/questions/9916
复制相似问题