我希望在Python中评估随机森林回归器的测试性能,除了在训练集上运行交叉验证之外,我想知道在预测的Y测试结果和实际的Y测试结果之间运行某种相关性分析是否合适?
我可能过于简单化地认为,两者之间的显著相关性表明,预测的Y与实际测试的Y一致,因此,预测是好的……
任何替代建议都是非常受欢迎的。谢谢。
发布于 2018-08-28 23:27:17
你可以运行相关性分析,这是合适的,但如果相关性很大,它并不总是正确的,你的模型是好的。你还必须看一下它的变化。还取决于您正在解决的任务(分类、分割、回归等),您可以使用指标来检测您的预测有多好。你可以在这里找到不同的指标http://scikit-learn.org/stable/modules/model_evaluation.html。
https://stackoverflow.com/questions/52061313
复制相似问题