我是随机森林模型领域的新手,并试图解释几个RF模型的输出。所使用的数据集相当大(大约5,000行及以上,5个预测变量,都是数字的),而模型(使用R包randomForest和RandomForestSRC进行比较和更好的绘图)似乎运行得很好,而且我得到了大约40%的解释%var,因为某种原因,我似乎无法计算OOB错误。它应该一起出现在RF摘要中的混淆矩阵中,但我所得到的只是例如:

我目前使用randomForest包运行的代码是:
rf3 <-randomForest(fishing_hours ~ . , data = data_fish, ntree = 1000, importance=TRUE, do.trace=100)尝试使用rf3$err.rate[,1]访问OOB错误率时,当结果或NAs列出时,我将获得NULL,并绘制rf3如下所示:

我正在做一个回归-是否有机会获得错误率或其他有用的模型性能指标的建议?
任何帮助,非常感谢-乐意分享一个样本数据集,如果需要。
发布于 2018-04-26 17:35:03
random.forest包仅在进行分类时计算OOB错误(err.rate)和confusion矩阵。
均方误差通常用于确定回归问题的错误率,您可以从models$mse访问它。
在CrossValidated上的这个答案也可能有帮助:https://stats.stackexchange.com/questions/305046/best-way-to-evaluate-a-random-forest-model-accuracy-on-continuous-data
https://stackoverflow.com/questions/50048267
复制相似问题