为什么h2o.randomforest在训练多项式分类问题时,要计算袋外样本的均方误差?
我也用h2o.randomforest做过二分类,它用来在out of bag sample和training上计算AUC,但对于多分类随机森林计算均方误差,这似乎很可疑。请看这张截图。

我的目标变量是一个包含4个因子水平model1,model2,model3和model4的因子。在屏幕截图中,您还会看到这些因素的混淆矩阵。
有人能解释一下这种行为吗?
发布于 2015-10-30 09:28:46
二项式分类和多项式分类都显示均方误差,因此您将在两个模型的评分历史记录表中看到它(突出显示的training_MSE列)。
H2O不计算多项式AUC。有几种评估方法,但还没有一种广泛采用的方法。pROC package讨论了手工和收割的方法,但提到它不能绘制,结果很少测试。日志损失和分类错误仍然可用,具体到分类,因为每种方法都有多项式上下文中的标准评估方法。
正如你所强调的,有一个混淆矩阵来比较你的4个因素水平。你能澄清一下你还期待什么吗?如果您正在寻找四个单独的混淆矩阵,那么包含四列的表包含了足够的信息,可以对它们进行计算。
https://stackoverflow.com/questions/33331725
复制相似问题