我尝试将随机森林与我的数据集相匹配,以在控制组和阿尔茨海默组之间进行分类。在第一次尝试中,我得到了左侧的OOB错误图,在第二次尝试中,我减少了数据集中的变量数量,得到了右侧的OOB错误图。我的问题是比较这两个图,哪个是更好的OOB图? Alzhemier和Control的类误差是否应该接近森林的OOB曲线?如果是,为什么?

发布于 2018-02-05 22:56:16
右边的图有一个更好的OOB错误。我假设阿尔茨海默和控制线也是OOB错误,但针对特定的类进行了计算。随机森林预测器是通过自举一小部分样本来构建的,OOB误差是在算法的每次迭代中未被选择(从袋子中)的样本上计算的。因此,OOB误差是在构建Breinman所描述的模型时对性能的估计,当然,误差越小越好。
“阿尔茨海默病和控制的类错误是否应该更接近森林的OOB曲线?”这取决于你的模型在预测每个类别上有多好。如果两个类别的分类错误相似,则OOB错误将接近两者。
https://stackoverflow.com/questions/48622038
复制相似问题