有人能用相对简单的英语解释localImp参数在randomForest包中的作用吗?
randomForest文档将此参数描述为:
应计算案例重要性度量吗?(将此设置为TRUE将覆盖重要性。)
它还说,它产生了:
包含案例重要性测度的p乘n矩阵,其中的i,j元是第j种情况下第一变量的重要性。空如果localImp=FALSE
有人能解释清楚这意味着什么吗?或者在论文的方向上,他们会详细讨论这个参数。
谢谢
发布于 2019-08-10 16:45:00
randomForest包或多或少是Leo和Adel编写的fortran代码的包装器。布雷曼是加州大学伯克利分校的统计学教授,他去世后,他们保存了他的网站。
这是一个惊人的资源:
https://www.stat.berkeley.edu/~breiman/RandomForests/
在这个网站上,他们在分类页上提到了以下几点:
对于每一种情况,考虑所有的树,它是oob。从未触及的oob数据中正确类别的得票率中减去变量m-置换oob数据中正确类的得票率。对于这种情况,这是变量m的局部重要性评分。
所以,为了观察我,把所有没有在我身上训练的树拿出来,因为它不是在引导中选择的。现在,考虑变量m.对不包含i的每一棵树的左出(oob)观测值,计算出这些树的平均出袋精度。在不改变变量m值的情况下,计算出这些树的包外精度,从非置换oob精度中减去置换m精度的平均值,给出了(i,m)局部重要度测度。
发布于 2019-08-10 16:34:23
Localimp (局部重要性)在特定个体分类(localImp=TRUE)中设置每个变量的重要性,这样您就可以看到每个特性对每一行的输出有多大的影响。
你可以读到:了解随机树木在森林中的重要作用
也是随机森林向导
https://stackoverflow.com/questions/57443766
复制相似问题