目前,我正在尝试使用递归特征消除(RFE)来优化高维数据集(p >200 k)的随机森林分类器。执行此(rfe()-function).的卡雷特包有一个很好的实现然而,我也在考虑优化RAM和CPU的使用。这就是为什么我想知道是否有机会设置不同的(更多的)树来训练第一个森林(不排除特征),并利用它的重要性来构建剩余的树(使用RFE),例如使用500棵具有10或5倍交叉验证的树。我知道这个选项在varSelRF中是可用的。但是卡雷特呢?我在手册里没有找到任何关于这个的东西。
发布于 2012-11-12 03:25:07
你可以做到的。rfFuncs列表有一个名为fit的对象,它定义了模型的匹配方式。这个函数的一个参数叫做' first‘,这在第一次匹配时是正确的(也有一个“最后”arg)。您可以基于此设置ntree。
有关更多细节,请参见功能选择小片段。
最大值
https://stackoverflow.com/questions/13330302
复制相似问题