在随机森林方法中,对每棵树随机选择一组固定大小的变量(特征)。但是一旦这个集合被冻结,树是否像一个规则的决策树算法?
我假设随机森林只不过是产生了一堆经典的“决策树”,并对最终的分类进行投票。但是在许多地方,我读到的任何描述似乎都表明了这一点;对于森林中的给定决策树,即使是在每个节点,我们也会随机地选择变量。是这样吗?
这是否意味着,在树的每个节点,我们随机选择m个变量集,为该树是固定的?还是来自培训数据集的全局变量集?然后,从选定的变量集合中,我们启发式地选择了1个变量(例如,任何一个变量最大化信息增益)-这是正确的语句吗?
发布于 2017-04-08 22:20:07
为了在随机森林中训练一棵树,从全局变量集中随机选取m个变量,并选择信息增益最大化的变量进行分割。资料来源:https://www.stat.berkeley.edu/~breiman/randomforest2001.pdf (原始随机森林纸)。
https://datascience.stackexchange.com/questions/18199
复制相似问题