我正在研究随机森林,我在寻找随机森林的算法。
我已经查找了决策树的算法(如ID3、C4.5、CART)。
但是,对于随机森林,有哪些不同的算法?我没有完全理解它的文学。
你能说套袋和ExtraTrees就是例子吗?
提前感谢
发布于 2019-11-19 15:23:59
任何树木集合(即森林),依靠各种方式注入random_ness来生长不同和不相关的树木,都可以被称为_random森林。随机森林的所有变体都是基于相同的原则,即我们可以使个体树越多样化,所产生的泛化误差就越低。
注入随机性的一种方法称为Aggregating ( Bootstrap ),它在发送给每棵树的数据集中注入随机性。另一种是随机子空间方法,它基本上是在每个树节点上随机抽取一个特征子集,以找到最佳(特征、值)分割(而不是考虑所有特性)。这里的随机性在于树的建立过程。ExtraTree是在树构建阶段引入随机性的又一个例子,首先通过随机选择每个特征的切点,然后选择最佳的(特征、值)分割。一个有趣的变体有意在每个基树的数据集中独立地引入标签噪声--我想你明白了。
然而,对许多人来说,“随机森林”一词实际上是指随机森林家族中最著名的成员,即布雷曼著名的纸中详细描述的变体。这基本上使用了上面讨论过的打包和随机子空间方法,仅此而已!
**数据集随机化技术,如打包或标签噪声技术,可以与决策树之外的任何算法一起使用。因此,套袋并不完全是随机森林的一个例子,它更像是随机森林的一个组成部分。
https://stackoverflow.com/questions/58934032
复制相似问题