首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >随机林的可能算法

随机林的可能算法
EN

Stack Overflow用户
提问于 2019-11-19 12:22:11
回答 1查看 163关注 0票数 2

我正在研究随机森林,我在寻找随机森林的算法。

我已经查找了决策树的算法(如ID3、C4.5、CART)。

但是,对于随机森林,有哪些不同的算法?我没有完全理解它的文学。

你能说套袋和ExtraTrees就是例子吗?

提前感谢

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-11-19 15:23:59

任何树木集合(即森林),依靠各种方式注入random_ness来生长不同和不相关的树木,都可以被称为_random森林。随机森林的所有变体都是基于相同的原则,即我们可以使个体树越多样化,所产生的泛化误差就越低。

注入随机性的一种方法称为Aggregating ( Bootstrap ),它在发送给每棵树的数据集中注入随机性。另一种是随机子空间方法,它基本上是在每个树节点上随机抽取一个特征子集,以找到最佳(特征、值)分割(而不是考虑所有特性)。这里的随机性在于树的建立过程。ExtraTree是在树构建阶段引入随机性的又一个例子,首先通过随机选择每个特征的切点,然后选择最佳的(特征、值)分割。一个有趣的变体有意在每个基树的数据集中独立地引入标签噪声--我想你明白了。

然而,对许多人来说,“随机森林”一词实际上是指随机森林家族中最著名的成员,即布雷曼著名的中详细描述的变体。这基本上使用了上面讨论过的打包和随机子空间方法,仅此而已!

**数据集随机化技术,如打包或标签噪声技术,可以与决策树之外的任何算法一起使用。因此,套袋并不完全是随机森林的一个例子,它更像是随机森林的一个组成部分。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58934032

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档