问购物车与随机森林
EN

Data Science用户

提问于 2020-06-18 19:33:50

回答 1查看 474关注 0票数 2

考虑到随机森林中的单个树使用cart算法(或者可以配置为)，如果cart不能预测任何东西(空树)，那么为什么随机森林在相同的数据集中表现得更好。

编辑:我使用的是R (rpart vs randomForest)，数据是股票的每日财务数据。CART给出了空树，但随机森林即使在看不见的数据上也获得了相当的准确性。

发布于 2020-06-19 08:10:39

拥有一个“森林”(套袋集合)的树木的目标是使预测更加可靠。个体决策树倾向于过度匹配，随机森林的抽样、特征选择和套袋有助于获得更强的得分。

奇怪的是，你有一棵空树，因为决策树是贪婪的，它们适合任何东西。即使数据中存在随机噪声，它们也会被分割(这在一定程度上取决于您如何配置它)。

如果你有一棵空树，随机森林不会做任何事情，因为它只是一堆决策树。

如果没有看到您的代码，或者没有其他任何东西，我猜您在某个地方出现了编码错误。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/76276

复制

相似问题

问购物车与随机森林EN