考虑到随机森林中的单个树使用cart算法(或者可以配置为),如果cart不能预测任何东西(空树),那么为什么随机森林在相同的数据集中表现得更好。
编辑:我使用的是R (rpart vs randomForest),数据是股票的每日财务数据。CART给出了空树,但随机森林即使在看不见的数据上也获得了相当的准确性。
发布于 2020-06-19 08:10:39
拥有一个“森林”(套袋集合)的树木的目标是使预测更加可靠。个体决策树倾向于过度匹配,随机森林的抽样、特征选择和套袋有助于获得更强的得分。
奇怪的是,你有一棵空树,因为决策树是贪婪的,它们适合任何东西。即使数据中存在随机噪声,它们也会被分割(这在一定程度上取决于您如何配置它)。
如果你有一棵空树,随机森林不会做任何事情,因为它只是一堆决策树。
如果没有看到您的代码,或者没有其他任何东西,我猜您在某个地方出现了编码错误。
https://datascience.stackexchange.com/questions/76276
复制相似问题