我创建了一个以随机森林作为基分类器的分类集合。每个随机森林都有500棵树。合共有100个这样的森林。多数票被用作投票方案。我期望分类器比单个随机森林的性能略好一些。然而,它的性能比随机森林差得多。有人能解释原因吗?
发布于 2018-04-09 21:46:28
好的,首先:训练集不应该是测试集.使用交叉验证或类似的东西。
然后尝试不同的投票技巧,你会看到不同的结果。但是,你这样做有很大的原因,为什么500个森林的平均观点应该比一个森林的观点更好。
https://datascience.stackexchange.com/questions/30098
复制相似问题