为什么在某些情况下,具有n_estimators =1的随机林执行的性能比决策树差,即使在将引导设置为false之后?
尝试使用不同的机器学习模型来预测信用卡的违约率,我尝试了随机森林和决策树,但随机森林的表现似乎较差,然后尝试了只有一棵树的随机森林,因此它应该与决策树相同,但性能仍然较差。
发布于 2022-11-03 16:34:50
对您的观察的具体答案取决于您正在使用的决策树(DT)和随机森林(RF)方法的实现。尽管如此,有三个最可能的原因:
如果所有这些都匹配,那么差异应该是很小的。如果仍然存在差异(即“在某些情况下”),这可能是由于初始化的随机性和贪婪的学习方案导致了次优树。这是RFs的主要原因,在RFs中,集成多样性被用来缓解这些问题。
https://stackoverflow.com/questions/74305884
复制相似问题