首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >10个随机森林,每个森林在相同的数据上有50棵树,等于一个随机森林在相同的数据上,有500棵树?

10个随机森林,每个森林在相同的数据上有50棵树,等于一个随机森林在相同的数据上,有500棵树?
EN

Stack Overflow用户
提问于 2019-07-05 23:14:38
回答 1查看 38关注 0票数 0

我有一个有一百万行的数据集。

当运行一个包含500棵树的随机生存森林时,由于内存问题,在R中使用randomForestSRC包需要很长时间。

那么,我可以运行10个随机存活森林,在相同的数据上有50棵树,每次使用不同的种子,并平均10个随机森林的结果(除以10),这样我就可以得到与500棵树的结果相当相似的结果吗?

EN

回答 1

Stack Overflow用户

发布于 2019-07-09 18:48:18

是的,结果应该是相似的。随机森林就是决策树的集合。以后添加更多树没有问题,只要您对10组50棵树中的每一组使用相同的数据和参数即可。此外,你可以看看随机森林算法的更有效的版本,例如package ranger,它也可以做存活森林,iirc。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56905647

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档