我们有分布式数据中心,我们在每个数据中心建立决策树。我们的问题是将我们的购物车决策树组合成一个购物车决策树。每个数据中心中的数据与同一事件相关(例如来自光传感器的数据)。我知道如何推广方法,但它们并没有给出我们想要的结果。
有什么已知的方法可以做到这一点吗?
发布于 2016-10-20 09:20:59
你提到了两棵决策树。遍历决策树非常便宜,因此通过多个树运行一个特征实例非常快速,您可以从数据中心获取所有决策树并对结果进行平均,或者根据模型的(交叉验证)强度来衡量它。随机森林是一种强大的模型,它也以这种方式组合决策树,只不过它们是在特征的随机子集(在某些情况下也是数据的随机子集)上完成的。
https://datascience.stackexchange.com/questions/14655
复制相似问题