问决策树嵌入
EN

Data Science用户

提问于 2017-01-25 12:57:36

回答 1查看 107关注 0票数 2

为了集成一个决策树，让我来解释一下具体的情况。我已经将数据集分成了5个部分，每个协议，例如TCP、HTTP等等。现在，我已经为每个部分训练了一个决策树，并在我的测试数据集上运行了这一点。

我该如何结合这五个预测模型。我是不是..。

( a)将预测的输出(例如，1,0;1,1 )单独组合起来，然后在测试数据集上运行，以识别混淆矩阵。这是实际的类，预测的类。或

( b)我是否将树构建，然后将附加的树添加到树模型中，实际上将它们组合在一起。

哪种方法应该合适，选择一个甚至是一个很好的解决方案？

发布于 2017-01-25 13:09:51

组合经过训练的模型的流行方法是基于投票的模式:预测被视为加权选票，得票最多的类被选择为最终预测，和/或堆叠:预测被视为新训练模型中的特征。

根据当前领域的不同，其中一种方法可能会对您有所帮助。堆叠(取决于选择的金属收入者)带来了更多的自由，并且可能会带来你正在寻找的概念所不需要的复杂性，而在识别搜索空间中适合于复杂问题的子域时，投票也不会有多大帮助。

同时，在组合多个分类器时，尝试一些根本不同的方法也是值得的。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/16525

复制

相似问题

问决策树嵌入EN