为了集成一个决策树,让我来解释一下具体的情况。我已经将数据集分成了5个部分,每个协议,例如TCP、HTTP等等。现在,我已经为每个部分训练了一个决策树,并在我的测试数据集上运行了这一点。
我该如何结合这五个预测模型。我是不是..。
( a)将预测的输出(例如,1,0;1,1 )单独组合起来,然后在测试数据集上运行,以识别混淆矩阵。这是实际的类,预测的类。或
( b)我是否将树构建,然后将附加的树添加到树模型中,实际上将它们组合在一起。
哪种方法应该合适,选择一个甚至是一个很好的解决方案?
发布于 2017-01-25 13:09:51
组合经过训练的模型的流行方法是基于投票的模式:预测被视为加权选票,得票最多的类被选择为最终预测,和/或堆叠:预测被视为新训练模型中的特征。
根据当前领域的不同,其中一种方法可能会对您有所帮助。堆叠(取决于选择的金属收入者)带来了更多的自由,并且可能会带来你正在寻找的概念所不需要的复杂性,而在识别搜索空间中适合于复杂问题的子域时,投票也不会有多大帮助。
同时,在组合多个分类器时,尝试一些根本不同的方法也是值得的。
https://datascience.stackexchange.com/questions/16525
复制相似问题