我正在为一个问题编写一个机器学习解决方案,这个问题可能有多个可能的分类器,这取决于数据。所以我收集了几个分类器,每个分类器在某些条件下都比其他分类器表现得更好。我正在研究元分类策略,我看到有几种算法。有人能指出他们之间的根本区别吗?
发布于 2013-09-14 15:12:18
投票算法是一种简单的策略,在这种策略中,分类器的决策结果可以通过例如在大多数情况下出现的类来聚合。堆垛/分级策略是这一概念的generalizations。不只是简单地说"ok,我有一个方案v,我将使用它在我的k分类器中选择最好的答案“,您创建了另一个抽象层,在这里您实际上学会了预测具有k选票的正确标签。
简言之,基本的投票/堆叠/评分方法可概述如下:
v,给出答案a_1,...,a_k在a=v(a_1,...,a_k)中的结果(x_i,y_i)您得到(a_i_1,...,a_i_k),因此创建训练样本((a_i_1,...,a_i_k),y_i)并在其上训练元分类器。k分类器训练一个单独的元分类器,以预测当前点的“分类等级”,并使用它进行决策。https://stackoverflow.com/questions/18803044
复制相似问题