提前谢谢你的帮助。
我试图在包含大约10000个样本的数据集上训练一个二进制分类器。这个数据集是不平衡的,两类之间的比率约为1:9。我想增加低级类错误分类的成本,但是无论我使用哪种方法,也不管我使用什么成本矩阵,我都得到相同的结果(基本上是一个zeroR模型的输出)。我预计,在使用逻辑回归时,不同的成本矩阵至少会出现一些差异,但情况并非如此。我用的是weka 3-7-11。我注意到只有libLinear (不是股票分类器)给出的预测与zeroR有很大的不同。我在libSVM上没有注意到这一点。我觉得很奇怪。可能是怎么回事?
发布于 2015-08-20 00:52:36
我能弄清楚到底是怎么回事。@FilipMalczak部分正确。您不能使用“更多选项”按钮下的成本矩阵工具;它不起作用。相反,您必须选择meta/CostSensitiveClassify作为分类器,然后在选项中(单击分类器的名称,而不是在下拉菜单中)分配所需的成本矩阵和实际分类器。
https://stackoverflow.com/questions/31755958
复制相似问题