我正在尝试使用二进制支持向量机对一些像素进行分类。我的训练数据库由28个数据文件组成,有两个类,class1的像素数为16571,class2的像素数为313。
测试数据(每个文件)大约有600个像素,其中只有6-10个像素是类2的成员,其余的像素是class1。
我的问题是,在训练之后,当我试图对数据进行分类时,支持向量机会对class1中的所有像素进行分类。
我认为这可能是因为它很少看到来自class2的样本。但是可用的数据文件的数量是有限的(大约35个数据文件)。
如何训练支持向量机并得到合理的结果?
谢谢你的帮助。
发布于 2012-09-10 21:09:39
SVM可能确实对训练集大小的巨大差异很敏感。我建议尝试以下两种方法:
当然,您可以同时使用这两种方法,即在一定程度上限制类1的训练数据的大小,然后使用成本参数进一步平衡类。
https://stackoverflow.com/questions/10071098
复制相似问题