给出任何图像,我想让我的分类器判断是否是向日葵。我怎样才能创建第二节课呢?将所有可能的图像({向日葵})保留在第二类中是过分的。有这方面的研究吗?目前,我的分类器在最后一层使用了神经网络。我的基础是以下教程:
我是以254x254为输入的图像。支持向量机在最后一层会有帮助吗?此外,我愿意使用任何其他的分类器/功能,可能会在这方面帮助我。
发布于 2015-06-22 14:23:35
ML的标准方法是:
1)建立模型2)尝试对一些数据进行正负训练(从训练集中pos\neg的50\50开始) 3)在测试集上验证它(再次,在测试集中尝试50\50的pos\neg示例),如果结果不太好的话:( a)尝试不同的模型?b)获取更多的数据
对于案例#b,当决定您需要哪些额外数据时,经验法则(对我来说很好)是: 1)如果分类器给出大量的假阳性(当它实际上不是向日葵时告诉它是向日葵)-得到更多的负面示例2)如果分类器给出大量的假负值(当它实际上是向日葵时,它不是向日葵)-得到更多的正面示例。
一般来说,从一些合理的数据量开始,检查结果,如果结果在训练集或测试集上是不好的-得到更多的数据。当你得到最优的结果时,停止获取更多的数据。
另一件你需要考虑的事情是,如果你使用当前数据和当前分类器的结果不好,你需要理解问题是高偏差(好的,在训练集和测试集上的结果不好),或者是一个高方差问题(在训练集上的结果很好,但是在测试集上的结果很差)。如果你有较高的偏倚问题-更多的数据或更强大的分类器肯定会有帮助。如果你有一个高方差的问题-不需要更强大的分类器,你需要做的是泛化-引入正则化,也许从你的人工神经网络中删除几个层。对抗高方差的可能方法是获取更多、更多的数据。
因此,总之,您需要使用迭代方法,并尝试逐步增加数据量,直到得到好的结果。没有魔术棒分类器,也没有简单的答案,你应该使用多少数据。
发布于 2017-04-10 10:45:05
利用CNN作为特征提取器,剥离原来用于分类的完全连通层,增加一个新的分类器是一个很好的方法。这也被称为转移学习技术,已广泛应用于深造研究社区。对于您的问题,使用单类支持向量机作为添加分类器是一个很好的选择。
具体来说,
解决问题的关键部分是单级支持向量机的实现,它也称为异常检测或新颖性检测。有关该方法的一些见解,您可以参考detection.html。
https://stackoverflow.com/questions/30962899
复制相似问题