我正在研究图像处理中的一个机器学习问题。我想通过使用定向梯度直方图(HOG)和支持向量机(SVM)来获得图像中对象的位置。我已经阅读了几篇关于训练SVM的文章和教程。设置是非常标准的。我已经标记了正训练图像,现在需要生成一组负训练样本。
在文献中,经常发现通过随机选择位置来生成负训练样本的方法。我还看到一些方法,在选择随机负样本的连续步骤中,检测的假阳性再次用作负训练样本。然而,我想知道,如果一个人不能从一开始就使用这种方法。因此,人们将只随机生成一个假训练样本,运行检测,并将假阳性再次放入负训练集中。对我来说,这似乎是一个相当明显的策略,但我想知道我是否遗漏了什么。
发布于 2012-08-02 18:31:32
这种方法背后的理论是由P. Felzenszwalb,R. Girshick,D. McAllester,D. Ramanan在他们的PAMI论文中在Object Detection with Discriminatively Trained Part Based Models中提出的。本质上,你开始的负集并不重要,如果你迭代地添加硬样本( SVM差值> -1),你总是会收敛到同一个分类器。从单个负数开始只会使收敛变慢。
发布于 2012-08-01 22:53:29
对我来说,这听起来像是你想在线/增量地训练SVM分类器,即用新样本更新分类器。这些方法通常只在新数据随着时间的推移而出现时才会使用。在您的案例中,您似乎可以生成一整套负训练样本,因此不需要对其进行增量训练。我倾向于说,在一次运行中训练分类器比增量地训练分类器要好(正如larsmans所暗示的那样)。
发布于 2012-08-02 17:43:02
(再说一次,我不是图像处理专家,所以对此持保留态度。)
我想知道,如果一个人不能从一开始就使用这种方法。
您需要一些方法来检测分类运行中的误报。要做到这一点,你需要一个基本的事实,也就是,你需要一个人在循环中。实际上,你就是在做active learning。如果这就是你想要做的,你也可以从一堆手工标注的负面例子开始。
或者,您可以将其设置为PU learning问题。我不知道这是否适用于图像,但对于文本分类,它有时是有效的。
https://stackoverflow.com/questions/11761119
复制相似问题