我对dlib的性能进行了一段时间的评估。今天我意识到标准的人脸检测器。使用dlib::get_frontal_face_detector()方法创建)查找73x73的faces。但是我知道,如果没有重采样,dlib至少可以找到80x80个对象。据我所知,标准人脸检测器没有过采样。
我知道dlib::frontal_face_detector是一种类型胡枝子:
typedef object_detector<scan_fhog_pyramid<pyramid_down<6> > > frontal_face_detector;因此,通过读取这个类型的胡枝子,我们可以得出这样的结论,这个检测器总是将图像缩放为: 5/6 = 0,83。
那么对这种情况的解释是什么呢?真心的。
发布于 2017-01-22 12:42:54
你必须小心一些图像重采样的时间。
如果您查看dlib示例fhog_object_detector_ex.cpp,您将看到,在默认情况下,它是将图像重采样2倍,这有时是一个基于任务的好主意。如果您要检测的对象很远,并且您的图像输入很小(例如,VGA),您应该这样做(因为检测10x10对象不会有多大乐趣)。
你提到的例子是其他的东西,这是这类物体探测器的元素。5/6比率定义了图像金字塔的下采样比。这些是对某些给定图像的多尺度表示。
为什么我们需要这个(因为它会导致更多的工作):
当与滑动窗口相结合时,我们对对象的不同尺度和位置有一定的鲁棒性.
https://stackoverflow.com/questions/41790515
复制相似问题