我在寻找一种在图片中发现人类的方法。例如,关于下面的图片,我想粗略地确定有多少人在现场。我必须能够发现站立和坐着的人。我不介意不去探测物体后面的人(如巴士图片中的玻璃)。

AFAIK,这种问题很容易通过训练深层神经网络来解决。然而,我的同事希望我也能实现一种基于一般图像处理技术的检测技术。我花了几天时间寻找研究人员设计的技术,但除了基于显着性的技术(这可能很好,但我想测试几种基于老式图像处理的技术),我找不到别的东西。
我想提到的是,我对图像分割这一话题并不陌生&我曾在医学扫描中分割主动脉。然而,这项任务更容易完成,因为扫描仪具有类似的特性:在这个用例中(例如,在公共汽车中的人体检测),图像将具有非常不同的特性(例如,图像对比度可能有很大的变化,无论是白天还是晚上)。
长话短说,我想知道是否有一些用于人类检测的分割技术,考虑到图像特征有很大的差异?,给出一个有趣的尝试。
发布于 2018-03-09 05:52:29
深入学习是在图片中探测人类的唯一方法吗?
No.,这是我们知道的最好的方式吗?取决于你的情况。
最简单的检测方法是生成大量随机包围盒,然后解决作物的分类问题。下面是一些虚构的伪代码:
def detect_people(image):
"""
Find all people in image.
Parameters
----------
image : image object
Returns
-------
people : list of axis-aligned bounding boxes (aabb)
Each bounding box contains a person
"""
people = []
for aabb in generate_random_aabb(image):
crop = crop_image(image, aabb)
if is_person(crop):
people.append(crop)
return people在这种情况下,is_person可以是任何分类器,例如,在Viola-Jones目标检测框架中使用的增强决策桩。说到这一点:这很可能是没有DL的方式,但解释起来要复杂得多。
目标检测与分割
你的问题兼而有之。对象检测为实例提供了包围框(粗)。语义分割按类标记所有像素,但不区分同一类的不同实例(例如,不同的人)。实例分割就像对象检测一样,但是粒度很细,目标是像素精确的结果.
如果你对分词感兴趣,我可以推荐我的论文:语义切分综述
https://stackoverflow.com/questions/49156852
复制相似问题