所以我遇到了一个小问题。假设我有一个人们过马路的视频-在这个例子中,假设摄像机看起来垂直于人们走过的方式(他们相对于摄像机直接水平行走)。
现在,我想从这段视频中数一数过马路的人数。
视频流是由20FPS的镜头组成的,我的问题是,我的AI模型评估的每一帧,每一帧都会返回X个人的数量(这不是我真正感兴趣的)。
所以问题是,我如何评估通过一系列帧的对象,而不是评估对象在任何特定帧中的存在?
我认为一种可能的方式是,当对一个人进行新的预测(比如超过90%的阈值)时,给它分配一些唯一的标识符,并尝试将该唯一标识符从一帧带到另一帧。
似乎有一种更简单的方法,有人知道吗?
发布于 2018-04-11 12:08:29
在做了更多的研究之后,我遇到了另一个稍微相关的堆栈溢出问题:tensorflow object detection API(Calculate Car speeds.)
看起来OpenCV有跟踪能力。因此,也许我会对帧平方进行初步猜测,然后如果超过某个阈值,我会建议跟踪。
为了给更多的读者参考,有一个称为"Single Object Tracker“的跟踪器,它结合了一个对象检测模型,首先评估一个正方形,然后实现一种风格的跟踪器。
https://stackoverflow.com/questions/49765257
复制相似问题