我对计算机视觉很陌生。我正在从事一个研究项目,其目标是(1)从图像和视频中检测车辆,然后(2)能够跟踪行驶中的车辆。
我正处于收集训练数据的初始阶段,我非常关心的是获取图像,这些图像具有最佳的分辨率来进行检测和跟踪。
有什么想法吗?我得到的当前数据集(来自过去的一个项目)的图像大约为1200x600像素。但有人告诉我,这可能是也可能不是探测和跟踪任务的最佳分辨率。除了考虑到我将从图像中提取类似haar的特征这一事实之外,我想不出在做出分辨率决定时包含的任何因素。在这种情况下,对于训练数据图像,有什么好的分辨率应该是什么的想法吗?
发布于 2013-11-07 09:15:00
首先,将原始图像直接输入到分类器并不能产生很好的效果,尽管有时会像人脸检测这样有用。所以你需要考虑特征提取。
一个大问题是1200x600有720,000像素。这就定义了72万个维度,由于维度爆炸,它给训练和分类带来了挑战。
因此,基本上,你需要缩小你的尺寸,特别是使用特征提取。要检测什么特征?它完全取决于域。
另一个重要的方面是速度。处理更大的图像需要更多的时间,这对于处理实时图像尤其重要,因为实时图像大约是15-30 fps。
在我的项目(见我的个人资料),它是实时的(15 was ),我是工作640x480图像和一些操作,我不得不缩小,以提高性能。
希望这能有所帮助。
https://stackoverflow.com/questions/19829571
复制相似问题