我发现了一个很棒的开源图像识别框架- Pastec,它的效果非常好,我拍摄了一个物体的视频,并对10%的视频帧进行了采样,它可以很好地识别剩下的视频。
然而,当我索引了视频并在完全不同的环境中拍摄了另一张照片后,它无法识别它,即使对我来说它们看起来非常相似。
在特征提取和索引之前,我是否需要应用一些基本的处理,如阈值(二进制),平滑,可能还有轮廓?而且,如果是这种情况,我可能还需要在查询之前应用相同的技术。
在这里,我正在拍摄几乎360度的产品视频,并索引数据库中的所有帧,希望搜索到的图片将出现在训练数据中的角度。

在这个项目中,它提到了“不是为识别人脸、3D对象、条形码或二维码而设计的。”我不知道我在这里使用这个软件是不是在浪费时间,或者我还需要采用其他方法/工具/技术。
发布于 2016-09-14 06:58:19
Pastec基于Visual Words,而后者又使用本地描述符,如SIFT或SURF。这两个不是完全旋转不变的,如果视点不同,很可能会完全失败。
显然,光照的不同也会对识别能力产生巨大影响。预处理可能会有一点帮助,但不幸的是,帮助不大。我个人会使用统计或神经网络方法来解决这样的问题。
https://stackoverflow.com/questions/39479967
复制相似问题