目前,我正在处理实现一个用于对象识别(详细介绍对象分类)的CBIR系统,现在,由于我有一些可用的特征检测器和-descriptors,我试图找到处理这些特征的最佳方法,以完成基于内容的图像检索任务。
据我所知,这项任务有两个主要趋势,离散的和连续的方法。其中,离散代表像bag-of-visual words和codebooks这样的方法,用于建立倒排索引,以应用引用文本检索的方法,而连续代表像带有k-d树的Best Bin First search和最近邻分类这样的方法。
因此,这两种方法之间的一个主要区别是,一种方法使用视觉单词等特征的额外表示,另一种方法使用从描述符计算出的n-D特征。
我现在的问题是,这两种CBIR方法之间是否有任何比较,可以帮助我找到适合我的任务的最佳方法?
发布于 2012-07-20 15:40:46
这个问题的完整答案是相当复杂和冗长的。但通常情况下,连续方法可以提供更准确的结果,但速度较慢,因为您可以有效地构建搜索索引,并且您需要使用较大的描述符。
您应该考虑将离散特征(视觉单词)用于初始结果的组合,然后使用连续方法过滤结果集。
https://stackoverflow.com/questions/10710667
复制相似问题