我已经阅读了很多关于最近邻问题的论文,似乎像随机kd-树或LSH这样的索引技术已经成功地应用于基于内容的图像检索(CBIR),它可以在高维空间中工作。一个非常常见的实验是给出一个SIFT查询向量,在数据集中找到最相似的SIFT描述符。如果我们用所有检测到的SIFT描述符重复这个过程,我们可以找到最相似的图像。
然而,另一种流行的方法是使用视觉词袋并将检测到的所有SIFT描述符转换为一个巨大的稀疏向量,该向量可以用相同的文本技术(例如倒排索引)进行索引。
,我的问题是:这两种不同的方法(通过最近邻技术匹配SIFT描述符与SIFT描述符+反向索引上的特性包)是非常不同的,我不知道哪一种更好。
如果第二种方法更好,那么最近邻在计算机视觉/图像处理中的应用是什么?
发布于 2016-10-05 20:00:04
哦,天哪,你在问一个连报纸都回答不了的问题,我想。为了进行比较,我们应该采用这两种方法的最新技术,并对它们进行比较,测量速度、准确性和回忆能力。最好的一个比另一个好。
就我个人而言,我并没有听说太多的视觉词汇,我只在文字相关的项目中使用了单词包模型,而不是与图像相关的。此外,我确信我已经看到很多人使用了第一种方法(包括我和我们的研究)。
这是我得到的最好的,所以如果我是你,我会找一篇比较这两种方法的论文,如果我找不到这两种方法的最佳代表,我会找到这两种方法的最佳代表(你发布的链接有一篇2009年的论文,我想这是旧的),并检查他们的实验。
但要小心!为了比较最好的代表的方法,你需要确保每一篇论文的实验都是超相关的,使用的机器是相同的“力量”,使用的数据是相同的性质和大小,等等。
https://stackoverflow.com/questions/39871226
复制相似问题