文章/答案/技术大牛

发布

社区首页 >问答首页 >图像识别的起点？

问图像识别的起点？
EN

Stack Overflow用户

提问于 2015-12-22 13:41:58

回答 1查看 135关注 0票数 1

我有一组274张彩色图像(每幅都是200×150像素)。每一幅图像在视觉上都是不同的。我想要建立一个应用程序，接受一个向上/向下的一个基本图像集的版本，并确定最接近的匹配。

我是一名高级软件工程师，但对图像识别完全陌生。我非常感谢你对从哪里开始的建议。

image-recognition

algorithm

image-processing

computer-vision

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-12-22 20:58:30

如果你比较非常相似的图像，理论上它就足以计算出两幅图像之间的欧几里德距离。要做到这一点，图像必须具有相同的大小，因此通常需要重新绘制图像(通常，较大的图像是缩小的)。请注意，混叠问题可能在这里发生，所以请注意您的下采样算法。还有一个问题，如果你的图像没有相同的纵横比。

--但是--这在实践中几乎从来没有完成过，因为它非常慢。对于大小为WxH和3个颜色通道的N幅图像，需要进行NxWxHx3比较，这很快就变得不可行(考虑到许多用户可以拥有超过1000幅大小大于1000x1000的图像)。

通常，我们尝试将图像简化为一个更小的数组，该数组更简单地捕获图像信息，称为视觉描述符。例如，获取1024x1024x3图像并将其缩减为128长度向量。这只需要对参考图像计算一次，然后存储在适当的数据结构中。然后，我们可以比较查询图像的描述符和引用图像的描述符。

对于长度为L的描述符，计算N个图像数据集的距离的代价是N x L，而不是原始的N x W x H x 3

因此，问题是找到有效的描述符，这些描述符(a)计算成本低，(b)准确捕获图像。这仍然是一个活跃的研究领域，但我可以提出一些建议：

柱状图可能是最简单的方法，虽然他们做得很差，任何照明变化，只包含颜色信息，没有空间信息。在进行任何比较之前，请确保将直方图标准化。
知觉散列对非常相似的图像或稍微裁剪的图像很有效。请参阅这里
GIST描述符功能强大，但更复杂，参见这里

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/34417244

复制

相似问题

问图像识别的起点？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问图像识别的起点？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问图像识别的起点？
EN