我正在实施滑动窗口技术来开发照片OCR,即从图片中剪切一个特定大小的矩形,并检查它是否包含文本。然后,矩形再次被移动了一些像素。但是这种滑动窗口技术需要花费大量的时间。例如,处理1366x768的图片需要6个小时,步长为2,窗口大小为20x25。有没有其他技术可以帮助或如何加快这一过程?
我正在用java编写代码。
发布于 2012-11-27 21:34:42
如果不知道算法/代码的任何细节,就很难给出一个具体的建议。您可以考虑以下几个潜在的性能改进:
发布于 2012-11-30 12:34:34
滑动窗口方法是蛮力的,因此,本质上是非常慢的。也许您应该看看基于显着性的技术,这些技术使用过滤器来确定要处理的图像区域的优先级。
这里有一篇我比较熟悉的论文: B. Draper和A. Lionelle。“相似性转换下选择性注意的评估”,视觉与图像理解,100:152-171,2005
最后,您使用的是哪个ANN库?确保你的ANN代码正在进行矩阵/向量运算,并且它们是尽可能优化的!
https://stackoverflow.com/questions/13585104
复制相似问题