首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >OCR中的滑动窗口耗费大量时间

OCR中的滑动窗口耗费大量时间
EN

Stack Overflow用户
提问于 2012-11-27 21:17:44
回答 2查看 848关注 0票数 1

我正在实施滑动窗口技术来开发照片OCR,即从图片中剪切一个特定大小的矩形,并检查它是否包含文本。然后,矩形再次被移动了一些像素。但是这种滑动窗口技术需要花费大量的时间。例如,处理1366x768的图片需要6个小时,步长为2,窗口大小为20x25。有没有其他技术可以帮助或如何加快这一过程?

我正在用java编写代码。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-11-27 21:34:42

如果不知道算法/代码的任何细节,就很难给出一个具体的建议。您可以考虑以下几个潜在的性能改进:

  1. 可最大限度地减少磁盘I/O和缓存未命中。你说矩形是“从图片中剪切出来的”。如果每次“剪切”都是从磁盘中单独读取,那么效率会非常低,并且会大大增加执行时间。当你移动你的窗口(看起来是2个像素)时,新窗口中的大部分数据都是一样的,所以尽量避免重复读取这些数据,就像possible.
  2. Decrease你的窗口大小或者增加你的步长一样。这显然会影响你的结果,但根据你试图进行光学字符识别的字符大小,这可能是一个选择。
  3. 如果你正在应用卷积滤波器进行光学字符识别,请考虑通过图像的二维FFT对你的应用程序进行fast convolution,如果还没有的话。虽然您的问题不是embarrassingly parallel,但它可以相当容易地multithreaded.
票数 3
EN

Stack Overflow用户

发布于 2012-11-30 12:34:34

滑动窗口方法是蛮力的,因此,本质上是非常慢的。也许您应该看看基于显着性的技术,这些技术使用过滤器来确定要处理的图像区域的优先级。

这里有一篇我比较熟悉的论文: B. Draper和A. Lionelle。“相似性转换下选择性注意的评估”,视觉与图像理解,100:152-171,2005

最后,您使用的是哪个ANN库?确保你的ANN代码正在进行矩阵/向量运算,并且它们是尽可能优化的!

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/13585104

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档