我知道ICR基本上用于手写(手工打印)数据识别,但我们是否可以利用ICR来提取失真(质量差)的机器打印文本呢?
如果不是,解决以下问题的最佳方法是什么?
我有一个非结构化文档,它可能运行到两个或更多个页面,文档中只有很少的日期字段是handwritten.now,我想将它转换为文本文件。我尝试了一些完整的ocr(omnipage和abbyy等)工具,其中有ICR模块可以转换为文本文件。他们擅长全页OCR,但当它遇到手写日期时,它会放置垃圾字符,而不是使用ICR模块。我不想使用表单处理工具,比如parascript和A2ia,它们都是基于位置的,它们只适用于结构化文档。
或者我们可以使用ICR来转换机器打印的文本和手写的(无论如何,在这种情况下,它将用于手动返回日期)。
在这里,我的目标是从非结构化文档中获得文本文件输出,只有很少的手写文本(如日期、数字)。
发布于 2013-04-19 17:24:56
我尝试了一些带有ICR模块的全页面ocr(omnipage和abbyy等)工具。
这是不正确的,这解释了糟糕的结果。如果您尝试了OmniPage和ABBYY FineReader的零售版本,这些软件包仅为OCR,不支持ICR。
我不想用表格处理工具
您可能必须在某种程度上,但有一些变化的方法。这必须是两种技术的结合,要么是开箱即用,要么是自己创造的,但这需要付出更多的努力,而不仅仅是安装和运行它。
今天,人们认为没有任何非结构化文本ICR软件能够提供高质量的结果。全页OCR或非结构化文本OCR (机器文本)在机器文本上产生高质量的结果,在手写上产生垃圾。你是对的,ICR意味着区域识别,它允许提供数据类型和后端字典,以改进手写识别。
对于最简单和最快的方法,这也可能是最经济和最少的劳动密集型,我将使用一个非结构化的表单处理包,如ABBYY FlexiCapture (flexicapture.shtml)。它需要一些非编程设置来“定位”区域。区域可能会改变位置,而该软件仍然会找到它们,然后使用适当的算法(OCR/ICR)读取区域内容。支持OCR,ICR,OMR (检查点),BCR (条形码)。也有内置全页OCR。我使用这个软件内部,转售它,并有超过14年的经验微调它。
为了一种可能更经济的方式,但可能需要至少两种技术的手工结合(两次购买而不是一项额外的劳动-可能在一天结束时并不是最经济的),我会使用某种类型的OCR SDK作为机器文本,和某种具有ICR能力的SDK作为手写区域。根据这些区域位置的一致性,您可能只需提供坐标。如果它们移动,则需要对区域位置进行更深入的分析,以便将它们传递给ICR。需要返回ICR认可的文本,以便插入到OCRed文本中的适当位置。
在我看来,现在有了很多可以做到这一点的工具,我会使用开箱即用的东西,而不是自己写,因为有几个主要的挑战需要解决:区域识别,两种技术集成,工作流。几年前,我们在没有现有工具的情况下进行了这种整合。
https://stackoverflow.com/questions/16078393
复制相似问题