我正在开发Tesseract库,下面是Tesseract的输入,

在实施的第一步,我只使用了身份证的"MRZ“区域。但实际目的是扫描整个文档并获取身份证中的所有文本。
我已经通过this document和提高测试的质量,第一步是图像应该是300dpi。
1)如何将采集到的ios图像转换为300dpi?
2) Tesseract的最佳对比度和亮度水平应该是什么,才能提供最佳输出?
3)有没有其他预处理步骤可以应用于图像以获得良好的准确性?
4)为了提高精确度,推荐的图像分辨率是多少?
5)我用"int tesseract::TESSDLL_API::MeanTextConf"得到了置信度分数。有了每个字符的置信度分数,是否有可能确定如果置信度分数高于某个百分比,则识别出的字符是准确的?如果我错了,你能解释一下"MeanTextConf“方法的用法吗?
发布于 2014-09-05 12:38:04
不久前,我写了几篇关于图像预处理和“OCR如何工作得最好”的通用OCR博客文章。请在此处找到它们:http://www.ocr-it.com/user-scenario-process-digital-camera-pictures-and-ocr-to-extract-specific-numbers
一般来说,获得足够高的分辨率应该是第一步。低分辨率根本没有足够的每个字母的信息来可靠地读取字符。然后我做自适应二值化,使用阈值将图像转换为黑白,其中背景应该是空白的,字符应该保持相当清晰,没有额外的噪声或孔洞。然后,可选地,可以执行到各个字段的分段,并利用特定的设置分别处理每个字段,例如用于号码的“仅数字”,以及用于性别字段的"M|F“等。
https://stackoverflow.com/questions/25668203
复制相似问题