文章/答案/技术大牛

发布

社区首页 >问答首页 >Tesseract改进和图像预处理步骤

问Tesseract改进和图像预处理步骤
EN

Stack Overflow用户

提问于 2014-09-04 22:33:51

回答 1查看 3.6K关注 0票数 1

我正在开发Tesseract库，下面是Tesseract的输入，

在实施的第一步，我只使用了身份证的"MRZ“区域。但实际目的是扫描整个文档并获取身份证中的所有文本。

我已经通过this document和提高测试的质量，第一步是图像应该是300dpi。

1)如何将采集到的ios图像转换为300dpi？

2) Tesseract的最佳对比度和亮度水平应该是什么，才能提供最佳输出？

3)有没有其他预处理步骤可以应用于图像以获得良好的准确性？

4)为了提高精确度，推荐的图像分辨率是多少？

5)我用"int tesseract::TESSDLL_API::MeanTextConf"得到了置信度分数。有了每个字符的置信度分数，是否有可能确定如果置信度分数高于某个百分比，则识别出的字符是准确的？如果我错了，你能解释一下"MeanTextConf“方法的用法吗？

ios

ios5

ocr

tesseract

回答 1

Stack Overflow用户

发布于 2014-09-05 12:38:04

不久前，我写了几篇关于图像预处理和“OCR如何工作得最好”的通用OCR博客文章。请在此处找到它们：http://www.ocr-it.com/user-scenario-process-digital-camera-pictures-and-ocr-to-extract-specific-numbers

一般来说，获得足够高的分辨率应该是第一步。低分辨率根本没有足够的每个字母的信息来可靠地读取字符。然后我做自适应二值化，使用阈值将图像转换为黑白，其中背景应该是空白的，字符应该保持相当清晰，没有额外的噪声或孔洞。然后，可选地，可以执行到各个字段的分段，并利用特定的设置分别处理每个字段，例如用于号码的“仅数字”，以及用于性别字段的"M|F“等。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/25668203

复制

相似问题

问Tesseract改进和图像预处理步骤
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Tesseract改进和图像预处理步骤EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Tesseract改进和图像预处理步骤
EN