首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Tesseract改进和图像预处理步骤

Tesseract改进和图像预处理步骤
EN

Stack Overflow用户
提问于 2014-09-04 22:33:51
回答 1查看 3.6K关注 0票数 1

我正在开发Tesseract库,下面是Tesseract的输入,

在实施的第一步,我只使用了身份证的"MRZ“区域。但实际目的是扫描整个文档并获取身份证中的所有文本。

我已经通过this document和提高测试的质量,第一步是图像应该是300dpi。

1)如何将采集到的ios图像转换为300dpi?

2) Tesseract的最佳对比度和亮度水平应该是什么,才能提供最佳输出?

3)有没有其他预处理步骤可以应用于图像以获得良好的准确性?

4)为了提高精确度,推荐的图像分辨率是多少?

5)我用"int tesseract::TESSDLL_API::MeanTextConf"得到了置信度分数。有了每个字符的置信度分数,是否有可能确定如果置信度分数高于某个百分比,则识别出的字符是准确的?如果我错了,你能解释一下"MeanTextConf“方法的用法吗?

EN

回答 1

Stack Overflow用户

发布于 2014-09-05 12:38:04

不久前,我写了几篇关于图像预处理和“OCR如何工作得最好”的通用OCR博客文章。请在此处找到它们:http://www.ocr-it.com/user-scenario-process-digital-camera-pictures-and-ocr-to-extract-specific-numbers

一般来说,获得足够高的分辨率应该是第一步。低分辨率根本没有足够的每个字母的信息来可靠地读取字符。然后我做自适应二值化,使用阈值将图像转换为黑白,其中背景应该是空白的,字符应该保持相当清晰,没有额外的噪声或孔洞。然后,可选地,可以执行到各个字段的分段,并利用特定的设置分别处理每个字段,例如用于号码的“仅数字”,以及用于性别字段的"M|F“等。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/25668203

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档