我正在从事一个识别名片中文本的项目,并将它们映射到适当的领域。我使用opencv进行图像处理。我需要将预处理后的图像提供给Tesseract-OCR引擎进行文本识别。这个链接规定图像至少应该有300个DPI。我的图像像素大小为2560x1536,72 DPI。
发布于 2017-05-21 10:30:59
对于OCR来说,真正重要的是以像素为单位的分辨率。因为物理字符可以从微小到巨大,独立于采集设备的DPI。
根据经验,3像素左右的笔画宽度是一个很好的开始。如果较低,则调整大小可能没有帮助,因为信息丢失。如果运行时间要高得多,那么运行时间可能会过长(或者OCR功能不会被taylored处理)。
此外,如果存在不匹配,请检查包不会试图在内部调整大小,这是基于其自己的笔画宽度假设和存储在标头中的DPI信息。
https://stackoverflow.com/questions/44095676
复制相似问题