首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在MRZ中使用.traineddata与passportEye Python

在MRZ中使用.traineddata与passportEye Python
EN

Stack Overflow用户
提问于 2020-08-11 05:13:14
回答 1查看 1.6K关注 0票数 2

我试图提高使用tesseract ocr和passportEye读取护照MRZ的准确性--我发现很少有包含"*.traineddata“的github存储库,它说要将它移到tesseract ocr tessdata文件夹中,我做到了。在readme中没有提到如何使用它,我相信它是一些琐碎的东西,但是我对这个tesseract非常陌生。

如何在python中使用passportEye,我在这里完全迷失了方向。搜了很多次。这是当前的代码。

代码语言:javascript
复制
import os
from passporteye import read_mrz

pr_path = os.getcwd()
file_path = os.path.join(pr_path,'my_app', 'data')
mrz = read_mrz(file_path + '/test1.jpg') 

print(mrz)

这是我想测试的更精确的.traineddata文件:最佳/best.培训数据

我不想使用笨重的openCV。请帮帮忙

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-01-07 09:29:17

通过查看源代码,如果不更改PassportEye的代码库,我会说您做不到:

通常,您会将正在使用的via:-l参数传递给tesseract --在您的示例中:

-l mrz

但是PassportEye实现没有给您这个选项:

https://github.com/konstantint/PassportEye/blob/929c186c4dfa80a1ac975b5f2b95002ca12889d0/passporteye/util/ocr.py#L48

它们通过lang=None,您需要将该部分更改为lang=mrz

代码语言:javascript
复制
pytesseract.run_tesseract(input_file_name,
                          output_file_name_base,
                          'txt',
                          lang='mrz',
                          config=config)
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63351880

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档