文章/答案/技术大牛

发布

社区首页 >问答首页 >在MRZ中使用.traineddata与passportEye Python

问在MRZ中使用.traineddata与passportEye Python
EN

Stack Overflow用户

提问于 2020-08-11 05:13:14

回答 1查看 1.6K关注 0票数 2

我试图提高使用tesseract ocr和passportEye读取护照MRZ的准确性--我发现很少有包含"*.traineddata“的github存储库，它说要将它移到tesseract ocr tessdata文件夹中，我做到了。在readme中没有提到如何使用它，我相信它是一些琐碎的东西，但是我对这个tesseract非常陌生。

如何在python中使用passportEye，我在这里完全迷失了方向。搜了很多次。这是当前的代码。

import os
from passporteye import read_mrz

pr_path = os.getcwd()
file_path = os.path.join(pr_path,'my_app', 'data')
mrz = read_mrz(file_path + '/test1.jpg') 

print(mrz)

这是我想测试的更精确的.traineddata文件：最佳/best.培训数据

我不想使用笨重的openCV。请帮帮忙

tesseract

python-tesseract

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-01-07 09:29:17

通过查看源代码，如果不更改PassportEye的代码库，我会说您做不到：

通常，您会将正在使用的via：-l参数传递给tesseract --在您的示例中：

-l mrz

但是PassportEye实现没有给您这个选项：

https://github.com/konstantint/PassportEye/blob/929c186c4dfa80a1ac975b5f2b95002ca12889d0/passporteye/util/ocr.py#L48

它们通过lang=None，您需要将该部分更改为lang=mrz

pytesseract.run_tesseract(input_file_name,
                          output_file_name_base,
                          'txt',
                          lang='mrz',
                          config=config)

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/63351880

复制

相似问题

问在MRZ中使用.traineddata与passportEye Python
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在MRZ中使用.traineddata与passportEye PythonEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在MRZ中使用.traineddata与passportEye Python
EN