首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何为Tesseract标注培训数据

如何为Tesseract标注培训数据
EN

Stack Overflow用户
提问于 2022-06-21 11:25:16
回答 2查看 449关注 0票数 1

我想训练我自己的模型,用Tesseract检测和识别身份证。我想从它中提取像名字,id这样的关键信息。数据看起来像:数据示例

培训的引入只能输入单行文本,我很困惑如何在Tesseract中训练检测模型,应该在单个字符上标注还是在每个框中标注整个文本行。(https://github.com/tesseract-ocr/tesstrain) 在这里输入图像描述

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2022-06-22 03:02:04

哦,我想我明白了。Tesseract不需要一个检测模型来获取文本行的位置,它识别每个blob(字母),并使用每个字母的位置来定位文本行。

票数 0
EN

Stack Overflow用户

发布于 2022-06-21 11:47:43

1 O_ne Character R_eplacement从图像到文本是基于分组训练的。

因此,在第一个测试样本中,我们的想法是让tesseract理解ch连接是作为两个字母输出的,δ是小写d,fk,Uber是Aber等等。

然而,如果没有公认的字符排列字典,这就无法正确拼写单词,因此,您需要训练所有您可以预期的单词,比如123是允许的,而不是321,或者是您允许所有的数字。

那么问题是¦应该是i | l or 1 !吗?而且只有人类的智能语境才有可能同意什么是100%正确的,特别是当斜体是/ = i | l or 1 !还是斜体/时?

与背景相比,字符越清晰,通常会产生最好的效果,字符内部定义的空白有助于区分B8,因此分辨率也是一个帮助或阻碍。

= INT 3O 80 S~A MARIA

在这种情况下,BOSTA的字典条目可能会有所帮助。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72699938

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档