我想训练我自己的模型,用Tesseract检测和识别身份证。我想从它中提取像名字,id这样的关键信息。数据看起来像:数据示例

培训的引入只能输入单行文本,我很困惑如何在Tesseract中训练检测模型,应该在单个字符上标注还是在每个框中标注整个文本行。(https://github.com/tesseract-ocr/tesstrain) 在这里输入图像描述
发布于 2022-06-22 03:02:04
哦,我想我明白了。Tesseract不需要一个检测模型来获取文本行的位置,它识别每个blob(字母),并使用每个字母的位置来定位文本行。


发布于 2022-06-21 11:47:43
1 O_ne Character R_eplacement从图像到文本是基于分组训练的。
因此,在第一个测试样本中,我们的想法是让tesseract理解ch连接是作为两个字母输出的,δ是小写d,f是k,Uber是Aber等等。

然而,如果没有公认的字符排列字典,这就无法正确拼写单词,因此,您需要训练所有您可以预期的单词,比如123是允许的,而不是321,或者是您允许所有的数字。
那么问题是¦应该是i | l or 1 !吗?而且只有人类的智能语境才有可能同意什么是100%正确的,特别是当斜体是/ = i | l or 1 !还是斜体/时?
与背景相比,字符越清晰,通常会产生最好的效果,字符内部定义的空白有助于区分B和8,因此分辨率也是一个帮助或阻碍。

= INT 3O 80 S~A MARIA
在这种情况下,BO和STA的字典条目可能会有所帮助。
https://stackoverflow.com/questions/72699938
复制相似问题