首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Tesseract OCR无法识别数字7

Tesseract OCR无法识别数字7
EN

Stack Overflow用户
提问于 2020-11-02 23:39:31
回答 1查看 418关注 0票数 0

我在试着分析一个包含两个数字的png图像。Tesseract似乎在检测此图像中的数字7(7)时出现了问题。它将其识别为1(1)。

我的配置是:

代码语言:javascript
复制
config='--oem 1 --psm 7 tessedit_char_whitelist=0123456789'

tesseract --version返回以下内容

代码语言:javascript
复制
tesseract 4.0.0
leptonica-1.76.0
libgif 5.1.4 : libjpeg 6b (libjpeg-turbo 1.5.2) : libpng 1.6.36 : libtiff 4.1.0 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0

我已经尝试了oem和psm的值,结果没有变化。任何帮助都将不胜感激。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-11-03 00:03:57

图像中的字符太大了,我猜tesseract没有经过训练。

调整图像大小可以正常工作

代码语言:javascript
复制
tesseract cnLRQ.png stdout --oem 1 --psm 7 --dpi 70 digits
18
convert -resize 10% cnLRQ.png cnLRQ-small.png
tesseract cnLRQ-small.png stdout --oem 1 --psm 7 --dpi 70 digits
78
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64648632

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档