首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >为什么这个图像上的英语单词不能识别?

为什么这个图像上的英语单词不能识别?
EN

Stack Overflow用户
提问于 2020-12-25 03:31:34
回答 1查看 325关注 0票数 0

我使用tesseract 4.0来识别英语单词,但是在这个图像上失败只识别,没有任何单词被识别,

任何人都可以给小费,谢谢

代码语言:javascript
复制
    r=pytesseract.image_to_string('6.jpg', lang='eng')
    print(r)

故障图像

更新:

我试着用在线网站进行OCR。

https://www.newocr.com/

而且很管用,但为什么?

我怎么才能用tesseract来识别它呢?

EN

回答 1

Stack Overflow用户

发布于 2020-12-25 05:25:55

问题是pytesseract不是旋转不变的.因此,您需要做额外的预处理.来源

  • 我的第一个想法是用一个小角度旋转图像。
  • img = imutils.rotate_bound(cv2.imread("YD90o.png"),4)
  • 结果:
代码语言:javascript
复制
- ​

  • 如果我申请adaptive-threshold
代码语言:javascript
复制
- ​

  • 要使用pytesseract阅读,您需要设置其他配置:
代码语言:javascript
复制
-  pytesseract.image\_to\_string(thr, lang="eng", config="--psm 6")
代码语言:javascript
复制
- PSM (page-segmentation-mode) 6 is Assume a single uniform block of text. [source](https://stackoverflow.com/questions/44619077/pytesseract-ocr-multiple-config-options)
  • 结果:
代码语言:javascript
复制
- You want to get the last sentence of the image.
代码语言:javascript
复制
-  txt = pytesseract.image\_to\_string(thr, lang="eng", config="--psm 6") txt = txt.replace('\f', '').split('\n') print(txt[len(txt)-2])
代码语言:javascript
复制
- Result:
代码语言:javascript
复制
-  Continue Setub ie Gene

网站可能会使用深度学习的方法来检测图像中的单词。但是,当我使用newocr.com时,结果是:

代码语言:javascript
复制
oy Eee a
setuP me -
continve ae
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65445043

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档