首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Pytesseract将重复问号标识为不同的字符。

Pytesseract将重复问号标识为不同的字符。
EN

Stack Overflow用户
提问于 2020-09-18 14:30:24
回答 1查看 967关注 0票数 1

我裁剪了一个截图,以一个简单的例子开始。这是我想要转换为字符串的图片:

我确实使用pytesseract和opencv来处理图片:

我得到的字符串如下:

阶段4-2: 22?

我是OCR的新手,在阅读了文档和玩过不同类型的预处理之后,这是我得到的最好的结果。我的问题:

  • 为什么最后一个问号被识别,但前面的两个问号却没有被识别?
  • 是没有预料到的特殊字符的再现?
  • 为什么有"♀“?

谢谢你的帮助。

代码:

代码语言:javascript
复制
import pytesseract
import cv2


pytesseract.pytesseract.tesseract_cmd = r'C:\\Program Files\\Tesseract-OCR\\tesseract.exe'
image = cv2.imread('stage.png')

grey = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(grey, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]

cv2.imwrite("test.png", thresh)
data = pytesseract.image_to_string(thresh, lang='eng', config='--psm 7')
print(data)
EN

回答 1

Stack Overflow用户

发布于 2020-09-19 10:11:14

在进一步的游戏后,调整图片大小,并将其水平拉伸1.5倍,我得到了正确的解决方案。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63957690

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档