首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python-tesseract不识别任何东西。

Python-tesseract不识别任何东西。
EN

Stack Overflow用户
提问于 2018-03-06 18:18:14
回答 1查看 918关注 0票数 0

这是我要导入的图像

我的python代码

代码语言:javascript
复制
try:
    import Image
except ImportError:
    from PIL import Image
import pytesseract

print(pytesseract.image_to_string(Image.open('/home/milenko/Pictures/Screenshot from 2018-03-06 19-03-19.png')))

当我运行代码时

代码语言:javascript
复制
python a72.py 

作为输出,我得到了空的line.It没有任何意义。为什么?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-03-06 22:03:10

尝试调整您的命令,例如:其他页面分割方法,如您可以看到的默认值是“完全自动的页面分割,但没有OSD”。因此,它不执行定向和脚本检测(OSD)。

这个给了我一些输出:

代码语言:javascript
复制
print(pytesseract.image_to_string(Image.open('image.png'), config='-psm 12'))

您可以使用OpenCV为OCR准备此映像,例如:

代码语言:javascript
复制
#!/usr/bin/python

import cv2 as cv
import numpy as np
import pytesseract
import Image

from matplotlib import pyplot as plt

img = cv.imread('/tmp/image.png',0)
ret,thresh = cv.threshold(img, 220, 255, cv.THRESH_BINARY)

plt.axis('off')
plt.imshow(thresh, 'gray')
plt.show()

print(pytesseract.image_to_string(thresh, config='-psm 12'))

在接下来的步骤中,您可以将此图像划分为某些部分(x轴、y轴、趋势线),并分别为每个部分使用OCR,并为每个部分设置适当的PSM值。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/49137505

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档