文章/答案/技术大牛

发布

问用pytesser识别简单数字
EN

Stack Overflow用户

提问于 2014-06-16 16:02:21

回答 1查看 2.2K关注 0票数 3

我正在使用PyTesser和Tesseract学习OCR。作为第一个里程碑，我想编写一个工具来识别captcha，它只是由一些数字组成。我读了一些教程并编写了这样一个测试程序。

from pytesser.pytesser import *
from PIL import Image, ImageFilter, ImageEnhance

im = Image.open("test.tiff")
im = im.filter(ImageFilter.MedianFilter())
enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(2)
im = im.convert('1')
text = image_to_string(im)
print "text={}".format(text)

我用下面的图像测试了我的代码。但结果是2(T?770。我还测试了其他一些类似的图像，在80%的情况下，结果是不正确的。

我不熟悉成像处理。我有两个问题：

能告诉PyTesser只猜测数字吗？
我认为这个图像对人类来说很容易读懂。如果PyTesser很难只读取数字图像，那么有什么替代方法可以做更好的OCR呢？

任何提示都非常感谢。

python

python-imaging-library

ocr

pytesser

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-06-17 06:34:40

我觉得你的代码很好。它可以识别207770。问题在于pytesser的安装。Tesseract in pytesser已经过时了.您可以下载最新版本并覆盖相应的文件。您还可以编辑pytesser.py并更改

tesseract_exe_name = 'tesseract'

至

import os.path
tesseract_exe_name = os.path.join(os.path.dirname(__file__), 'tesseract')

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/24247813

复制

相似问题

问用pytesser识别简单数字
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用pytesser识别简单数字EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用pytesser识别简单数字
EN