首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何给OCR软件最大的成功机会?

如何给OCR软件最大的成功机会?
EN

Stack Overflow用户
提问于 2009-08-26 15:29:29
回答 4查看 1.5K关注 0票数 2

我正在使用Tesseract OCR (通过pytesser)和PIL (Python Image Library)对应用程序进行自动化测试。

多亏了tesseract,我正在通过截屏和获取文本来检查显示的文本是否正常。

我在开始的时候遇到了一些问题,它似乎工作得更好,因为我增加了截图的尺寸,这要归功于PIL的双三次插值。

不幸的是,我仍然有一些错误,比如把“0”和“O”搞混了。我可以想象,我将来还会遇到其他类似的问题。

我想知道是否有一些技术来准备图像,以帮助OCR。任何想法都是受欢迎的。

提前感谢

EN

回答 4

Stack Overflow用户

回答已采纳

发布于 2009-08-26 18:56:16

无耻的插件和免责声明:在.NET中使用的my company

Tesseract是一个OK OCR引擎。它可能会遗漏很多东西,并且很容易被非文本所迷惑。你能做的最好的事情就是确保它只得到文本。下一个最好的办法是给它一些合理的二值化(自适应或动态阈值)或灰度,让它尝试进行二值化。

票数 1
EN

Stack Overflow用户

发布于 2013-11-05 20:17:17

characters

  • Profit:)
  1. 使图像格外整洁,并且周围有足够的空闲空间:)

这里有几个真实世界的例子。

OCR是原始图像(裁剪后的功率表numbers)

  • Second图像在GIMP中略微清理过图像,tesseract

  • Third图像中约50%的
  • 准确率是完全清理过的图像- 100%无需任何训练即可识别!

票数 1
EN

Stack Overflow用户

发布于 2009-08-26 15:36:10

为了区分0和O,一个简单的解决方案是选择一种能够区分两者的字体(例如:0的中间有一个破折号或点)。这在你的应用程序中是可以接受的吗?

另一种解决方案是在文本的逐个字符分析之后应用基于字典的步骤-将识别的文本输入到某种形式的拼写检查器或验证器中,以区分困难的字符。

例如,一个后面跟着其他数字的圆形符号最有可能是零,而后面跟着字母的同一个符号最有可能是大写的o。这是一个微不足道的例子,但它表明了上下文对于制作更可靠的OCR系统是多么必要。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1335581

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档