首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >专门为渲染文本设计开源OCR引擎(屏幕截图)

专门为渲染文本设计开源OCR引擎(屏幕截图)
EN

Stack Overflow用户
提问于 2010-12-27 13:26:33
回答 3查看 2.4K关注 0票数 3

因此,我目前的个人项目是能够自动从游戏中抓取屏幕截图,对文本进行OCR,并计算给定单词的出现次数。

整个晚上我都在研究不同的OCR解决方案,我意识到大多数OCR包都是为扫描文本而设计的。如果有任何软件包可以可靠地阅读屏幕文本,那么它们远远超出了这个爱好者的预算。

我一直在浏览其他一些问题,我找到的最接近的问题是OCR engines designed for screen-reading

在我看来,阅读渲染文本应该比打印和扫描文本容易得多。线条始终是直的,任何给定的字母都将始终以完全相同的像素表示形式出现(大多数情况下,不管怎样)。另外,为什么不使用实际的字体文件(如果你有)作为识别字符的小抄呢?使用这样的系统,我们可能会达到100%的准确率。

假设你有一个小抄的字体文件,你的源图像是完美的正方形,没有噪音,你将如何从屏幕上识别字符?

(我可以预见的问题是ui线条和图像可能会混淆任何粗略的像素猜测尝试。)

如果您已经知道为屏幕阅读设计的免费/开源OCR包,请让我知道。我有点怀疑这会不会出现,因为似乎也没有其他提问者得到线索。

Python接口是首选,但乞讨者不能选择。

编辑:

为了澄清,我正在寻找一种OCR解决方案的设计建议,该解决方案专门设计用于从屏幕截图中读取文本。像tesseract (在我链接的问题中提到的)这样的流行工具充其量也很难使用,因为它们不是为这种源文件而设计的。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2011-01-01 05:04:45

所以我一直在考虑这个问题,我觉得最好的方法是计算每个斑点/字形/字符中的像素数。这应该真的会减少我需要做的区分字形的测试数量。

遗憾的是,我必须非常详细地说明字体。该软件将只能识别正确dpi的字体,正确的字体外观和粗细等。

这并不理想,我仍然希望看到有人了解更多关于渲染文本的OCR设计知识;但它适用于我有限的情况。

票数 2
EN

Stack Overflow用户

发布于 2010-12-27 13:35:34

如果你的目标是计算游戏中某些事件的发生次数,那么OCR确实不是一种正确的方法。也就是说,如果您决定使用OCR,那么tesseract-OCR是一个著名的用于执行光学字符识别的开源包。我真的不确定你在扫描和渲染文本方面是什么意思,但是tesseract可能会做得和任何可用的开源包一样好。OCR仍然是一门棘手的艺术,所以我不会期望100%的准确率。

票数 1
EN

Stack Overflow用户

发布于 2010-12-29 06:06:39

这并不完全是您想要的,但是您可能想看看Sikuli

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/4536763

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档