我想知道是否有任何技术/API可以用于快速屏幕字体OCR?
以下是理所当然的:
OCR的文本应来自屏幕截图,并应使用屏幕字体
,
因此,我认为这并不像做“真实的”OCR那样复杂:找到基线和“裁剪”每个字符非常容易(我已经做过了)。
有没有人知道特定的技术,纸张,甚至API,允许做这样的壮举?
注意:这个问题是而不是关于屏幕抓取的。这个问题是而不是关于破坏CAPTCHA的问题。这个问题是而不是关于普通OCR的(就像OCRing中的扫描文本)。这个问题是,而不是关于GUI自动化的(尽管有些人可能以这种方式使用它)。
发布于 2011-06-30 09:10:20
我对不变矩有很好的经验(例如Hu矩,但它们对于特征提取和聚类分析(我在Mahalanobis距离上获得了很好的结果)来说可能对您的目的来说太小了,因为您有预定义的方向)。
如果您对纯java解决方案感兴趣,下面是我们的SF项目:
http://sourceforge.net/projects/javaocr/
这也适用于android手机。
(欢迎帮助)
发布于 2014-09-04 09:56:01
您可以尝试实现LAMSTAR,如Daniel Graupe的“人工神经网络原理”(1997)第13章所述。
它基本上包括:
将您的“输入”划分为“子单词”(他以像素序列细分图像的例子,每列一个子词和一行一个子词)每个子词都被输入到一个动态的KSOM (Kohonen自组织映射)中,该动态KSOM将归一化的子词分类为不同数量的categories
LAMSTAR的优点是所有的东西都是可追踪的:
F 219
https://stackoverflow.com/questions/6529646
复制相似问题