您好,我刚刚在.NET中尝试了一个用于光学字符识别的组件,结果相当不准确。以前有没有其他人走过这条路?你能为我推荐一条路径来节省我评估大量产生不满意结果的组件的时间吗?
任何建议都非常感谢。我不介意自己购买或编写代码。只要效果最好,性价比最高的。
谢谢
发布于 2009-04-08 08:45:45
我们在我们的项目中使用了Abby Fine Reader SDK。它附带了一个COM对象,您可以在.Net应用程序中使用该对象。发动机的成功已经足够了。
发布于 2009-04-08 08:52:55
ABBYY的组件非常昂贵。我已经评估了飞马ImagXpress和Atalasoft DotImage,虽然我发现DotImage在整页OCR上更准确,但某些难以识别的小部分文本最好用ImagXpress阅读。我建议你尝试一下这两个版本的演示版本,看看哪一个最适合你的需求。
发布于 2013-08-06 09:00:49
有关替代引擎的信息,请参阅https://stackoverflow.com/a/18070183/852208。
您的准确性问题可能与库本身有关。但是,它更有可能是您正在使用的图像源。考虑下面的tips
文本注意事项
不应在某些材料上尝试
在1850年前出版的大多数文本上。对于某些语言(例如,
德语)截止日期可能更晚。在尝试创建
通过OCR对这些材料进行转录,详细分析和
通常需要实验来判断客户之间的权衡
光学字符识别和键盘选项。旧的和变色的光学字符识别文档必须在RGB模式下扫描才能捕获所有图像数据,并且要最大化光学字符识别accuracy.
影响OCR准确性的扫描注意事项包括:
https://stackoverflow.com/questions/729067
复制相似问题