我需要一些库,将执行字符识别从西里尔字母。我只有一个想法将字母从西里尔语映射到拉丁语,但它的质量很差。有没有人能告诉我有没有自由党。或者其他任何解决这个问题的方法?
提前谢谢。
发布于 2012-01-10 17:29:54
据我所知,目前还没有原生的开源Java OCR。有一些Java包装了对本机接口的调用,例如,对于最流行的开源OCR引擎之一- Tesseract (http://groups.google.com/group/tesseract-ocr/) -有一些Java包装器,如tesjeract (http://code.google.com/p/tesjeract/)或Tess4J (http://tess4j.sf.net/)。这可以为您工作,但它是相当困难的设置,并将需要开发图像预处理和字体培训在您这边。
另一个解决方案可能是云服务。它要求最终用户应用程序具有internet连接,但它独立于您的编程语言选择和资源限制。看看ABBYY Cloud OCR SDK,它是ABBYY最近推出的一个基于云的OCR SDK。它是测试版,所以现在它是完全免费的,而且它有一个现成的Java code samples。
发布于 2012-01-09 18:15:43
虽然它不是用Java语言编写的,但当涉及到光学字符识别时,我建议使用开源的Ocropus system http://code.google.com/p/ocropus/
此外,此帖子还讨论了Java OCR解决方案Java OCR implementation
此外,如果你只是想要一些特别的解决方案,你可以尝试Google Docs OCR http://googlesystem.blogspot.com/2009/09/google-docs-ocr.html
https://stackoverflow.com/questions/8786643
复制相似问题