首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在windows XP上运行的开源OCR库

在windows XP上运行的开源OCR库
EN

Stack Overflow用户
提问于 2013-04-24 15:09:36
回答 5查看 1.8K关注 0票数 0

我在找在windows XP上运行的开放源码的OCR库。我需要这为图像和PDF的工作。大多数情况下,我想从java接口这个库。你知道有没有可用的东西?

致以问候。

EN

回答 5

Stack Overflow用户

发布于 2013-04-24 15:12:47

检查Tesseract

Tesseract可能是可用的最精确的开源OCR引擎。与Leptonica Image Processing Library相结合,它可以读取各种图像格式,并将其转换为60多种语言的文本。它是1995年UNLV精度测试中排名前三的发动机之一。在1995至2006年间,它几乎没有做过什么工作,但从那以后,谷歌对其进行了广泛的改进。它是在Apache License 2.0下发布的。

Tesseract可以在Linux、Windows (带有VC++ Express或CygWin)、和Mac上运行

这是一个comparision table from wiki

票数 1
EN

Stack Overflow用户

发布于 2013-04-24 15:12:45

http://roncemer.com/software-development/java-ocr/

"Java OCR是一套用于图像处理和字符识别的纯java库。“

票数 0
EN

Stack Overflow用户

发布于 2013-04-24 15:13:05

我会看一下Apache Tika项目,并将其与Tesseract OCR结合起来。Apache Tika管理从各种各样的文件类型中打开和提取内容。它有一个非常可插拔的设计,所以你可以连接OCR作为输入,甚至将它的输出连接到Lucene进行搜索。它是纯Java的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/16185569

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档