我四处寻找一个OCR库-最好是开源的-我可以在一些阿拉伯语pdf上使用它。在谷歌上搜索也没有找到任何有用的东西。我想知道是否有人知道相关的OCR库,甚至可以在相关语言(波斯语和乌尔都语可能是相关的)上工作的库,可以添加阿拉伯语支持。
任何关于如何实现这一点的一般性建议都将不胜感激。
发布于 2011-11-23 10:01:32
从3.01版本的Tessaract-ocr开始,它现在支持阿拉伯语
发布于 2011-01-16 13:22:34
我对阿拉伯语的文字识别质量一无所知,但是一些智能的谷歌搜索发现了Sakhr's Automatic Reader。这是一个商业软件。
抱歉的。这是商业性质的,而且相当昂贵。阿拉伯语可能是世界上最难进行OCR的语言之一--我想要激励一个人去做这件事需要很大的努力。
发布于 2014-08-01 23:24:07
由于阿拉伯语的本质,当涉及到OCR时,该语言是复杂的,并且没有免费或商业软件可以达到100%的准确率。
这是我的个人经验,但你可以试试IRISREadIRIS pro 14。
https://stackoverflow.com/questions/4696180
复制相似问题