我正在对扫描的文本页面进行文本识别,最近开始尝试Tesseract。我意识到它有时会在一些任务中挣扎,所以我在一个领域中创建了一个感兴趣的区域,在那里我将不需要识别任何到两个字符,如下所示:

我做了一些清理,以获得这个"C“字符,但是,在Tesseract上运行图片:
$ tesseract image.png stdout它仍然无法识别它,我得到了以下输出:
Warning. Invalid resolution 0 dpi. Using 70 instead.
Estimating resolution as 275
Empty page!!
Estimating resolution as 275
Empty page!!它有什么理由在这项看似简单的任务中失败吗?
发布于 2020-02-23 15:37:46
是的,是这样的。原因是你没有read documentation。首先阅读文档,然后搜索tesseract用户论坛,然后搜索,然后再来询问问题,并描述您已经尝试过的技术。
https://stackoverflow.com/questions/60356199
复制相似问题