我正在使用tess4j作为JAVA的tesseract的包装器,在图像上运行一系列的OCR。ocr的过程仍然需要大量的时间(有时甚至是5秒),我正试图加快它的速度。
我正在做我自己的图像预处理和二值化,这是没有必要的做otsu二值化。
我已经阅读了一个IOS教程,它允许跳过图形处理部分,但是我无法使用tess4j找到任何东西。
这里的图莱雅:https://github.com/gali8/Tesseract-OCR-iOS/wiki/Tips-for-Improving-OCR-Results -
“.如果您已经完成了您自己的预处理/阈值处理……您可能希望绕过内部的Tesseract阈值步骤。”
有谁知道我如何以跳过otsu二进制化的方式使用tess4j (来自JAVA)?
发布于 2015-10-21 03:35:06
检查tesseract-ocr参数列表中适用的任何设置。但是我读到,如果你发送一个二值化的图像,Tesseract将跳过图像上的阈值(来源)。
https://stackoverflow.com/questions/33239097
复制相似问题