我正努力从文字粗体的图像中获取文本。我已经把图片附在这里了。

我已经使用OpenCV倒置了图像的颜色,并将其更改为

我希望tesseract给出5作为文本输出,但是我得到了一个空值。
具有多行文本的图像。该图像中的数据不是使用psm 7、8或9提取的。

发布于 2017-03-27 14:15:39
两个图像都可以通过psm设置为7、8或9来识别。如果您使用3.x.x,则建议使用Tesseract 4.0.0 alpha来改进OCR结果,并使用--psm 9。
Page segmentation mode:
7 Treat the image as a single text line.
8 Treat the image as a single word.
9 Treat the image as a single word in a circle.希望能帮上忙。
编辑:
关于您在飞行中的附加问题,以确定要使用哪个psm,您可以检查图像高度以确定要使用的psm值。
例如,5 1的高度为80,fox消息的高度为480。使用像素值,更容易实现设置psm值的代码。
https://stackoverflow.com/questions/43030838
复制相似问题