我必须像这样识别图片中的文本:
我尝试过Tesseract,但我对结果不是很满意。
你能给我推荐一款在“图像上的文本识别”方面比“文档上的文本识别”更准确的软件吗?
提前感谢
发布于 2019-06-28 18:55:24
不要期望Tesseract开箱即用。在将此图像放到Tesseract之前,需要对其进行一些处理。
我会做以下预处理:
这些预处理步骤真的很容易手工编程,但当然也有很多库具有这些功能。
作为起点,请看下面的内容:Preprocessing image for Tesseract OCR with OpenCV
发布于 2019-06-28 18:57:21
我不知道有没有现成的软件可以在你的特定图像上进行文本提取,而不需要很多额外的配置,但你可能可以改进你的Tesseract结果
你可以尝试对图像进行处理,以便Tesseract更容易识别它,在Tesseract完成自动调整后,使用tessedit_write_images true查看图像
这可能不是最好的,所以你可以使用许多可用的库/程序自己进行调整,你的目标应该是将其转换为黑白文本图像,并尽可能少的噪声
本文阅读:ImproveQuality
您也可以尝试为您的特定数据训练Tesseract,但这将需要更多的工作和大量的训练数据,请阅读:TrainingTesseract 4.0
https://stackoverflow.com/questions/56805455
复制相似问题