我需要从以下图片中提取文本:

如您所见,文本是打字而不是手写的。此外,背景是丰富多彩的。
我试过Tesseract OCR,虽然它在某些时候起作用,但在某些输入上却惨遭失败。对于上面的示例,它生成“Cela aicomrBi em Cela”。
您推荐哪一种命令行OCR软件?如果Tesseract是我的最佳选择,我是否可以对这些图像进行转换,使Tesseract更容易识别字符?
编辑:基于@MarcusMüller的建议,我使用convert -threshold 55%更好地将前台文本从背景中分离出来。得到的图像要好得多!

唉,魔兽世界仍然是无用的。在这个新的图像上,它产生了:"Bim KM ioes Bm Meme Cera“。
因此,这个问题仍然悬而未决。
发布于 2022-11-15 21:26:08
如果对图像进行预处理以提取前景,那么在不均匀的背景下OCR性能不好可能会有所帮助。
图像分割/前景提取技术有很多种。似乎你已经有了一个良好的结果与门槛!也许可以使用它,或者使用更高级的提取器(例如,从openCV),或者训练神经网络来为您进行分割。
还请注意,OCR可能会更好地工作与黑暗的文本在明亮的地面上,所以倒置可能是必要的。
https://unix.stackexchange.com/questions/725026
复制相似问题