首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >彩色背景下识别类型化文本的最佳命令行OCR软件

彩色背景下识别类型化文本的最佳命令行OCR软件
EN

Unix & Linux用户
提问于 2022-11-15 19:35:37
回答 1查看 111关注 0票数 0

我需要从以下图片中提取文本:

如您所见,文本是打字而不是手写的。此外,背景是丰富多彩的。

我试过Tesseract OCR,虽然它在某些时候起作用,但在某些输入上却惨遭失败。对于上面的示例,它生成“Cela aicomrBi em Cela”。

您推荐哪一种命令行OCR软件?如果Tesseract是我的最佳选择,我是否可以对这些图像进行转换,使Tesseract更容易识别字符?

编辑:基于@MarcusMüller的建议,我使用convert -threshold 55%更好地将前台文本从背景中分离出来。得到的图像要好得多!

唉,魔兽世界仍然是无用的。在这个新的图像上,它产生了:"Bim KM ioes Bm Meme Cera“。

因此,这个问题仍然悬而未决。

EN

回答 1

Unix & Linux用户

回答已采纳

发布于 2022-11-15 21:26:08

如果对图像进行预处理以提取前景,那么在不均匀的背景下OCR性能不好可能会有所帮助。

图像分割/前景提取技术有很多种。似乎你已经有了一个良好的结果与门槛!也许可以使用它,或者使用更高级的提取器(例如,从openCV),或者训练神经网络来为您进行分割。

还请注意,OCR可能会更好地工作与黑暗的文本在明亮的地面上,所以倒置可能是必要的。

票数 1
EN
页面原文内容由Unix & Linux提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://unix.stackexchange.com/questions/725026

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档