首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >面向此识别案例的OCR软件推荐

面向此识别案例的OCR软件推荐
EN

Stack Overflow用户
提问于 2019-06-28 18:41:01
回答 2查看 73关注 0票数 0

我必须像这样识别图片中的文本:

Image to recognise

我尝试过Tesseract,但我对结果不是很满意。

你能给我推荐一款在“图像上的文本识别”方面比“文档上的文本识别”更准确的软件吗?

提前感谢

EN

回答 2

Stack Overflow用户

发布于 2019-06-28 18:55:24

不要期望Tesseract开箱即用。在将此图像放到Tesseract之前,需要对其进行一些处理。

我会做以下预处理:

  1. 对图像进行模糊处理,去除一些数字噪声
  2. 自适应阈值与合适的参数
  3. 纠正图像颜色,提供白色背景和黑色文字
    • 这应该是操作简单的,只要反转颜色即可

  1. 使用正确的语言文件(我猜是意大利语?)运行Tesseract

这些预处理步骤真的很容易手工编程,但当然也有很多库具有这些功能。

作为起点,请看下面的内容:Preprocessing image for Tesseract OCR with OpenCV

票数 1
EN

Stack Overflow用户

发布于 2019-06-28 18:57:21

我不知道有没有现成的软件可以在你的特定图像上进行文本提取,而不需要很多额外的配置,但你可能可以改进你的Tesseract结果

你可以尝试对图像进行处理,以便Tesseract更容易识别它,在Tesseract完成自动调整后,使用tessedit_write_images true查看图像

这可能不是最好的,所以你可以使用许多可用的库/程序自己进行调整,你的目标应该是将其转换为黑白文本图像,并尽可能少的噪声

本文阅读:ImproveQuality

您也可以尝试为您的特定数据训练Tesseract,但这将需要更多的工作和大量的训练数据,请阅读:TrainingTesseract 4.0

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56805455

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档