首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在OCR/tesseract/OpenCV中,有没有什么方法可以从图像的特定区域提取文本?

在OCR/tesseract/OpenCV中,有没有什么方法可以从图像的特定区域提取文本?
EN

Stack Overflow用户
提问于 2019-06-12 19:39:02
回答 2查看 858关注 0票数 1

我正在设置一种新的发票提取方法使用AI,我能够识别发票图像中的"Total"/"Company Details“,但需要通过指定图像中的区域(Xmin,Xmax,Ymin,Ymax)从发票图像中识别的特定区域提取数据?

EN

回答 2

Stack Overflow用户

发布于 2019-06-12 20:17:09

AWS最近推出了一项名为Textract的服务,它完全可以实现您想要实现的目标。

博客文章+示例:https://aws.amazon.com/blogs/machine-learning/automatically-extract-text-and-structured-data-from-documents-with-amazon-textract/

您可以提供图像,PDF和Excel文件,它提取和转换任何文本为对象。我还没有使用这项服务,但计划在周末使用。

Python示例如下:

代码语言:javascript
复制
import boto3

# Document
s3BucketName = "ki-textract-demo-docs"
documentName = "simple-document-image.jpg"

# Amazon Textract client
textract = boto3.client('textract')

# Call Amazon Textract
response = textract.detect_document_text(
    Document={
        'S3Object': {
            'Bucket': s3BucketName,
            'Name': documentName
        }
    })

#print(response)

# Print detected text
for item in response["Blocks"]:
    if item["BlockType"] == "LINE":
        print ('\033[94m' +  item["Text"] + '\033[0m')
票数 2
EN

Stack Overflow用户

发布于 2019-06-12 20:10:54

看起来你是新鸟,所以让我帮助你快速演练理解你的关键字中使用的术语。

OCR是光学字符识别的概念,Tesseract是用于OCR的特殊库处理。OpenCV在图像处理库中提供帮助,帮助进行目标检测和识别。

可以,如果文本超过300dpi,您可以使用tesseract库从图像中提取文本,但在此之前,如果文本的字体对系统非常新或未知,则应使用该字体训练tesseract模型。

还请记住,如果您能够在调用tesseract之前对文本进行框图像处理,它将更准确地工作。

某些文字框图像,dpi将创建警报,但这些是您工作的核心概念。

我的建议是,如果你想从图像中提取数字,请一步一步地进行。

  • 通过增强其对要提取区域的quality.
  • Detect来处理图像。
  • 找到等高线和面积。
  • 将其传递给长方体图像编辑器并调整参数
  • 最后将其提供给Tesseract。
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56561357

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档