首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >ADHoc信息检索

ADHoc信息检索
EN

Stack Overflow用户
提问于 2017-08-16 05:37:58
回答 1查看 64关注 0票数 1

我想从图像收据中提取总账单。我可以提取图像中存在的整个数据,但现在我遇到了一个问题,即只提取我需要的信息。

这是我的图像。

我正在粘贴从图像中提取的信息

代码语言:javascript
复制
m cm lnnk 3mm: :33; no 1 z m
x Visut all! ms“; (or nulnunn mfn an an: nan.



Sub Iota] 19.56
TOTAL 19.56
VISA 1956
Fun 19.56
D!!! You Know 0



For ureat-tastlru dessens under 200
cahries, try our Triple Berry Frozen
Yogurt Sunda: a dish of Frozen Yogurt.
or a Vanma rozen Vugurt Done.

从这些数据中,我只想提取总账单。为了实现这一点,我发现我可以使用Ad Hoc标准化(Adhoc retrieval)。有人能提供一些关于即席检索的见解吗?如果有任何其他选择从图像中提取数据,请让我这样做。我正在使用tesseract来提取此信息。有时它不会给出适当的输出。我需要一些帮助来即兴修改tesseract给出的输出。

EN

回答 1

Stack Overflow用户

发布于 2017-10-02 18:12:47

在这种情况下,为什么需要即席检索?由于您将从收据中获得OCR结果,因此您只需对"TOTAL“旁边出现的项目执行常规文本搜索即可。

有一些用于图像文本搜索的算法,但对于这样一个简单的应用程序来说,除非有很好的理由,否则这似乎有点过头了。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45701953

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档