首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何利用IBMCloud视觉识别文本提取图像数字?

如何利用IBMCloud视觉识别文本提取图像数字?
EN

Stack Overflow用户
提问于 2019-07-17 16:27:47
回答 1查看 138关注 0票数 0

我正在学习本教程:https://cloud.ibm.com/docs/services/visual-recognition?topic=visual-recognition-tutorial-recognize-text&locale=en-US#pr-ximos-passos

我的目标是阅读一份文件并制作一个内容表。内容类型为键值,类似于"VALUE 10.00"。我可以提取图像的文本,但不能提取数字。

  • 问题的背景化:

我用的是这个图像

必须提取的值:

代码语言:javascript
复制
DATA                        13/06/2016
AGENCIA/CASH                0180/2009
VALOR DEPOSITO EM DINHEIRO  50.00

但是,当我使用对视觉识别服务的以下curl调用时:

代码语言:javascript
复制
curl -u "apikey:{API_KEY}" --form "images_file=@teste1.png" "https://gateway.watsonplatform.net/visual-recognition/api/v3/recognize_text?version=2018-03-19" -k

结果(一块):

代码语言:javascript
复制
        "text": "data gigolo hora\nman/em 251\nnumero envelope 689 574\nvalor depusitd eh 4\ncpf no defusnantez 614 220\ndata lananzmnz",
        "words": [
            {
                "word": "data",
                "location": {
                    "height": 18,
                    "width": 40,
                    "left": 13,
                    "top": 10
                },
                "score": 0.6098,
                "line_number": 0
            },
            {
                "word": "gigolo",
                "location": {
                    "height": 43,
                    "width": 57,
                    "left": 146,
                    "top": 0
                },
                "score": 0.4283,
                "line_number": 0
            },
            {
                "word": "hora",
                "location": {
                    "height": 18,
                    "width": 39,
                    "left": 249,
                    "top": 11
                },
                "score": 0.6533,
                "line_number": 0
            },
            {
                "word": "man/em",
                "location": {
                    "height": 17,
                    "width": 72,
                    "left": 127,
                    "top": 35
                },
                "score": 0.8187,
                "line_number": 1
            },
            {
                "word": "251",
                "location": {
                    "height": 21,
                    "width": 30,
                    "left": 294,
                    "top": 33
                },
                "score": 0.9881,
                "line_number": 1
            },
            {
                "word": "numero",
                "location": {
                    "height": 21,
                    "width": 54,
                    "left": 12,
                    "top": 52
                },
                "score": 0.9116,
                "line_number": 2
            },

注意,有些词是很好的提取,但数字不是,我的主要目标是提取货币价值和日期。

要创建我的表,我可以使用"height"属性来知道哪个是您各自的数值。

我是怎么提取数字的?

这是葡萄牙文(BR)的文件。

EN

回答 1

Stack Overflow用户

发布于 2019-07-18 13:22:45

谢谢你对这项服务的兴趣..。然而,正如今天所提供的,这一测试版服务主要是关于英语词典的培训。尽管它可以识别短数字字符串,但它在诸如读取任意数字(如价格、序列号或车牌)等任务上做得并不好。此外,巴西葡萄牙语的词汇也很可能找不到。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57080478

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档