腾讯云智能结构化实现实现车险数据快速识别

原创

小草飞上天

发布于 2024-12-18 17:36:58

5260

智能结构化能做什么？

我们看看官方文档怎么说的：智能结构化（Smart Structure Optical Character Recognition ）融合了业界领先的深度学习技术、图像检测技术以及OCR大模型能力，能够实现不限版式的结构化信息抽取。无论是固定卡证还是复杂的物流单据，均可实现智能识别。该产品预学习建立键值对应关系，支持客户定制模板，提升数据提取录入效率，适用于政务、票据核销、行业表单和国际物流等场景。

我总结一下：智能结构化不只是常规的OCR了，还融合了AI深度学习和图片监测，较比常规的OCR识别，可以自定义模板进行精准匹配了。

基础识别准确率超过98%，文本结构化准确率超过85%。识别成功率还是相当高的。

有哪些使用场景？

举例几种场景：

政事业务办理：在政务、教育、金融等行业，自动识别证件、材料，提升政事业务认证办理效率。
行业表单定制：在医疗、物流、金融等行业，实现票据表单信息的结构化识别和自动化录入。
交通行业 - 车辆违章处理系统：通过识别违章照片中的车牌号码，提高信息提取的速度与精度，减少人工干预，提升违章处理效率。
物流行业 - 快递面单自动化处理：自动识别快递面单上的关键信息如收件人姓名、地址、电话等，加快包裹分拣速度，降低错误率，提高客户满意度。
零售行业 - 商品条码即时读取：在光线不佳或条码部分受损的情况下也能准确读取条码信息，提升结账效率，缩短顾客等待时间，促进销售业绩的增长。
等等

也就是说，只要有单据产生的环节，都可以考虑通过智能结构化来优化常规的OCR识别，来更加简化工作。

使用

为了使用车辆信息识别能力，我们需要进行一些准备工作。

1、我们先简单看一下智能结构化官方的介绍。在下方图中可以点击开通服务进行结构化服务开通。

产品官网/文档：智能结构化OCR_定制模板OCR_自定义文字识别

2、官方为我们提供了功能页面体验服务，可以快速的体验识别效果。

产品demo体验：OCR Demo

可以看到。我体验了一个基础的识别功能。增加了一个单独的字段： Final .识别服务直接将 Final 这个结构块中的数据直接提取出来了。这样我们就可以针对比如发票等进行定制化快速获取了。

3、开通服务

点击开通服务后，会进入到以下页面。

成功后会赠送免费的资源包供测试使用，50～1000次的免费额度。当免费资源包用尽后，那就需要付费调用接口了。

我们可以着重对接：常用工具- API Explorer 这里可以在浏览器中测试。并下载相应的SDK资源。

4、API Explorer

API Explorer可以快速通过浏览器发起识别请求，并可下载对应的sdk快速在项目中使用。

我们来测试一个：

返回结果：

{
  "Response": {
    "Angle": 0,
    "RequestId": "5a988714-22b2-4f2d-a8ef-c12d2ef9118b",
    "StructuralList": [
      {
        "Groups": [
          {
            "Lines": [
              {
                "Key": {
                  "AutoName": "号码",
                  "ConfigName": null
                },
                "Value": {
                  "AutoContent": "京Q58A77",
                  "Coord": {
                    "LeftBottom": {
                      "X": 0,
                      "Y": 0
                    },
                    "LeftTop": {
                      "X": 0,
                      "Y": 0
                    },
                    "RightBottom": {
                      "X": 0,
                      "Y": 0
                    },
                    "RightTop": {
                      "X": 0,
                      "Y": 0
                    }
                  }
                }
              }
            ]
          }
        ]
      }
    ],
    "WordList": []
  }
}

上面是一个基础的测试。还没有使用结构化的具体功能点。我们再来一个发票的。

在ImageBase64处上传下方的发票图，在ItemNames处，我们单独只提取发动机号码。可以看到快速的进行识别了。

{
  "Response": {
    "Angle": 0,
    "RequestId": "3b9ec087-b805-462b-b0c4-d9b02daf2640",
    "StructuralList": [
      {
        "Groups": [
          {
            "Lines": [
              {
                "Key": {
                  "AutoName": "发动机号码",
                  "ConfigName": null
                },
                "Value": {
                  "AutoContent": "A06290",
                  "Coord": {
                    "LeftBottom": {
                      "X": 0,
                      "Y": 0
                    },
                    "LeftTop": {
                      "X": 0,
                      "Y": 0
                    },
                    "RightBottom": {
                      "X": 0,
                      "Y": 0
                    },
                    "RightTop": {
                      "X": 0,
                      "Y": 0
                    }
                  }
                }
              }
            ]
          }
        ]
      }
    ],
    "WordList": []
  }
}

获取代码

在API Explorer中右侧，可以的快速的查看相关的代码。这块腾讯的开发者已经为我们想的很周到了。

以JAVA为例，我们关注点在图1中已经标记出来了。核心是：下载工程和获取秘钥。

下载工程后，解析出来就是一个常规的JAVA项目。我们需要关注的是POM文件(图2)和Sample文件(图3)。

在Sample中是常规的调用接口，而调用接口是需要 SecretId 和 SecretKey 。这也就用到了图1中的获取秘钥外链。点击可以创建(图4).

至此，代码调用就完成了。

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

玩转腾讯云OCR

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

玩转腾讯云OCR

登录后参与评论

0 条评论

热度