我们看看官方文档怎么说的:智能结构化(Smart Structure Optical Character Recognition )融合了业界领先的深度学习技术、图像检测技术以及OCR大模型能力,能够实现不限版式的结构化信息抽取。无论是固定卡证还是复杂的物流单据,均可实现智能识别。该产品预学习建立键值对应关系,支持客户定制模板,提升数据提取录入效率,适用于政务、票据核销、行业表单和国际物流等场景。
我总结一下:智能结构化不只是常规的OCR了,还融合了AI深度学习和图片监测,较比常规的OCR识别,可以自定义模板进行精准匹配了。
基础识别准确率超过98%,文本结构化准确率超过85%。识别成功率还是相当高的。
举例几种场景:
也就是说,只要有单据产生的环节,都可以考虑通过智能结构化来优化常规的OCR识别,来更加简化工作。
为了使用车辆信息识别能力,我们需要进行一些准备工作。
产品官网/文档:智能结构化OCR_定制模板OCR_自定义文字识别

产品demo体验:OCR Demo
可以看到。我体验了一个基础的识别功能。增加了一个单独的字段: Final .识别服务直接将 Final 这个结构块中的数据直接提取出来了。这样我们就可以针对比如发票等进行定制化快速获取了。

点击开通服务后,会进入到以下页面。
成功后会赠送免费的资源包供测试使用,50~1000次的免费额度。当免费资源包用尽后,那就需要付费调用接口了。
我们可以着重对接 : 常用工具- API Explorer 这里可以在浏览器中测试。并下载相应的SDK资源。

API Explorer可以快速通过浏览器发起识别请求,并可下载对应的sdk快速在项目中使用。

我们来测试一个:

返回结果:
{
"Response": {
"Angle": 0,
"RequestId": "5a988714-22b2-4f2d-a8ef-c12d2ef9118b",
"StructuralList": [
{
"Groups": [
{
"Lines": [
{
"Key": {
"AutoName": "号码",
"ConfigName": null
},
"Value": {
"AutoContent": "京Q58A77",
"Coord": {
"LeftBottom": {
"X": 0,
"Y": 0
},
"LeftTop": {
"X": 0,
"Y": 0
},
"RightBottom": {
"X": 0,
"Y": 0
},
"RightTop": {
"X": 0,
"Y": 0
}
}
}
}
]
}
]
}
],
"WordList": []
}
}上面是一个基础的测试。还没有使用结构化的具体功能点。我们再来一个发票的。
在ImageBase64处上传下方的发票图,在ItemNames处,我们单独只提取发动机号码。可以看到快速的进行识别了。


{
"Response": {
"Angle": 0,
"RequestId": "3b9ec087-b805-462b-b0c4-d9b02daf2640",
"StructuralList": [
{
"Groups": [
{
"Lines": [
{
"Key": {
"AutoName": "发动机号码",
"ConfigName": null
},
"Value": {
"AutoContent": "A06290",
"Coord": {
"LeftBottom": {
"X": 0,
"Y": 0
},
"LeftTop": {
"X": 0,
"Y": 0
},
"RightBottom": {
"X": 0,
"Y": 0
},
"RightTop": {
"X": 0,
"Y": 0
}
}
}
}
]
}
]
}
],
"WordList": []
}
}在API Explorer中右侧,可以的快速的查看相关的代码。这块腾讯的开发者已经为我们想的很周到了。
以JAVA为例,我们关注点在图1中已经标记出来了。核心是:下载工程和获取秘钥。
下载工程后,解析出来就是一个常规的JAVA项目。我们需要关注的是POM文件(图2)和Sample文件(图3)。
在Sample中是常规的调用接口,而调用接口是需要 SecretId 和 SecretKey 。 这也就用到了图1中的获取秘钥外链。点击可以创建(图4).
至此,代码调用就完成了。




原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。