当下,AI 助手已经成为越来越多职场人的效率伙伴。然而,有一道隐形的墙,始终横亘在 AI 与真实工作场景之间——那就是图片里的文字。想一想你的日常工作:堆积如山的扫描版合同、格式各异的图片简历、拍照留存的纸质票据、截图中的表格数据……这些信息以"图像"的形式存在,对于人眼来说不过是一瞥之间,但对于绝大多数 AI 助手而言,却如同一道无法逾越的鸿沟。它们"看不见",也就"读不懂",更谈不上帮你处理和分析。
这就是为什么,让 AI 拥有"眼睛",是释放其真正潜力的关键一步。
腾讯云文字识别(OCR)正是为此而生。凭借业界领先的多模态大模型,腾讯云 OCR 能够穿透复杂版式、多语言混排、模糊扫描等各类"视觉难题",将图片中的文字信息精准提取,转化为可被 AI 直接理解和处理的结构化数据。从通用高精度文字识别,到身份证、营业执照、发票、行驶证等垂直场景的专项识别,腾讯云 OCR 覆盖了企业办公中几乎所有与"图片文字"打交道的高频需求。
而现在,通过将腾讯云 OCR 技能接入 OpenClaw,这一切能力都可以无缝融入你的 AI 工作流。无需复杂的开发配置,只需几步简单操作,你的 OpenClaw 就将从一个"对不起,我无法识别这份PDF文件"的 AI 助手,进化为真正拥有"火眼金睛"的智能工作伙伴——能看、能理解、能行动。
本文将以招聘季简历批量识别与结构化录入为核心实践场景,手把手带你完成 OpenClaw 的 OCR 能力接入全流程。
准备好了吗?让我们一起解锁这项超能力!

场景痛点:
1、海量简历处理到崩溃:校招季简历像雪片般飞来,手动录入信息到手软,宝贵时间全耗在复制粘贴上!
2、奇葩格式让人抓狂:扫描件、个性排版…格式五花八门,关键信息提取难如大海捞针,一不小心就错过宝藏候选人!
3、跨国招聘效率低下:多语种简历混在一起,语言不通、版式各异,筛选效率大打折扣,人才库建设遥遥无期。
方案亮点:
只需上传简历文件,无论是多么复杂的格式、包含何种外语,使用腾讯云通用文字识别skill帮你准确识别!
● 精准识别:穿透各种奇葩排版,准确提取文字信息。
● 多语种支持:各国简历也能轻松搞定。
打开官网:https://clawhub.ai/注册并登陆,然后右上角点 Settings

然后找到 API tokens,点击 Create token,然后复制右侧的那一串 token

给 Openclaw 发送:
“请用 npm install -g clawhub@latest 安装 openclaw,用 clawhub login --token 【这里换成你的 token】登陆,然后就可以用这个工具搜索和安装 skills 了”。
给 Openclaw 发送:
"帮我通过 clawhub 安装 tencentcloud-ocr这个 skill"

完成安装后,会出现上述提示。该技能需调用腾讯云的文字识别(OCR)服务,使用前需要开通OCR功能。
1、先进入腾讯云官网 https://cloud.tencent.com/,注册一个账号,然后在产品tab中搜索“文字识别”

2、进入到文字识别页面,点击“管理控制台”

3、进入到控制台,点击“密钥管理”

4、点击“API密钥管理”并继续点击“新建密钥”,并保存好SecretId 和 SecretKey

1、由于SecretId和SecretKey属于敏感信息,建议在OpenClaw的网关中进行环境变量的配置,如下图所示

2、配置完成之后,给OpenClaw发送“你现在配置好了吗?”,确认配置生效。

3、上传简历图片,并发送“请识别简历”,简历信息会如下图结构化呈现。


至此,你已经成功为 OpenClaw 装备了腾讯云 OCR 的"眼睛"。回望整个接入过程,从注册腾讯云账号、开通文字识别服务、配置 API 密钥,到通过 Clawhub 一键安装 OCR Skill,最终实现上传简历图片即可自动结构化解析——整个流程行云流水,门槛之低,效果之惊艳,或许超出了你最初的预期。
但这仅仅是开始。
正如文章开头所说,企业办公场景中有大量关键信息被"封印"在图片里。现在,这道封印正在被逐一打破。除了本文演示的简历识别场景,腾讯云 OCR 技能矩阵还覆盖了更广泛的业务场景:
每一项技能的背后,都是腾讯云多年深耕 AI 视觉识别技术的厚积薄发,也是 OpenClaw 不断拓展能力边界的生动注脚。
AI 的价值,从来不只在于它能"说"多少,更在于它能"感知"多少。 当你的 AI 助手能够真正"看懂"你工作中的每一张图片、每一份文件、每一个场景,它才能从一个被动的问答工具,蜕变为主动参与你工作流程的智能伙伴。现在,OpenClaw 已经拥有了这双"眼睛"。接下来,就轮到你去探索,它还能在哪些场景里,为你创造更多可能。
除了上面的技能之外,腾讯云OCR还提供了其他场景的技能,用户可以根据自己的场景按需选择。
skills名称 | 链接 | 介绍 |
|---|---|---|
TencentCloud IDCard OCR | 腾讯云身份证识别(IDCardOCR)接口调用技能。可识别身份证图片中中国大陆居民二代身份证正反面信息(姓名、性别、民族、出生日期、住址、身份证号、签发机关、有效期限等),支持身份证图片照片裁剪和多种告警功能 | |
TencentCloud BizLicense OCR | 腾讯云营业执照识别(BizLicenseOCR)接口调用技能。可识别营业执照图片上的字段信息(统一社会信用代码、公司名称、主体类型、法定代表人、注册资本、组成形式、成立日期、营业期限、经营范围等)时,支持复印件/翻拍件告警检测、有效期自动拼接、电子营业执照图片识别及非营业执照的营业类证件图片识别。 | |
TencentCloud General OCR | 腾讯云广告文字识别(AdvertiseOCR)接口调用技能。当用户需要从图片中识别文字内容时,应使用此技能。支持中英文、横排、竖排及倾斜场景的图片文字识别,支持90度、180度、270度翻转场景的图片识别,返回文本框位置与文字内容。 | |
TencentCloud LicensePlate OCR | 腾讯云车牌识别(LicensePlateOCR)接口调用技能。当用户需要对中国大陆机动车车牌进行自动定位和识别时,应使用此技能。支持返回车牌号码、车牌颜色、置信度和像素坐标信息,支持多车牌场景识别。 | |
TencentCloud MLIDPassport OCR | 腾讯云护照识别(多国多地区)(MLIDPassportOCR)接口调用技能。当用户需要识别护照图片中中国大陆、港澳台地区或其他国家/地区的护照信息(护照ID、姓名、出生日期、性别、有效期、发行国、国籍、国家地区代码、MRZ码等)时,应使用此技能。支持图片Base64和URL两种输入方式,支持护照图片人像照片裁剪功能,支持80+国家/地区的可机读护照图片识别,同时支持复印件、翻拍、PS、反光、模糊、边框不完整等告警功能(仅国际站生效) | |
TencentCloud RecognizeTable OCR | 腾讯云表格识别v3(RecognizeTableAccurateOCR)接口调用技能。当用户需要从表格图片或PDF中识别常规表格、无线表格、多表格的内容,提取每个单元格的文字信息,或将表格图片识别结果导出为Excel文件时,应使用此技能。支持中英文表格图片、旋转表格图片、嵌套表格图片等复杂场景,识别效果优于表格识别V2。 | |
TencentCloud VatInvoice OCR | 腾讯云通用票据识别高级版(VatInvoiceOCR)接口调用技能。当用户需要识别发票图片中增值税专用发票、增值税普通发票、增值税电子专票、增值税电子普票、电子发票(普通/增值税专用)的全字段信息时,应使用此技能。支持识别发票图片中的发票代码、发票号码、开票日期、合计金额、校验码、税率、合计税额、价税合计、购买方/销售方信息、明细条目等全部字段,同时支持PDF格式发票图片识别。 | |
TencentCloud VehicleLicense OCR | 腾讯云行驶证识别(VehicleLicenseOCR)接口调用技能。当用户需要识别行驶证图片主页(车牌号码、车辆类型、所有人、住址、使用性质、品牌型号、识别代码、发动机号、注册日期、发证日期)或副页(号牌号码、档案编号、核定载人数、总质量、整备质量、核定载质量、外廓尺寸、准牵引总质量、备注、检验记录)信息时,应使用此技能。支持图片Base64和URL两种输入方式,支持复印件、翻拍、反光、模糊、边框不完整等告警功能,支持电子行驶证图片和拖拉机行驶证图片识别。 | |
TencentCloud ExtractDoc OCR | 腾讯云实时文档抽取Agent(ExtractDocAgent)接口调用技能。当用户需要从图片或PDF中按自定义字段名称进行结构化信息抽取时,应使用此技能。支持自定义字段名称、字段类型(KV对或表格字段)和字段提示词,实现灵活的文档信息提取。适用于合同、发票、报告等各类文档的结构化数据抽取场景。 | |
TencentCloud QuestionMark OCR | 腾讯云试题批改Agent接口调用技能。当用户需要对试卷图片或试题图片中的K12试卷或试题进行自动批改、手写答案识别、知识点分析时,应使用此技能。支持整卷图片批改和单题图片批改,提供题目切题、正误判定、答案对比、错误分析、知识点输出等结构化评估结果。 |
扫码加入OpenClaw × 腾讯云AI产品Skills交流群:

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。