一、 产品定位与核心亮点 腾讯云 TI-OCR 训练平台是腾讯云(CSIG云与智慧产业事业群)推出的一站式OCR大模型开发与精调平台。 TI-OCR 平台优势: 覆盖全流程(数据导入、标注、生成、训练、编排、发布、评测)。 支持辅助标注、模板管理、图片增强、布局增强、内置模型。 解决方案:利用 TI-OCR 平台进行数据清洗挖掘与通用数据构造,结合场景数据合并与存储规范,依托腾讯GPU大规模调度能力和多机多卡训练加速技术,训练腾讯通用 OCR 预训练大模型。
近日,腾讯云携手思迪信息,基于腾讯云TI-OCR多模态大模型,为华福证券机构开户系统“福牛行”定制智能2.0升级,助力证券机构开户业务办理效率提升50%。 腾讯云TI-OCR大模型助力 开户资料批量高效处理 以开户场景为例,单个用户所需材料就多达12-13份,开户协助人必须根据系统提示将材料一一上传到指定位置。 腾讯云TI-OCR是一款专注于OCR细分场景建模的训练平台,基于腾讯云行业大模型,能为客户提供高效、稳定、安全的服务。 经过对比,腾讯云的TI-OCR能准确识别这些材料,并在参数设置上快速获取要素,实现自动配置参数。 腾讯云TI-OCR训练平台整合OCR大模型,支持银联快速自定义证件、票据、文本识别,实现业务流程自动化,提升效率并节约成本。
一、产品定位与核心亮点 腾讯云 TI-OCR 训练平台 是一个一站式 OCR 开发平台,覆盖从数据导入、标注、生成、模型训练到应用测试发布的全流程。 三、应用框架和功能介绍 功能框架 TI-OCR 平台提供完整的工作流支持: 数据管理:数据导入、标注(支持辅助标注)、生成(内置前处理、图片增强、布局增强)。
应用平台与解决方案层:如智能客服、TI-OCR训练平台、慧眼身份认证等,面向具体行业场景。 硬核指标 腾讯混元大模型可靠性:相比主流开源大模型,将幻觉(Hallucination)降低30%至50%。 TI-OCR大模型:在复杂场景(如水印干扰、复杂背景)下,字符读取准确率达98%+;在套打场景下,召回率预计达到90%+;在自然场景下,召回率预计达到95%+。 TI-OCR训练平台优势: 全流程覆盖:提供数据生成、标注、训练、评测、应用编排的一站式服务。 小样本训练:内置强泛化预训练模型,小样本即可启动优化。 TI-OCR应用于某交易所 背景:需精准识别复杂场景(水印干扰、复杂背景)下的文字,提升资料审核效率;传统OCR精准度低,模型泛化能力要求高。 解决方案:接入集成OCR大模型的TI-OCR训练平台。
全场景端到端工具链:提供从数据标注(TI-DataTruth)、模型训练(TI-One)、细分场景自训练(TI-OCR/TI-AOI)到应用编排发布(TI-Matrix)的完整PaaS级知识引擎。 平台层(基础平台与知识引擎PaaS):涵盖TI-DataTruth(数据标注)、TI-One(训练平台)、TI-OCR/TI-AOI(自训练平台)、TI-Matrix(应用平台)。 TI-OCR识别精度:在水印干扰、复杂背景等复杂场景下,字符读取准确率达 98%+。 TI-OCR大模型升级效果:常规KV场景比原先算法提升 3%-5%;套打场景召回率预计达 90%+;自然场景召回率预计达 95%+。 【TI-OCR训练平台】 覆盖数据导入、数据生成、数据标注、模型训练、应用编排到应用评测发布的全流程。 包含四大能力模块:数据管理、模型中心、应用中心、管理中心。
本文的思路是:用腾讯云COS做统一数据湖,把分散的产品内容集中管理;TI-OCR从产品图片中自动提取参数文字;向量数据库为产品描述建立语义索引;CDN保障全球访问速度。 \d*)',eff_str.replace('%',''))returnfloat(match.group(1))ifmatchelseNone二,规格图片的TI-OCR自动化提取2.1识别流程光伏组件规格表 TI-OCR(腾讯云智能文字识别)自动完成从图片到结构化参数的提取。 欧洲节点}resp=client.AddCdnDomain(req)returnresp六,技术方案小结腾讯云产品矩阵为新能源企业GEO提供完整的技术链路:COS数据湖:统一存储多平台、多语言产品数据TI-OCR
平台,用新加入的TI-ACC加速工具为平台全面提速,让平台能力更强大;进一步我们依托平台的推理能力,发布了全新的智能视频分析平台和媒体内容中台,让算法接入更便捷;同时我们基于平台训练能力,发布了全新的TI-OCR 此外,TI-OCR是我们聚焦垂类场景全新推出的专业训练平台,深入探索文本智能领域。TI-OCR覆盖了海运单据、保险许可证、托管对账单等超过100个业务细分场景。 在性能表现上,TI-OCR最具竞争力的智能结构化模型在5000多种版式上能达到泛化准确率90%以上,只需5张小样本就可以获得95%以上的训练准确率;检测识别和智能分拣模型也都具备了业界领先水平。 而在最关键的算法方面,大规模多模态预训练、角度感知文本检测、语言融合高精度识别等AI核心技术,有力地保障了TI-OCR在细分领域的专业表现。
一、 产品定位与核心亮点 腾讯云 TI-OCR 训练平台是一款基于原生大模型的端到端 OCR(光学字符识别)与智能结构化解决方案。 一站式精调平台优势 (TI-OCR):覆盖从数据导入、辅助标注/模板管理、内置前处理(图片/文本/布局增强)、模型训练与评测,到应用编排(正则替换/匹配)及测试发布的全流程一站式开发平台。
单据流转与服务一体化: 运用TI-OCR大模型进行车牌、身份证、运单、财务票据的自动化信息提取,并结合腾讯电子签(基于至信链防篡改技术)实现交接自动化;前端通过企点全渠道智能客服平台承接用户与司机咨询。 TI-OCR物流场景日调用量超过10亿次。
TI-OCR:OCR自训练平台。 知识引擎PaaS:智能客服与内容生成底座。 应用层:智能客服、数智人、慧眼人脸核身、智能视频分析、工业AI中台等。 2. TI-OCR(集成OCR大模型): 复杂场景字符读取准确率:98%+。 常规KV场景:相比原先算法提升3-5%。 套打场景召回率:90%+。 自然场景召回率:95%+(人眼可识别水平)。 TI-OCR 全流程覆盖:覆盖数据导入、生成、标注、训练、应用编排到测试发布。 自研标注:推出自研标注语言“描述子”,高效标注复杂场景。 小样本训练:内置强泛化能力预训练模型,小样本即可启动迭代。
腾讯云的产品矩阵为这个问题提供了端到端的底层能力:COS(对象存储)管理多平台商品内容数据,CDN(内容分发网络)确保全球买家就近访问,TI-OCR识别商品图片中的参数文字,智能搜索服务提供跨语言语义检索 staticmethoddef_now_iso()->str:fromdatetimeimportdatetime,timezonereturndatetime.now(timezone.utc).isoformat()二,商品图片的TI-OCR modelsdefextract_amazon_product_info(image_urls:list,asin:str,secret_id:str,secret_key:str,region:str="ap-guangzhou")->dict:"""使用腾讯云TI-OCR ],issue["local_value"])self.notifier.send(message)六,总结腾讯云产品矩阵为跨境电商GEO提供了端到端的技术能力:COS数据湖管理多平台多语言商品内容;TI-OCR
吴永坚介绍,在图像识别领域,TI-OCR训练平台集成OCR大模型,借助端到端算法,助力客户解决特定场景识别难题,减少训练成本和训练时长;在数据分析领域,腾讯企点分析·AI助手通过分析大模型,实现零门槛对话式分析 目前,OCR大模型已经集成到TI-OCR训练平台,供客户依据自身业务场景,进行小样本精调使用。 以新能源领域为例,客户通过TI-OCR 训练平台进行图片标注,以小样本企业数据对OCR大模型进行精调,实现对弯曲电线字符、水印铭牌、复杂电表图片等识别,推动自动化信息审核。
腾讯技术积累为物流数字化提供确定性支撑 腾讯云拥有国内最大规模云原生实践经验,腾讯TI-OCR日调用量超10亿次,覆盖100+业务场景;人脸识别准确率99.80%,活体检测通过率99.9%。
在金融场景,某头部银行利用腾讯云 TI-OCR 实现了 95% 以上准确率的文件智能识别和关键词提取,将文件数据转化为结构化数据, 全面提升运营效率。
AI算法与OCR能力:依托腾讯优图和腾讯AI技术积累,提供200多种开箱即用算法服务,覆盖人、车、货、场、环境的智能分析;TI-OCR日调用数超过10亿次,覆盖表单、回单、提单、票据、证件等100+OCR 5min 智慧运输车型匹配&装车配载算法方案 安全与精度 基础版人脸核身人脸识别准确度99.80%、活体检测通过率99.9%;增强版攻击拦截准确率99.9% 运力管理司机认证-人脸核验方案 服务规模 TI-OCR
沉淀企业级通用AI中台: 基于混元大模型(基础模型与混元MoE)及 TI-one、TI-ocr 等 AI 平台,向下整合多元算力,向上支撑 CodeBuddy(代码助手)、ChatBI助手、智能风控等垂直应用工具
在金融场景,某头部银行利用腾讯云TI-OCR实现了95%以上准确率的文件智能识别和关键词提取,将文件数据转化为结构化数据,全面提升运营效率。大模型时代,算力、网络、数据构成了底层基础设施的“铁三角”。
开发平台: 提供TI-AOI(制造业最佳)、TI-OCR、TI-DataTruth等算法开发平台,支持从数据标注到模型部署的全链路。 3.
部署全链路AI平台: 提供涵盖TI-DataTruth数据标注、TI-OCR自训练、TI-ONE/TI-AOI训练平台的基础原子能力,向上支撑混元PaaS、知识引擎PaaS及大模型精调平台。
高等/职业教育: 部署AI开发实训与产业实训平台(涵盖TI-DataTruth、TI-Matrix、TI-OCR及工业质检/智影平台),直接对接真实产业需求。