首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏探索RPA

    RPA之眼:AI-OCR,Fax-OCR概述

    OCR技术的诞生可以取代人工读取纸质文件的工作,并将纸质文件的信息电子化。 这就为RPA技术OCR技术的协同合作提供了契机。 近年来, OCR引起了广泛关注,但目前的OCR软件存在精度不高和无法应对非固定文件模板等课题。未来通过在OCR中引入AI的深度机器学习等技术以后,相信一定会解决这个课题。 Fax-OCR是什么? Fax-OCR是把传真机接收的订单等纸质文件通过OCR技术自动转为文本信息的技术。虽说现在社会尤其是国内公司,很多都是网上接单了,但是用传真接收客户订单这种古老的方式还是在一定程度上存在的。 OCR的注意点 OCR技术确实可以自动实现数据的文本化,也是一项非常有效的效率改善的技术手段,但是现在的阶段OCR并非无所不能。 1、无法对应多份文件。

    5.5K20发布于 2019-11-07
  • 来自专栏目标检测和深度学习

    OCR技术综述

    最近入坑研究OCR,看了比较多关于OCR的资料,对OCR的前世今生也有了一个比较清晰的了解。所以想写一篇关于OCR技术的综述,对OCR相关的知识点都好好总结一遍,以加深个人理解。 什么是OCR? 比如汉王OCR,百度OCR,阿里OCR等等,很多企业都有能力都是拿OCR技术开始挣钱了。 其实我们自己也能感受到,OCR技术确实也在改变着我们的生活:比如一个手机APP就能帮忙扫描名片、身份证,并识别出里面的信息;汽车进入停车场、收费站都不需要人工登记了,都是用车牌识别技术;我们看书时看到不懂的题 做过OCR的童鞋都知道,送入OCR模块的图像越清晰(即预处理做的越好),识别效果往往就越好。那现在对这流程中最为重要的字符识别技术做一个总结。 针对传统OCR解决方案的不足,学界业界纷纷拥抱基于深度学习的OCR。 这些年深度学习的出现,让OCR技术焕发第二春。

    16.2K92发布于 2018-04-18
  • 来自专栏SIGAI学习与实践平台

    OCR技术简介

    OCR技术路线 典型的OCR技术路线如下图所示 其中影响识别准确率的技术瓶颈是文字检测和文本识别,而这两部分也是OCR技术的重中之重。 在传统OCR技术中,图像预处理通常是针对图像的成像问题进行修正。 [4] TextBoxes是基于SSD改进的一个算法。调整了锚定框的长宽比,以适应文字的高长宽比。输出层也利用了利用非标准的卷积核。更适应文字细长的宽高比这一特点。 [12] 总结 尽管基于深度学习的OCR表现相较于传统方法更为出色,但是深度学习技术仍需要在OCR领域进行特化,而其中的关键正式传统OCR方法的精髓。 【获取码】SIGAI0723 [41] 随机森林概述 【获取码】SIGAI0725 [42] 基于内容的图像检索技术综述——传统经典方法【获取码】SIGAI0727 [43] 神经网络的激活函数总结【

    18.5K20发布于 2018-09-26
  • 来自专栏SIGAI学习与实践平台

    OCR技术简介

    因此自然场景中的文字识别技术,也经常被单列为场景文字识别技术(Scene Text Recognition, STR),相关内容可回顾往期SigAI的文章。 OCR技术路线 典型的OCR技术路线如下图所示 ? 其中影响识别准确率的技术瓶颈是文字检测和文本识别,而这两部分也是OCR技术的重中之重。 在传统OCR技术中,图像预处理通常是针对图像的成像问题进行修正。常见的预处理过程包括:几何变换(透视、扭曲、旋转等)、畸变校正、去除模糊、图像增强和光线校正等。 [4] ? RRPN的网络结构[4] TextBoxes是基于SSD改进的一个算法。调整了锚定框的长宽比,以适应文字的高长宽比。输出层也利用了利用非标准的卷积核。更适应文字细长的宽高比这一特点。 FOTS的总体结构[12] 总结 尽管基于深度学习的OCR表现相较于传统方法更为出色,但是深度学习技术仍需要在OCR领域进行特化,而其中的关键正式传统OCR方法的精髓。

    8.6K50发布于 2018-10-18
  • OCR识别技术

    前言一、OCR是什么?OCR是光学字符识别的缩写,通俗来讲就是计算机可以通过图像来识别和处理文字信息。二、OCR应用领域OCR识别API对接步骤1、接入前文档查看需要什么协议? 3、引入相关三方工具类4、调试import com.mittang.util.HttpUtils;import org.apache.http.HttpResponse;import org.apache.http.util.EntityUtils args) throws Exception{ String host = "https://open.expauth.com"; String path = "/v2/ocr API为了简化开发者的工作,许多云服务提供商提供了强大且易于集成的OCR API1.文字OCR文字识别场景服务商提供的OCR API可选择性比较多,开发者可以根据自己的需求选择适合自己的服务商。 总结OCR识别技术让信息处理变得更加便捷。目前OCR技术已经广泛应用于我们的生活和工作中。

    4K10编辑于 2024-05-15
  • 来自专栏应用案例

    OCR技术浅析

    以深度学习兴起的时间为分割点,直至近五年之前,业界最为广泛使用的仍然是传统的OCR识别技术框架,而随着深度学习的崛起,基于这一技术OCR识别框架以另外一种新的思路迅速突破了原有的技术瓶颈(如文字定位、 笔者针对业务中的身份证照片文字识别需求分别尝试了传统OCR识别框架及基于深度学习的OCR识别框架。下面就以身份证文字识别为例分别简要介绍两种识别框架。 传统OCR技术框架 如上图所示,传统OCR技术框架主要分为五个步骤: 首先文本定位,接着进行倾斜文本矫正,之后分割出单字后,并对单字识别,最后基于统计模型(如隐马尔科夫链,HMM)进行语义纠错。 下面介绍基于传统OCR框架处理身份证文字识别: 身份证识别技术流程与上述框架稍微有所差异。对该问题,已知先验信息:a.证件长宽固定;b.字体及大小一致;c.文本相对于证件位置固定;d.存在固定文字。 基于深度学习的OCR识别框架 目前,从技术流程上来说,主要分为两步,首先是检测出图像中的文本行,接着进行序列识别。

    10.8K10发布于 2017-12-28
  • 来自专栏ocr

    OCR文字识别技术

    OCR,作为一种自动解读这种图像符号的技术,毫无疑问将是下阶段大数据发展的大方向。 因为随着移动互联网的繁荣发展,社会已经迎来了移动应用井喷时代,而出于对业务模式创新,以及用户体验优化的追求,以前很多依赖特定仪器才能实现的技术和操作开始适配到移动端, OCR技术就是这股移动化浪潮中相当受到瞩目的技术之一 从身份证识别、银行卡识别、车牌识别到名片识别、文档识别等各种形式的识别OCR都能轻松搞定。现在你只要用手机对准这些进行拍照扫描,OCR技术瞬间就能将图片中的文字转变为可编辑的文本信息。 在这信息高速发展的时代,信息电子化已经成为了时代的必然趋势,而OCR技术作为文字电子化过程中最重要的环节,它改变了传统纸质介质资料输入的概念。 全球数据信息量呈指数式爆炸增长之势,随处可见大数据的影响,顺应移动互联网大潮,OCR技术无论是面向行业用户还是面向普通用户都呈现出移动化的趋势。

    42.2K20发布于 2020-03-30
  • 来自专栏学习笔记持续记录中...

    Dubbo概述4

    Apache Dubbo是一款高性能、轻量级的开源Java RPC框架,它提供了三个核心能力:面向接口的远程方法调用,智能容错和负载均衡,以及服务自动注册和发现

    41320发布于 2020-03-17
  • DeepSeek-OCR-2 开源 OCR 模型的技术

    DeepSeek-OCR-2开源OCR模型的技术OCR应用的场景和类型很广,本次使用Qwen2的架构,解决看的全(扫码方式优化)、看的的准(内容识别、视觉标记、降低重复率),多裁剪策略提取核心信息。 这两款模型代表了当前开源OCR技术的两大发展方向:DeepSeek-OCR-2主打视觉因果流(VisualCausalFlow)的创新架构,而HunyuanOCR则以极致轻量化+端到端统一见长。 ):DeepSeek-OCR-2的上下文压缩特性可以显著降低文档预处理成本六、总结与展望DeepSeek-OCR-2和HunyuanOCR的开源,标志着OCR技术进入了一个新的阶段——从传统的"字符识别 对于开发者而言,2026年是OCR技术选型最优的一年——既有成熟的传统方案,也有前沿的端到端模型,且都是免费开源的。 /GOT-OCR2.0Qwen2-VL:https://github.com/QwenLM/Qwen2-VL(本文由AI辅助整理技术资料,核心数据来源于各模型官方技术报告和GitHub仓库。)

    51610编辑于 2026-02-07
  • 来自专栏通用文字识别信息技术白皮书

    OCR技术的昨天今天和明天!2023年最全OCR技术指南!

    本文将介绍该技术的前世今生,一览该技术的阶段性发展:传统OCR技术统治的过去,深度学习OCR技术闪光的现在,预训练OCR大模型呼之欲出的未来! 一、OCR的前世:传统OCR技术统治的过去传统OCR技术的工作原理OCR的运作方式可以类比为人类阅读文本和识别模式的能力。传统OCR技术通过电脑视觉、模式识别技术来自动识别并提取图像或文档中的字符。 4.去斜和校正:OCR系统需要自动纠正图像中的扭曲和倾斜,以确保文本的正确识别。这个过程包括检测图像中文本行的倾斜角度,并进行相应的校正。 4.困难的手写识别:对于手写文字的识别,传统的OCR系统通常会遇到更大的挑战,因为手写文字的形状、大小和倾斜度变化非常大,且往往缺乏清晰的边界。 这也是为什么越来越多的研究者开始探索使用深度学习等更先进的技术来改进OCR系统。二、OCR的今生:深度学习OCR技术闪光的现在传统OCR技术在处理复杂的图像和不规则形状的文本时,效果并不理想。

    4K11编辑于 2023-07-21
  • 来自专栏达达前端

    4-css概述

    css全称为层叠样式表,它主要是用于定义HTML内容在浏览器内的显示样式,如文字大小,颜色,字体加粗等。

    41020发布于 2020-05-18
  • 来自专栏IT技术精选文摘

    OCR检测与识别技术

    ”、“医学文献图像”等挑战任务中的4项冠军,获得了业内广泛好评,同时也再次证明了团队在OCR领域的技术研发能力。 (4)银行卡图片(部分内白为保护隐私) 图8 场景图片&垂直应用图片文字检测示例 目前数平精准推荐团队研发的OCR相关技术在公司内部众多产品中得到使用,例如:腾讯慧眼、手Q看点、话题圈、天御、社交广告等业务 在OCR方面,我们已经有了多年积累下的各项技术积累,愿意与任何有OCR技术相关需求的业务同行进行交流合作,持续打造业界一流的数据、算法和系统。 (图4) 此论文另一大贡献是提供了大规模合成数据的方法。标注文字的成本远高于标注人脸、物体等数据,高标注成本限制了OCR数据集规模。  腾讯DPPR团队场景文字识别技术 本章重点介绍腾讯数平精准推荐团队(Tencent-DPPR)的深度OCR算法。

    26.8K101发布于 2018-06-22
  • 来自专栏赵康的专栏

    容器技术概述

    容器是一种轻量级的、操作系统级别的虚拟化技术,它允许我们在资源隔离的进程中运行应用程序及其依赖项。运行应用程序所需的所有必要组件都可以打包为单个可以复用的映像。 容器的优点 敏捷环境:容器技术的最大优势是创建速度比VM实例更快。它轻量化的内存占用使得它在在性能和存储方面的开销更小。 提高生产力:容器通过消除跨服务的依赖和冲突来提高开发人员的生产力。 不成熟: 容器技术在市场上相对较新,因此市场化的时间较慢。可用资源的数量对于开发人员来说是有限的,如果遇到一些问题,可能需要一些时间才能找出解决方案。 我们可以利用LXC,OpenVZ,Linux VServer,BSD Jails和Solaris zones技术创建OS容器。 像Docker和Rocket这样的容器技术就是应用程序容器的例子。

    1.3K60发布于 2018-01-05
  • 来自专栏编程三昧

    SSR 技术概述

    [7df5f52cd9424c71b9d5a9af31fa1e9c~tplv-k3u1fbpfcp-zoom-1.image] 前言 服务端渲染的概念这几年可以说是炒得火热,它不是一种新型的技术,而是互联网最开始时所使用的加载技术 SSR 的优缺点 那么,SSR 技术到底有哪些优点呢? 以上是 SSR 技术最主要的两大优点,虽有优势,但缺点也不容忽视: 相对于仅仅需要提供静态文件的服务器,SSR中使用的渲染程序自然会占用更多的CPU和内存资源。 总结 以上就是对 SSR 技术的一些简要介绍,总结一下就是: SSR 提高 SPA 应用的首屏响应速度,有利于 SEO 优化。 SSR 最适用于静态展示页面,如果页面动态数据较多时需要谨慎使用。

    4.6K10发布于 2021-08-30
  • 来自专栏开源部署

    群集技术概述

    群集技术 群集技术就是共同为客户机提供网络资源的一组计算机系统,其中每一台提供服务的计算机,称之为节点。将多台计算机组织起来协同工作模拟一台性能更强大的计算机解决问题。 )以减少服务中断即实时的在线请求为目的的服务器群集,可靠率99.999%(负载均衡的分发装置) (3)高性能计算机群集HP (High Performance) 是以提高科学计算能力为目的的计算机群集技术 (3)Destination Hashing Scheduling (D-H)目标地址散列调度 就是将来自同一个客户的请求导上同一个Server,如访问一些大型购物网站 (4)Source Hashing (4)Never Queue Scheduling (NQ)无需等待调度,就是当有空闲服务器可用时,作业将被发送到空闲服务器,而不是等待速度较快的那一台。 2. 从层次上可以 4层交换 协议+端口 像F5 lvs 7层 像squid nginx

    1.2K10编辑于 2022-06-30
  • 来自专栏云计算

    容器技术概述

    容器是一个允许我们在资源隔离的过程中,运行应用程序和其依赖项的 、轻量的 、操作系统级别的虚拟化技术, 运行应用程序所需的所有必要组件都打包为单个镜像,这个镜像是可以重复使用的。 4.计算环境可移植性:容器封装了运行应用程序所必需的所有相关细节,如应用程序依赖性和操作系统。这有助于简化容器镜像从一个环境到另一个环境的可移植性。 2.本机Linux支持:大多数容器技术(如Docker)都基于Linux容器(LXC)。 3.不成熟:容器技术在市场上相对较新,因此上市时间较慢。开发人员可用资源的数量是有限的,如果遇到一些问题,可能需要一些时间才能找出解决方案。 像Docker和Rocket这样的容器技术就是应用程序容器的例子。

    2.2K110发布于 2017-12-29
  • 来自专栏Java技术分享

    反射技术概述

    * 4.在运行时调用任意一个对象的方法。 Reflectio  Reflection是Java被视为动态(或准动态)语言的一个关键性质。   

    965100发布于 2018-01-11
  • 来自专栏程序猿的大杂烩

    容器技术概述

    容器技术是这两年热门的话题,因为容器技术给我们带来了很多方便的地方,节约了不少成本,不管是在运维还是开发上。 例如A虚拟机给它使用2个cpu、8g内存、100g磁盘,B虚拟机给它使用4个cpu、16g内存、300g磁盘。。。等等,这样就可以实现物理资源利用率的最大化。 ,为什么还需要容器技术呢? ,真正使容器技术出现的是开发和运维所面临的挑战: ? 而容器技术正是解决了这种环境不一致的问题: ?

    1K30发布于 2020-09-23
  • 来自专栏Ywrby

    Swagger技术概述

    Swagger技术概述 Swagger出现的原因,很大程度上是由于前后端开发人员对于接口文档,无法做到高效的同步。前端人员苦于接口文档老旧,更新不及时,后端人员苦于在任务外另外维护接口文档。 ; } } 4. 启动项目,测试SwaggerUI界面 访问路径:http://localhost:8080/swagger-ui.html Swagger配置 1.

    44120编辑于 2022-10-27
  • 来自专栏云计算

    容器技术概述

    容器 (Container) 是一种在资源隔离状态下,允许我们运行应用程序及其依赖项,操作系统层面的轻量级、虚拟化技术。 容器的优点 敏捷环境: 容器技术最明显的优势是它比 VM (虚拟机)实例运行速度更快,容器轻量级的特点让它在性能和占用内存上开销更小。 不成熟:容器技术在市场中相对较新,因此进入市场的时间缓慢。可用资源的数量在开发人员中是有限的,如果遇到一些问题,可能需要一些时间才能找出解决方案。 要创建操作系统容器,我们可以利用容器技术,如 LXC,OpenVZ ,Linux VServer,BSD Jails 和 Solaris zones。 [os-vs-app-containers.jpg] 应用容器(Application Container):根据维基百科,“应用程序虚拟化是一种软件技术,它将计算机程序从其执行的底层操作系统中进行封装

    1.4K60发布于 2018-01-08
领券