首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏探索RPA

    RPA之眼:AI-OCR,Fax-OCR概述

    OCR技术的诞生可以取代人工读取纸质文件的工作,并将纸质文件的信息电子化。 这就为RPA技术OCR技术的协同合作提供了契机。 近年来, OCR引起了广泛关注,但目前的OCR软件存在精度不高和无法应对非固定文件模板等课题。未来通过在OCR中引入AI的深度机器学习等技术以后,相信一定会解决这个课题。 Fax-OCR是什么? Fax-OCR是把传真机接收的订单等纸质文件通过OCR技术自动转为文本信息的技术。虽说现在社会尤其是国内公司,很多都是网上接单了,但是用传真接收客户订单这种古老的方式还是在一定程度上存在的。 OCR的注意点 OCR技术确实可以自动实现数据的文本化,也是一项非常有效的效率改善的技术手段,但是现在的阶段OCR并非无所不能。 1、无法对应多份文件。

    5.5K20发布于 2019-11-07
  • 来自专栏SDNLAB

    SRv6技术课堂(一):SRv6概述

    本文系《SRv6技术课堂系列》的第一讲,后续将陆续更新各个维度的SRv6技术细节,欢迎大家批评指正。 从SRv6 SID的组成来看,SRv6同时具有路由和MPLS两种转发属性,可以融合两种转发技术的优点。 IPv4技术发展的一个重要教训是可扩展性问题,设计之初没有想到会有这么多的设备接入IP网络,由此触发了IPv6技术的发展。而IPv6技术发展的一个重要教训是可兼容性问题。 基于MPLS的承载技术用于IP Core承载,再到城域承载、移动承载,替代了帧中继、ATM、TDM等多种网络技术,实现了网络承载技术的统一。 图5 IP技术发展代际 SRv6技术的出现,实际承担了解决这些关键问题的使命: 第一个是SRv6兼容IPv6路由转发,基于IP可达性实现不同网络域间的连接更加容易,无需像MPLS那样必须引入额外信令

    4.8K10发布于 2019-11-29
  • 来自专栏目标检测和深度学习

    OCR技术综述

    最近入坑研究OCR,看了比较多关于OCR的资料,对OCR的前世今生也有了一个比较清晰的了解。所以想写一篇关于OCR技术的综述,对OCR相关的知识点都好好总结一遍,以加深个人理解。 什么是OCR? 比如汉王OCR,百度OCR,阿里OCR等等,很多企业都有能力都是拿OCR技术开始挣钱了。 其实我们自己也能感受到,OCR技术确实也在改变着我们的生活:比如一个手机APP就能帮忙扫描名片、身份证,并识别出里面的信息;汽车进入停车场、收费站都不需要人工登记了,都是用车牌识别技术;我们看书时看到不懂的题 比如“品”字,它的特征就是它有3个圈,6条横线,6条竖线。除了结构特征,还有大量人工专门设计的字符特征,据说都能得到不错的效果。最后再将这些特征送入分类器(SVM)做分类,得出识别结果。 针对传统OCR解决方案的不足,学界业界纷纷拥抱基于深度学习的OCR。 这些年深度学习的出现,让OCR技术焕发第二春。

    16.2K92发布于 2018-04-18
  • 来自专栏SIGAI学习与实践平台

    OCR技术简介

    OCR技术路线 典型的OCR技术路线如下图所示 其中影响识别准确率的技术瓶颈是文字检测和文本识别,而这两部分也是OCR技术的重中之重。 在传统OCR技术中,图像预处理通常是针对图像的成像问题进行修正。 [12] 总结 尽管基于深度学习的OCR表现相较于传统方法更为出色,但是深度学习技术仍需要在OCR领域进行特化,而其中的关键正式传统OCR方法的精髓。 [6] Liu Y, Jin L. 【获取码】SIGAI0723 [41] 随机森林概述 【获取码】SIGAI0725 [42] 基于内容的图像检索技术综述——传统经典方法【获取码】SIGAI0727 [43] 神经网络的激活函数总结【

    18.5K20发布于 2018-09-26
  • 来自专栏SIGAI学习与实践平台

    OCR技术简介

    因此自然场景中的文字识别技术,也经常被单列为场景文字识别技术(Scene Text Recognition, STR),相关内容可回顾往期SigAI的文章。 OCR技术路线 典型的OCR技术路线如下图所示 ? 其中影响识别准确率的技术瓶颈是文字检测和文本识别,而这两部分也是OCR技术的重中之重。 在传统OCR技术中,图像预处理通常是针对图像的成像问题进行修正。常见的预处理过程包括:几何变换(透视、扭曲、旋转等)、畸变校正、去除模糊、图像增强和光线校正等。 [6] ? DMPNet生成候选锚定框的示意图[6] 另一种改进的方法是通过自底向顶的方法,检测细粒度文本后将其连接成更粗粒度的文本。 FOTS的总体结构[12] 总结 尽管基于深度学习的OCR表现相较于传统方法更为出色,但是深度学习技术仍需要在OCR领域进行特化,而其中的关键正式传统OCR方法的精髓。

    8.6K50发布于 2018-10-18
  • OCR识别技术

    前言一、OCR是什么?OCR是光学字符识别的缩写,通俗来讲就是计算机可以通过图像来识别和处理文字信息。二、OCR应用领域OCR识别API对接步骤1、接入前文档查看需要什么协议? args) throws Exception{ String host = "https://open.expauth.com"; String path = "/v2/ocr "cusNo":"MER20230227354812341234","subMerNo":"MER20230227354812341234","reqNo":"1654251116079"}三、好用的OCR API为了简化开发者的工作,许多云服务提供商提供了强大且易于集成的OCR API1.文字OCR文字识别场景服务商提供的OCR API可选择性比较多,开发者可以根据自己的需求选择适合自己的服务商。 总结OCR识别技术让信息处理变得更加便捷。目前OCR技术已经广泛应用于我们的生活和工作中。

    4K10编辑于 2024-05-15
  • 来自专栏应用案例

    OCR技术浅析

    以深度学习兴起的时间为分割点,直至近五年之前,业界最为广泛使用的仍然是传统的OCR识别技术框架,而随着深度学习的崛起,基于这一技术OCR识别框架以另外一种新的思路迅速突破了原有的技术瓶颈(如文字定位、 笔者针对业务中的身份证照片文字识别需求分别尝试了传统OCR识别框架及基于深度学习的OCR识别框架。下面就以身份证文字识别为例分别简要介绍两种识别框架。 传统OCR技术框架 如上图所示,传统OCR技术框架主要分为五个步骤: 首先文本定位,接着进行倾斜文本矫正,之后分割出单字后,并对单字识别,最后基于统计模型(如隐马尔科夫链,HMM)进行语义纠错。 下面介绍基于传统OCR框架处理身份证文字识别: 身份证识别技术流程与上述框架稍微有所差异。对该问题,已知先验信息:a.证件长宽固定;b.字体及大小一致;c.文本相对于证件位置固定;d.存在固定文字。 基于深度学习的OCR识别框架 目前,从技术流程上来说,主要分为两步,首先是检测出图像中的文本行,接着进行序列识别。

    10.8K10发布于 2017-12-28
  • 来自专栏ocr

    OCR文字识别技术

    OCR,作为一种自动解读这种图像符号的技术,毫无疑问将是下阶段大数据发展的大方向。 因为随着移动互联网的繁荣发展,社会已经迎来了移动应用井喷时代,而出于对业务模式创新,以及用户体验优化的追求,以前很多依赖特定仪器才能实现的技术和操作开始适配到移动端, OCR技术就是这股移动化浪潮中相当受到瞩目的技术之一 从身份证识别、银行卡识别、车牌识别到名片识别、文档识别等各种形式的识别OCR都能轻松搞定。现在你只要用手机对准这些进行拍照扫描,OCR技术瞬间就能将图片中的文字转变为可编辑的文本信息。 在这信息高速发展的时代,信息电子化已经成为了时代的必然趋势,而OCR技术作为文字电子化过程中最重要的环节,它改变了传统纸质介质资料输入的概念。 全球数据信息量呈指数式爆炸增长之势,随处可见大数据的影响,顺应移动互联网大潮,OCR技术无论是面向行业用户还是面向普通用户都呈现出移动化的趋势。

    42.2K20发布于 2020-03-30
  • DeepSeek-OCR-2 开源 OCR 模型的技术

    DeepSeek-OCR-2开源OCR模型的技术OCR应用的场景和类型很广,本次使用Qwen2的架构,解决看的全(扫码方式优化)、看的的准(内容识别、视觉标记、降低重复率),多裁剪策略提取核心信息。 1024×1024视觉Token数256-1,120(根据内容自适应)上下文压缩支持,大幅降低下游LLM计算成本许可证Apache-2.0动态分辨率配置:默认方案:(0-6)×768×768+1×1024 ×1024Token数:(0-6)×144+2561.3核心能力复杂版面解析:在表格、多栏文档、公式混排等场景表现出色Markdown/结构化输出:支持将文档直接转换为带格式的Markdown多语言支持 对于开发者而言,2026年是OCR技术选型最优的一年——既有成熟的传统方案,也有前沿的端到端模型,且都是免费开源的。 /GOT-OCR2.0Qwen2-VL:https://github.com/QwenLM/Qwen2-VL(本文由AI辅助整理技术资料,核心数据来源于各模型官方技术报告和GitHub仓库。)

    51610编辑于 2026-02-07
  • 来自专栏java学习java

    spring6概述

    Spring6要求JDK最低版本是JDK17 Spring是什么? Spring 框架除了自己提供功能外,还提供整合其他技术和框架的能力。 Spring 自诞生以来备受青睐,一直被广大开发人员作为 Java 企业级应用程序开发的首选。 自 2004 年 4 月,Spring 1.0 版本正式发布以来,Spring 已经步入到了第 6 个大版本,也就是 Spring 6。 广义的 Spring:Spring 技术栈 广义上的 Spring 泛指以 Spring Framework 为核心的 Spring 技术栈。 Spring 框架是一个分层的、面向切面的 Java 应用程序的一站式轻量级解决方案,它是 Spring 技术栈的核心和基础,是为了解决企业级应用开发的复杂性而创建的。

    32130编辑于 2023-10-15
  • 来自专栏通用文字识别信息技术白皮书

    OCR技术的昨天今天和明天!2023年最全OCR技术指南!

    本文将介绍该技术的前世今生,一览该技术的阶段性发展:传统OCR技术统治的过去,深度学习OCR技术闪光的现在,预训练OCR大模型呼之欲出的未来! 一、OCR的前世:传统OCR技术统治的过去传统OCR技术的工作原理OCR的运作方式可以类比为人类阅读文本和识别模式的能力。传统OCR技术通过电脑视觉、模式识别技术来自动识别并提取图像或文档中的字符。 传统OCR的局限性虽然传统的光学字符识别(OCR技术在许多场景中表现得相当出色,但这种技术确实存在一些局限性,尤其是在比较复杂或者具有挑战性的情况下。 5.无法处理多语言和特殊字符:传统的OCR系统通常针对单一或者少数几种语言进行优化,对于其他语言或者特殊字符,例如数学符号、音乐符号等,可能无法提供满意的识别效果。6. 这也是为什么越来越多的研究者开始探索使用深度学习等更先进的技术来改进OCR系统。二、OCR的今生:深度学习OCR技术闪光的现在传统OCR技术在处理复杂的图像和不规则形状的文本时,效果并不理想。

    4K11编辑于 2023-07-21
  • 来自专栏iSharkFly

    Confluence 6 安全概述和建议概述

    应用程序安全概述 密码存储 当 Confluence 的内部用户管理被使用以后,从 Confluence 3.5 版本开始,用户的密码将会使用 PKCS5S2 implementation provided https://www.cwiki.us/display/CONF6ZH/Confluence+Security+Overview+and+Advisories

    1.5K40发布于 2019-01-30
  • 来自专栏IT技术精选文摘

    OCR检测与识别技术

    ”、“医学文献图像”等挑战任务中的4项冠军,获得了业内广泛好评,同时也再次证明了团队在OCR领域的技术研发能力。 在OCR方面,我们已经有了多年积累下的各项技术积累,愿意与任何有OCR技术相关需求的业务同行进行交流合作,持续打造业界一流的数据、算法和系统。 基于注意力机制 近两年来,注意力机制在图像描述[6]、语音识别[7]、自然语言处理[8][9]等领域大放异彩,本团队也开始尝试把此机制引入到OCR识别模块。 (图6) 5 当前效果 当前腾讯数平精准推荐团队(Tencent-DPPR)的OCR识别算法,能够应对艺术字、模糊、低分辨率、字体变形、字符残缺等多类有挑战场景,在广告场景已经取得良好效果。 (图13) 未来工作展望‍ 本文介绍了腾讯数平精准推荐团队(Tencent-DPPR)的OCR识别算法,包括识别算法的演进之路以及4个代表性方法。

    26.8K101发布于 2018-06-22
  • 来自专栏赵康的专栏

    容器技术概述

    容器是一种轻量级的、操作系统级别的虚拟化技术,它允许我们在资源隔离的进程中运行应用程序及其依赖项。运行应用程序所需的所有必要组件都可以打包为单个可以复用的映像。 容器的优点 敏捷环境:容器技术的最大优势是创建速度比VM实例更快。它轻量化的内存占用使得它在在性能和存储方面的开销更小。 提高生产力:容器通过消除跨服务的依赖和冲突来提高开发人员的生产力。 不成熟: 容器技术在市场上相对较新,因此市场化的时间较慢。可用资源的数量对于开发人员来说是有限的,如果遇到一些问题,可能需要一些时间才能找出解决方案。 我们可以利用LXC,OpenVZ,Linux VServer,BSD Jails和Solaris zones技术创建OS容器。 像Docker和Rocket这样的容器技术就是应用程序容器的例子。

    1.3K60发布于 2018-01-05
  • 来自专栏编程三昧

    SSR 技术概述

    [7df5f52cd9424c71b9d5a9af31fa1e9c~tplv-k3u1fbpfcp-zoom-1.image] 前言 服务端渲染的概念这几年可以说是炒得火热,它不是一种新型的技术,而是互联网最开始时所使用的加载技术 SSR 的优缺点 那么,SSR 技术到底有哪些优点呢? 以上是 SSR 技术最主要的两大优点,虽有优势,但缺点也不容忽视: 相对于仅仅需要提供静态文件的服务器,SSR中使用的渲染程序自然会占用更多的CPU和内存资源。 总结 以上就是对 SSR 技术的一些简要介绍,总结一下就是: SSR 提高 SPA 应用的首屏响应速度,有利于 SEO 优化。 SSR 最适用于静态展示页面,如果页面动态数据较多时需要谨慎使用。

    4.6K10发布于 2021-08-30
  • 来自专栏开源部署

    群集技术概述

    群集技术 群集技术就是共同为客户机提供网络资源的一组计算机系统,其中每一台提供服务的计算机,称之为节点。将多台计算机组织起来协同工作模拟一台性能更强大的计算机解决问题。 )以减少服务中断即实时的在线请求为目的的服务器群集,可靠率99.999%(负载均衡的分发装置) (3)高性能计算机群集HP (High Performance) 是以提高科学计算能力为目的的计算机群集技术 SED的改进 (5)Locality-Based Least Connections Scheduling(LBLC)基于局部的最少连接,是针对目标IP地址的负载均衡,目前主要用于Cache集群系统 (6

    1.2K10编辑于 2022-06-30
  • 来自专栏云计算

    容器技术概述

    容器是一个允许我们在资源隔离的过程中,运行应用程序和其依赖项的 、轻量的 、操作系统级别的虚拟化技术, 运行应用程序所需的所有必要组件都打包为单个镜像,这个镜像是可以重复使用的。 6.安全:容器将一个容器的进程与另一个容器以及底层基础架构隔离开来。因此,一个容器中的任何升级或更改都不会影响另一个容器。 2.本机Linux支持:大多数容器技术(如Docker)都基于Linux容器(LXC)。 3.不成熟:容器技术在市场上相对较新,因此上市时间较慢。开发人员可用资源的数量是有限的,如果遇到一些问题,可能需要一些时间才能找出解决方案。 像Docker和Rocket这样的容器技术就是应用程序容器的例子。

    2.2K110发布于 2017-12-29
  • 来自专栏Java技术分享

    反射技术概述

    主要是指程序可以访问、检测和修改它本身状态或行为的一种能力

    965100发布于 2018-01-11
  • 来自专栏程序猿的大杂烩

    容器技术概述

    容器技术是这两年热门的话题,因为容器技术给我们带来了很多方便的地方,节约了不少成本,不管是在运维还是开发上。 虚拟化技术的优点: 资源池——一个物理机的资源分配到了不同的虚拟机里 很容易扩展——增加物理机或者虚拟机即可,因为虚拟机是可以复制的 很容易云化——亚马孙AWS,阿里云,谷歌云等 即然虚拟化技术已经很强大了 ,为什么还需要容器技术呢? ,真正使容器技术出现的是开发和运维所面临的挑战: ? 而容器技术正是解决了这种环境不一致的问题: ?

    1K30发布于 2020-09-23
  • 来自专栏Ywrby

    Swagger技术概述

    Swagger技术概述 Swagger出现的原因,很大程度上是由于前后端开发人员对于接口文档,无法做到高效的同步。前端人员苦于接口文档老旧,更新不及时,后端人员苦于在任务外另外维护接口文档。

    44120编辑于 2022-10-27
领券