首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏TEL18600524535

    德文识别技术:德语文本高效地转化为机器可读、可处理的数字信息

    德文识别技术,作为光学字符识别领域的特定应用分支,致力于将印刷或手写的德语文本高效地转化为机器可读、可处理的数字信息。其在德语区国家和全球德语相关业务中扮演着至关重要的角色。 识别文档结构:文本区域、栏、段落、标题、表格、图像、页眉/页脚。区分主文本、脚注等。对于德文,准确识别标题(通常名词大写)很重要。 德文识别独特的技术难点特殊字符的精准识别:ä, ö, ü (Umlauts):必须与无变音符的 a, o, u 以及可能的噪声点严格区分。点的大小、位置、清晰度是关键。 表格与复杂版式:准确识别表格结构、跨单元格文本,以及图文混排、分栏文档中的文本流顺序。德文识别关键功能特点高精度特殊字符处理:核心能力,确保ä, ö, ü, ß 的高准确率识别和转换。 手写体识别支持:针对清晰书写的德文手稿提供识别能力(精度通常低于印刷体)。历史文档处理能力:专业系统可支持Fraktur 等历史字体的识别

    40510编辑于 2025-08-13
  • 来自专栏腾讯云开发者社区头条

    估值超10亿 同行者牵手腾讯 加速车联网布局

    发布会上,腾讯车联网事业部总经理钟学丹和同行者创始人杨德文签署了合作协议。 资料显示,云知声成立于2015年,专注物联网AI服务,技术上主攻智能语音识别技术,已经完成5轮融资,最近一轮于2017年8月获得3亿元的战略投资,估值已超30亿。 在杨德文看来,同行者不是一家靠烧钱发展的互联网公司。据悉,拥有近百号员工的同行者已实现盈亏平衡,“我们应该是国内第一家实现盈亏平衡的人工智能公司”,杨德文称。 杨德文表示,与科大讯飞直面跟百度、阿里等巨头的竞争不同,我们选择和这些人做朋友,共同做大车联网生态。 杨德文认为,在这个内容过剩的时代这主要归功于以下三方面的进步: 1.语音成熟度:过去三年语音的基础能力得到了快速的提升,特别是离线的唤醒打断技术还有云端的识别技术都日趋成熟。

    1.7K22发布于 2017-12-09
  • 来自专栏Mac资源分享

    TextMan mac(ocr文字识别工具)1.4.1

    想要快速的从图片提取文字,推荐ocr文字识别工具——TextMan,小巧简便,只需以和截图相同的方式选择屏幕区域,然后在剪贴板中找到所有已识别的文本即可粘贴到任何地方。  只需以与截取屏幕截图相同的方式选择屏幕区域,然后在剪贴板中找到所有已识别的文本即可粘贴到任何地方。  *扫描文本可以是英文、法文、意大利文、德文、西班牙文、葡萄牙文和中文(简体和繁体)随处粘贴在剪贴板中查找所有检测到的文本,准备将其粘贴到每个文本字段中。

    7.8K10编辑于 2022-08-09
  • 来自专栏决策智能与机器学习

    智能识别方面主要进展 | 语音识别、OCR识别、图像识别、生物识别…… | 智能改变生活

    识别与分类技术可应用于图像识别、医疗诊断、生物识别、信号识别和预测、雷达信号识别、经济分析,以及在智能交通管理、机动车检测、停车场管理等场合的车牌识别等很广泛的领域。 语音识别:语音识别行业现在似乎维持着最大的平衡,因为国内外各家的引擎识别率都基本在同一个水平线上,差不多达到了当前语音识别技术的极限,彼此之间差距不是那么明显。 国内著名的车牌识别产品主要有中科院自动化研究所汉王公司的汉王眼、北京文通科技有限公司的文通车牌识别系统等。 ? 虹膜识别:现代信息社会对精准识别的需求,呼唤更加不可替代的生物体特征,虹膜识别应运而生。 目前主要应用有证件识别、银行卡识别、名片识别、文档识别、车牌识别等。 ? 唇语识别:相较于前文提到的语音识别、车牌识别、人脸识别等难度更大,其很大程度上取决于语言的语境和对其的了解,而这些都只通过视觉来呈现的。

    6.2K30发布于 2020-08-04
  • 来自专栏青年夏日

    视频识别 动作识别 实时异常行为识别 等所有行为识别

    大家好,我是cv君,很多大创,比赛,项目,工程,科研,学术的炼丹术士问我上述这些识别,该怎么做,怎么选择框架,今天可以和大家分析一下一些方案: 用单帧目标检测做的话,前后语义相关性很差(也有优化版), 当然可以通过后处理判断下巴是否过框,效果是不够人工智能的),高抬腿计数,目标检测是无法计数的,判断人物的球类运动,目标检测是有很大的误检的:第一种使用球检测,误检很大,第二种使用打球手势检测,遇到人物遮挡球类,就无法识别目标 开始 目前以手势和运动识别为例子,因为cv君没什么数据哈哈 项目演示: 本人做的没转gif,所以大家可以看看其他的演示效果图,跟我的是几乎一样的~ 只是训练数据不同 ​ ​ ​ ​ 一、 基本过程和思想

    5.6K20发布于 2021-04-18
  • 来自专栏用户8186044的专栏

    ERP系统中的那些“缩写”

    原材料的物料类型编码是ROH,如果是按照中文或英文的“缩写”思维去理解肯定是错误的,原因是SAP系统是德国的ERP,怎么可能是英文缩写,应该是德文的缩写才对。 那么,原材料在德文里是Rohstoff或者Rohes Material,那么就很容易知道原材料物料类型的缩写为什么是ROH了。 同理,我们就知道成品(产成品或完制品)物料类型的编码缩写为FERT(德文:Fertigerzeugnis)、半制品HALB(德文:Halbfabrikat)、贸易品HAWA(德文:Handelsware )、包装物VERP(德文:Verpackung)等等。 在以后的SAP ERP系统使用或学习过程中,如果遇到类似这样的编码缩写,请记住SAP ERP系统的编码缩写是德文系的,不是英语系的。通过以上简单的介绍,希望对大家学习SAP软件有更多的启发和帮助。

    5.4K20发布于 2021-04-08
  • 来自专栏Mac软件

    OCR文本识别TextMan for Mac激活版

    OCR文本识别工具TextMan Mac版只需截取屏幕截图即可识别网站、PDF、图像等内容,然后在剪贴板中找到所有已识别的文本即可粘贴到任何地方。 扫描文本可以是英文、法文、意大利文、德文、西班牙文、葡萄牙文和中文(简体和繁体)粘贴到任何地方在剪贴板中查找所有检测到的文本,准备将其粘贴到每个文本字段中。 只需以与截取屏幕截图相同的方式选择屏幕区域,然后在剪贴板中找到所有已识别的文本即可粘贴到任何地方。

    1.8K10编辑于 2022-08-10
  • 来自专栏Mac应用教程

    TextMan Mac(OCR文本识别)激活版

    试试这款苹果OCR文本识别工具TextMan,只需截取屏幕截图即可识别网站、PDF、图像等内容,然后在剪贴板中找到所有已识别的文本即可粘贴到任何地方。 扫描文本可以是英文、法文、意大利文、德文、西班牙文、葡萄牙文和中文(简体和繁体)粘贴到任何地方在剪贴板中查找所有检测到的文本,准备将其粘贴到每个文本字段中。 只需以与截取屏幕截图相同的方式选择屏幕区域,然后在剪贴板中找到所有已识别的文本即可粘贴到任何地方。

    1.6K20编辑于 2022-08-17
  • 来自专栏PaddlePaddle

    【场景文字识别】场景文字识别

    场景文字识别是在图像背景复杂、分辨率低下、字体多样、分布随意等情况下,将图像信息转化为文字序列的过程,可认为是一种特别的翻译过程:将图像输入翻译为自然语言输出。 场景图像文字识别技术的发展也促进了一些新型应用的产生,如通过自动识别路牌中的文字帮助街景应用获取更加准确的地址信息等。 在场景文字识别任务中,我们介绍如何将基于CNN的图像特征提取和基于RNN的序列翻译技术结合,免除人工定义特征,避免字符分割,使用自动学习到的图像特征,完成端到端地无约束字符定位和识别。 本例将演示如何用 PaddlePaddle 完成 场景文字识别 (STR, Scene Text Recognition) 。 任务如下图所示,给定一张场景图片,STR 需要从中识别出对应的文字"keep"。 ? 图 1. 输入数据示例 "keep" |2.

    28.4K70发布于 2018-04-02
  • 来自专栏全栈程序员必看

    python屏幕文字识别_python 图片文字识别 可截图识别

    “”” options = {} options[“detect_direction”] = “true” options[“probability”] = “true” “”” 带参数调用通用文字识别 “”” options = {} options[“detect_direction”] = “true” options[“probability”] = “false” “”” 带参数调用通用文字识别 +’********’*2+’\n’) print(‘截屏识别填1,图片识别填2:’) pd=input(”) if pd==’2′: print(‘***************请将图片放置本目录下*

    44.3K10编辑于 2022-09-01
  • 来自专栏运维记录

    Alfred插件之有道翻译配置过程

    yd * 查询最近的翻译记录 翻译结果上按 ⇧ Shift 直接预览有道网页 在选项上 ↩︎ Enter 回车复制翻译结果 输入 update 检查更新 Workflow 语言支持 可以识别中文 、英文、日文、韩文、法文、西班牙文、葡萄牙文、俄文、越南文、德文、阿拉伯文、印尼文、意大利文,其他语种无法识别

    1.7K10编辑于 2024-05-22
  • 来自专栏用户8715145的专栏

    智能识别图像识别采用了什么原理?智能识别图像识别有哪些应用?

    ,那么智能识别图像识别采用了什么原理? 智能识别图像识别有哪些应用? 智能识别图像识别采用了什么原理? 智能识别图像识别是通过图像的特征为基础从而达到识别结果的,每个图像都会有自己的特征,在完整的图像库里面就可以找寻出相同特征的图像。 智能识别图像识别有哪些应用? 智能识别图像识别这项技术虽然并没有完全成熟,但是基础的技术已经能够应用到很多方面的,那么智能识别图像识别有哪些应用? 关于智能识别图像识别的文章内容今天就介绍到这里,相信大家对于智能识别图像识别这项技术已经有所了解了,相信在未来的某一天人工智能的各种技术都会成熟的。

    7.7K30发布于 2021-10-20
  • 来自专栏又见苍岚

    调用 Baidu 语音识别接口识别短句

    语音识别已经是很成熟的技术了,本文记录调用百度 API 实现语音识别的过程。 简介 百度语音识别的功能: 技术领先识别准确 采用领先国际的流式端到端语音语言一体化建模方法,融合百度自然语言处理技术,近场中文普通话识别准确率达98% 多语种和多方言识别 支持普通话和略带口音的中文识别 ;支持粤语、四川话方言识别;支持英文识别 深度语义解析 支持50多个领域的语义理解,如:天气,交通,娱乐等。 ,使识别结果的表现方式贴合表述,更加可懂 数字格式智能转换 根据语音内容理解可以将数字序列、小数、时间、分数、基础运算符正确转换为数字格式,使得识别的数字结果更符合使用习惯,直观自然 支持自助训练专属模型 音频重采样 语音识别需要将音频采样频率固定在 16k,如果当前音频不是 16k 采样率,需要重采样。 可以参考 修改 wav 音频采样率 测试音频 原神中的一段 音频 为例。

    2K10编辑于 2023-06-27
  • 来自专栏算法工程师的学习日志

    车牌识别(2)-搭建车牌识别模型

    上一期分享了模拟生成车牌的方法,今天分享一下搭建要给简单的车牌识别模型,模拟生成车牌的方法参看:车牌识别(1)-车牌数据集生成 生成的车牌如下图 准备数据集,图片放在path下面,同时把图片名称和图片的车牌号对应关系写入到 y_train是长度为7的列表,其中每个都是shape为(n, # )的ndarray,分别对应n张图片的第一个字符,第二个字符....第七个字符 因为车牌是固定长度,所以有个想法,就是既然我们知道识别七次 ,那就可以用七个模型按照顺序识别。 0.9915 - val_c5_acc: 0.9723 - val_c6_acc: 0.9212 - val_c7_acc: 0.9336 可见五轮训练后,即便是位置靠后的几位车牌,也实现了 93% 的识别准确率 ,识别成功 chars = '' for arg in np.argmax(lic_pred, axis=1): # 取每行中概率值最大的arg,将其转为字符

    3.4K30编辑于 2022-07-27
  • 来自专栏自然语言处理

    实体识别(1) -实体识别任务简介

    命名实体识别概念 命名实体识别(Named Entity Recognition,简称NER) , 是指识别文本中具有特定意义的词(实体),主要包括人名、地名、机构名、专有名词等等,并把我们需要识别的词在文本序列中标注出来 例如有一段文本:李明在天津市空港经济区的税务局工作 我们要在上面文本中识别一些区域和地点,那么我们需要识别出来内容有: 李明(人名)、天津市(地点)、 空港经济区(地点)、税务局(组织) 识别上述例子我们使用了以下几个标签 命名实体识别工具 Stanford NER:斯坦福大学开发的基于条件随机场的命名实体识别系统,该系统参数是基于CoNLL、MUC-6、MUC-7和ACE命名实体语料训练出来的 https://nlp.stanford.edu 支持命名实体识别。 用于对序列数据进行分割和标记,主要用于NLP任务,例如命名实体识别、信息提取和序列标注等任务。

    1.3K20编辑于 2023-08-25
  • 来自专栏逸鹏说道

    验证码识别,发票编号识别

    这里最后做了一个发票编号识别的的案例: 地址:http://v.youku.com/v_show/id_XMTI1MzUxNDY3Ng==.html demo中包含一个验证码识别处理过程的演示程序,一个自动识别工具类库 最终的识别率: ? 图片字符的分割是验证码识别过程中最难的一步,也是决定识别结果的一步。不管多么复杂的验证码只要能准确的切割出来,就都能被识别出来。分割的方式有多种多样,对分割后的精细处理也复杂多样。 4.识别结果,依次将所得到的字符C拼接起来,得到的字符串就是该验证码的识别结果。 下面是验证码识别的具体流程: ? 发票编号识别 这个是基于aforge.net实现的,参考国外一位扑克牌识别的代码。 过程是先确定发票的位置,然后定位到发票编号,切出发票编号,调用自动识别类库识别数字,然后再将识别数据写到屏幕上。

    3.3K90发布于 2018-04-09
  • 来自专栏叶子陪你玩编程

    数字识别

    上篇的内容最后一个案例代码,其实来自官方的手写数字识别案例教程,我自己基于里面的内容自己删减了一些。 这里主要讲一下里面的数据集,sklearn自带了很多数据集,在安装包的data里面,就有手写数字识别数据集。 虽说是数字识别,不过这个数据集里面并没有实际图片。 ,不过识别前都会通过测试数据测试一下,先看看准确率怎么样,确定效果还不错,就可以用来测试没有见过的数字图片了。 如果将下面的数据(和训练的数据风格类似)转换成图片,再拿去识别是没问题的。 2.从图片文件夹中将所有数字图片读取出来 这里只是做了数字图片的读取,所以只能识别数字。 3.定义一个单张图片匹配的方法。

    2.1K10编辑于 2022-02-08
  • 来自专栏Don的成长史

    单词识别

    /weixin_42449444/article/details/89927887 题目描述: 输入一个英文句子,把句子中的单词(不区分大小写)按出现次数按从多到少把单词和次数在屏幕上输出来,要求能识别英文句号和逗号

    1.5K20发布于 2019-11-08
  • 来自专栏平凡少年

    OCR识别

    最近作者项目中用到了身份证识别跟营业执照的OCR识别,就研究了一下百度云跟腾讯云的OCR产品接口。

    26.8K51发布于 2019-04-11
  • 来自专栏全栈程序员必看

    opencv 人脸识别 (二)训练和识别

    上一篇中我们对训练数据做了一些预处理,检测出人脸并保存在\pic\color\x文件夹下(x=1,2,3,…类别号),本文做训练和识别。 为了识别,首先将人脸训练数据 转为灰度、对齐、归一化,再放入分类器(EigenFaceRecognizer),最后用训练出的model进行predict。 Output:人脸检测,并识别出每张检测到的人脸。 —————————————– 1.

    1.8K30编辑于 2022-09-05
领券