首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏TEL18600524535

    德文识别技术:德语文本高效地转化为机器可读、可处理的数字信息

    德文识别技术,作为光学字符识别领域的特定应用分支,致力于将印刷或手写的德语文本高效地转化为机器可读、可处理的数字信息。其在德语区国家和全球德语相关业务中扮演着至关重要的角色。 识别文档结构:文本区域、栏、段落、标题、表格、图像、页眉/页脚。区分主文本、脚注等。对于德文,准确识别标题(通常名词大写)很重要。 3.特征提取:深度学习方法:使用卷积神经网络自动学习图像的多层次特征,无需显式分割和手动特征设计。4.识别核心:深度学习模型:CRNN:卷积循环神经网络。 表格与复杂版式:准确识别表格结构、跨单元格文本,以及图文混排、分栏文档中的文本流顺序。德文识别关键功能特点高精度特殊字符处理:核心能力,确保ä, ö, ü, ß 的高准确率识别和转换。 手写体识别支持:针对清晰书写的德文手稿提供识别能力(精度通常低于印刷体)。历史文档处理能力:专业系统可支持Fraktur 等历史字体的识别

    41210编辑于 2025-08-13
  • 来自专栏Node开发

    NodeJS人脸识别(3)

    获取到了access_token其实我们已经完成了鉴权操作,http请求我们也已经进行封装,下一步其实就可以开始调用API实现上一篇文章的人脸识别功能了。 API每个接口都需要携带access_token进行鉴权,所以请求接口地址为: CONFIG.detectURL = 'https://aip.baidubce.com/rest/2.0/face/v3/ 3.实现人脸识别功能API使用SDK可以直接直接封装好的方法,而调取API我们则需要手动封装方法调用已封装好的http请求发起请求。 总结: 其实人工智能基于前人的基础进行使用是很简单的。 吴坤我们使用现成的SDK或者自己封装调用API,其实难度系数都不高,因为最难的人脸识别真正实现的逻辑操作现有的API已经实现,我们无需去关心人脸识别它如何进行识别,而只需调用API就可以进行识别。 人脸识别系列文章到本篇就结束了,有兴趣研究原理的可以自行去进行研究。

    1.2K60发布于 2019-06-13
  • 来自专栏算法之名

    3D点云识别

    上图中激光雷达位于圆圈的中心,周围产生的光点就是产生的3D点云。它的中心一般由一辆携带激光雷达的汽车来进行360度的扫描 在上面的两张图中,一个是正常的角度,一个是俯视图。 精确:+/-2cm 图像 vs 点云 点云:简单精确适合几何感知 图像:丰富多变适合语义感知 这两种感知手段在ADAS(自动驾驶)场景中各有各的用处,比如说交通信号,3D点云就无法感知,只能通过图像识别来进行感知 3D点云数据来源 CAD模型:一般分类/分割问题的数据集是CAD。 的,我们要用的就是这个3d的数据集 跟踪数据集 分割数据集 这些都是将原始数据集处理一下,来应对各种细分的算法。 object dectection(物体检测)、tracking(追踪) 数据采集场景:Road(道路)、City(城市)、Residential(住宅区)、Campus(校园)、Person(人) 3D

    2.2K20编辑于 2022-03-24
  • 来自专栏python3

    python3+opencv3人脸识别

    import sys import importlib import cv2 #注意python2中,直接调用reload(sys),但python3中要import importlib importlib.reload haarcascade_frontalface_default.xml') # 读取图片 image = cv2.imread(imagepath) #把图像转为灰度图,查了一下原因,是这么说的: # 减少数据量(比如RGB模式,可以减少到原图片的1/3)

    54420发布于 2020-01-10
  • 来自专栏python3

    Python3 图像识别(二)

    (h2,h4)) print('3&4 --> ',hamming(h3,h4)) 结果: 1&2 --> 1 1&3 --> 0 1&4 --> 1 2&3 --> 1 2&4 --> 1 3&4 --> 1 四、余弦感知哈希 为了提升更好的识别效果,可以使用余弦感知哈希算法。 缺点:只能够识别变形程度在25%以内的图片。 步骤: 1.缩小尺寸:将图像缩小到32*32,并转为灰度图。 2.计算DCT:对图像进行二维离散余弦变换。 (h2,h4)) print('3&4 --> ',hamming(h3,h4)) print('1&1 --> ',hamming(h1,h1)) 结果: 1&2 --> 3 1&3 --> 1 1&4 --> 6 2&3 --> 3 2&4 --> 6 3&4 --> 5 1&1 --> 0 图例: ‘1.jpg’ ?

    1K30发布于 2020-01-19
  • 来自专栏机器学习AI算法工程

    YOLO3 动漫人脸识别

    https://github.com/wmylxmj/YOLO-V3-IOU

    1.8K20发布于 2019-10-29
  • 来自专栏机器学习AI算法工程

    【目标识别】yolo3_keras_Logo识别&训练自己数据

    修改yolo.py中第24行权重路径 3. 将需要检测图片放入sample文件夹中 4. 中的classes_path修改为自己的) step 2 执行xml_to_data.py 生成 kitti_simple_label.txt python xml_to_data.py step 3

    96330发布于 2020-05-15
  • 来自专栏python3

    Python3 图像识别(一)

    Infi-chu: http://www.cnblogs.com/Infi-chu/ 一、环境准备: 1.Python3.x(我是用的是Python3.6.5),这个问题不大,只要3.4以上就OK。 2.Numpy(直接pip安装即可) pip install numpy 3.OpenCV(找到与你Python相对应的版本即可,注意32bit和64bit) 下载地址:https://www.lfd.uci.edu

    1.4K30发布于 2020-01-20
  • 来自专栏北京马哥教育

    3行Python代码完成人脸识别

    Face Recognition软件包 这是世界上最简单的人脸识别库了。你可以通过Python引用或者命令行的形式使用它,来管理和识别人脸。 鉴定图片中的脸 识别图片中的人是谁。 你甚至可以用这个软件包做人脸的实时识别。 :https://medium.com/@ageitgey/try-deep-learning-in-python-now-with-a-fully-pre-configured-vm-1d97d4c3e9b 在树莓派2+上安装 看这篇说明:https://gist.github.com/ageitgey/1ac8dbe8572f3f533df6269dab35df65 在Windows上安装 虽然Windows :https://medium.com/@ageitgey/try-deep-learning-in-python-now-with-a-fully-pre-configured-vm-1d97d4c3e9b

    1.6K70发布于 2018-05-03
  • 来自专栏原创检测

    快速识别字体,3步到位

    微信图片_20200706153157.png 这些情况在设计师或者运营同学中最为常见,那么到底怎么快速识别字体到底是什么字体呢? 今天我给大家推荐一款小工具,可以快速的识别图片中的字体到底是什么字体,有没有侵权! 1.61_1.jpg 第一步:截取图片 截取你希望检测的字体图片,最好是背景纯色,这样更便于快速识别图片中的字体; 微信截图_20200706162039.png 第二步:打开工具(重点步骤) 20200706162155.png 第三步:检测结果 强大的数据处理技术和高智能化识别内核,智能简化软件操作步骤,极速识别图片上的字体。 你以为这样就结束了,检测出的字体,还有侵权风险识别,比如本次检测的字体是站酷小薇LOGO体,它本身是一个可商用版权字体,检测结果就会提示【侵权风险低】,这样基本上就可以放心使用了。

    16.3K21发布于 2020-07-06
  • 来自专栏Hcode网站

    Python3+Opencv+PyMySQL实现人脸识别

    前言 今天带来的是基于Opencv(c++底层编译)的人脸识别,再利用PyMySQL实现对数据的储存。 具体步骤是: image.png 使用到的库,模块有 ①CV2(Opencv):图像识别,摄像头调用 ②os:文件操作 ③numpy:NumPy(Numerical Python) 是 Python 然后利用opencv的LBPHFaceRecognizer对人脸创建模型,制作我们自己的人脸识别器,存储为名叫trainer.yml的数据文件,等待人脸识别来调用 补充:LBP是一种特征提取方式,能提取出图像的局部的纹理特征 ,最开始的LBP算子是在3X3窗口中,取中心像素的像素值为阀值,与其周围八个像素点的像素值比较,若像素点的像素值大于阀值,则此像素点被标记为1,否则标记为0。 3秒后程序自动关闭...') time.sleep(3) 最后 再次打开摄像头对人脸进行识别,此次识别先取出数据库对应id的数据,然后显示在识别框旁边。

    1.6K50发布于 2020-07-14
  • 来自专栏好奇心Log

    FY-3A卫星对大雾的识别

    FY-3A卫星对大雾的识别 FOG IDENTIFICATION BY 航空气象创新应用联合实验室 风云系列气象卫星是我国自主研发的一类对地观测卫星,主要面向以大气为主的地球观测需求。 FY-3A卫星 FY-3A卫星是我国自行研发的第二代极轨气象卫星,其轨道高度831km,轨道倾角98.81°,白天自北向南绕地球运行。 它的主要用途有监测全球云量,判识云的高度、类型和相态,探测海洋表面温度,监测植被生长状况和类型,监测高温火点,识别地表积雪覆盖,探测海洋水色等。 除了单波段判识以外,也可以利用彩色合成的方法加强对雾的识别。 再如2020年3月30日,四川凉山西昌森林火情的监测。

    1.5K20发布于 2021-11-29
  • 来自专栏全栈程序员必看

    树莓派3B+ 人脸识别(OpenCV)

    树莓派3B+ 人脸识别(OpenCV) ---- 相信大家都看了前面的OpenCV安装和人脸检测教程,已经跃跃欲试,想要进行人脸识别了,现在我们正式进入重头戏——人脸识别 的教程。 3.人脸识别 使用样图,使用树莓派摄像头获取图片。 // python脚本,请保存为facerec.py #! get() draw_frame( faces, img, gray ) elif fcount == 3: pr3 = pool.apply_async 首先,所有的方法都有类似的过积,即都使用了分好类的训练数据集(人脸数据库,每 个人都有很多样本)来进行“训练”,对图像或视频中检测到的人脸进行分析,并从两方面来确定:是否识别到目标,目标真正被识别到的置信度的度量 PCA的本质是识别某个训练集上(比如人脸数据库)的主成分,并计算出训练集(图像或帧中检测到的人脸)相对于数据库的发散程度,并输出一个值。

    1.2K11编辑于 2022-09-12
  • 来自专栏腾讯云开发者社区头条

    估值超10亿 同行者牵手腾讯 加速车联网布局

    [图片] 成立3年多以来,得益于车联网和人工智能两大风口,同行者得到了飞速发展。 业内一直很好奇,同行者为何能在3年之间迅速崛起。 资料显示,云知声成立于2015年,专注物联网AI服务,技术上主攻智能语音识别技术,已经完成5轮融资,最近一轮于2017年8月获得3亿元的战略投资,估值已超30亿。 杨德文认为,在这个内容过剩的时代这主要归功于以下三方面的进步: 1.语音成熟度:过去三年语音的基础能力得到了快速的提升,特别是离线的唤醒打断技术还有云端的识别技术都日趋成熟。 3.最后一个要素,其实也是最基础的要素,那就是联网能力和流量成本。车联网,联网是基础,也就是指国内3G4G网络的普及以及流量价格的快速下降。

    1.7K22发布于 2017-12-09
  • 来自专栏决策智能与机器学习

    语音识别应用场景(3):声纹识别打造个性化语音指纹

    相较于声纹识别,大众可能对语音识别更为熟悉,但二者有本质的区别。语音识别是“说什么”,声纹识别是“谁在说”。而语音识别必然会从“说什么”发展到“谁在说”。 (3)公安司法。对于各种电话勒索、绑架、电话人身攻击等案件,声纹辨认技术可以在一段录音中查找出嫌疑人或缩小侦察范围;声纹确认技术还可以在法庭上提供身份确认(同一性鉴定)的旁证。 目前该技术在国外军事方面已经有所应用,据报道,迫降在我国海南机场的美军EP-3侦察机中就载有类似的声纹识别侦听模块。 (5)保安和证件防伪。如机密场所的门禁系统。 =1578583738100712685&wfr=spider&for=pc 2、https://www.leiphone.com/news/201611/ISBPJpacXH5bI7hE.html 3、 https://baike.baidu.com/item/%E5%A3%B0%E7%BA%B9%E8%AF%86%E5%88%AB/2101887?

    3.7K20发布于 2020-08-04
  • 来自专栏AIoT技术交流、分享

    Python+OpenCV实现AI人脸识别身份认证系统(3)—训练人脸识别模型

    目录 案例引入 本节项目 ---- 最近有小伙伴们一直在催本项目的进度,好吧,今晚熬夜加班编写,在上一节中,实现了人脸数据的采集,在本节中将对采集的人脸数据进行训练,生成识别模型。

    3.1K30发布于 2021-01-20
  • 来自专栏全栈程序员必看

    基于OpenCV3实现人脸识别(实践篇)

    实践总结: 首先了解做人脸识别的步骤 各个算法后面的原理 原理背后的相关知识的了解 人脸识别项目总遇到的问题 由于篇幅原因,后面一篇写各个算法背后的原理,原理背后的相关知识的了解,人脸识别项目总遇到的问题 1.1表示每次图像尺寸减小的比例 //4. 4表示每一个目标至少要被检测到3次才算是真的目标(因为周围的像素和不同的窗口大小都可以检测到人脸表示每一个目标至少要被检测到3次才算是真的目标(因为周围的像素和不同的窗口大小都可以检测到人脸 经测试仍然可以训练出可以正确识别我和其他准备识别的人脸的模型来。但是如果大小不一致会报错,所以大小:92*112。 opencv中所有的人脸识别模型都是来源于这个类,这个类为所有人脸识别算法提供了一种通用的接口。 因为每一种模型的训练只需要三行代码: 注意区别:opencv3调用API的语句。

    1.9K30编辑于 2022-06-26
  • 来自专栏XAI

    【Python3-API】通用文字识别示例代码

    Python3-urllib3-API通用OCR示例代码 AccessToken获取可以参考:http://ai.baidu.com/forum/topic/show/497663(Python3-urllib3 ----------------------------------下面开始代码----------------------------------------------------- Python3- API示例代码(通用文字识别) ''' Created on 2018-1-25 通用文字识别-Python3 -API示例代码 @author: 小帅丶 ''' import urllib3,base64 from urllib.parse import urlencode access_token='自己应用信息获取的access_token' http=urllib3.PoolManager() url Python3输出位串,而不是可读的字符串,需要进行转换 result = str(request.data,'utf-8') print(result) 返回的识别结果内容 { "log_id

    2.5K70发布于 2018-02-09
  • 来自专栏技术拓展与说明

    Tencent 人脸识别 Android V3 鉴权

    Android 关于腾讯 人脸识别 V3 鉴权代码,供参考 注意:Android9.0 默认是禁止所有的http,且android4.0以后不能在主线程发起网络请求。 import java.util.TimeZone; import javax.crypto.Mac; import javax.crypto.spec.SecretKeySpec; /** * 人脸识别 V3鉴权 */ public class AuthFace { private static String SecretId = ""; private static String "content-type;host";//参与签名的头部信息 //签名字符串 private static String Algorithm = "TC3- * @param action 人脸识别接口名 例如 DetectFace * @param paramJson json化的参数 * @param version

    2K132发布于 2020-04-10
  • 来自专栏AIoT技术交流、分享

    LabVIEW OCR 实现车牌识别(实战篇—3

    目录 1、字符数据集训练 2、识别与验证 ---- 在学习本章之前,推荐先学习系列专栏文章:LabVIEW目标对象分类识别(理论篇—5) OCR(光学字符识别)是指机器自动从图像中识别文本字符的过程,OCR 机器视觉系统可用于对被测件的识别和分类。 常见的识别应用包括:药品包装标签识别、IC芯片编码读取、冲压零件上的字符识别、汽车零件编码读取以及车牌识别等。 OCR从本质上可看作是目标分类和识别的一种实际应用,因此它也包括训练和分类过程。 OCR训练过程主要从图像中提取用于字符识别的特征向量,并对各字符图像赋予准确的字符值。

    1.1K30发布于 2021-08-10
领券