首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏TEL18600524535

    德文识别技术:德语文本高效地转化为机器可读、可处理的数字信息

    德文识别技术,作为光学字符识别领域的特定应用分支,致力于将印刷或手写的德语文本高效地转化为机器可读、可处理的数字信息。其在德语区国家和全球德语相关业务中扮演着至关重要的角色。 识别文档结构:文本区域、栏、段落、标题、表格、图像、页眉/页脚。区分主文本、脚注等。对于德文,准确识别标题(通常名词大写)很重要。 5.后处理:词典匹配与纠错:利用庞大的德语词典和词频信息,对识别出的单词进行验证和纠错(例如,将mussen 纠正为 müssen)。 表格与复杂版式:准确识别表格结构、跨单元格文本,以及图文混排、分栏文档中的文本流顺序。德文识别关键功能特点高精度特殊字符处理:核心能力,确保ä, ö, ü, ß 的高准确率识别和转换。 手写体识别支持:针对清晰书写的德文手稿提供识别能力(精度通常低于印刷体)。历史文档处理能力:专业系统可支持Fraktur 等历史字体的识别

    41210编辑于 2025-08-13
  • 来自专栏燧机科技-视频AI智能分析

    离岗识别 yolov5

    离岗识别算法模型通过yolov5网络模型技术,离岗识别可以自动识别现场画面中人员离岗等行为,发现违规行为立即抓拍告警。 YOLOv5是一种单阶段目标检测算法,该算法在YOLOv4的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。 而YOLOv5的Neck网络中,采用借鉴CSPnet设计的CSP2结构,从而加强网络特征融合能力。 下图展示了YOLOv4与YOLOv5的Neck网络的具体细节,通过比较我们可以发现:(1)灰色区域表示第1个不同点,YOLOv5不仅利用CSP2_\1结构代替部分CBL模块,而且去掉了下方的CBL模块; (2)绿色区域表示第2个不同点,YOLOv5不仅将Concat操作之后的CBL模块更换为CSP2_1模块,而且更换了另外一个CBL模块的位置;(3)蓝色区域表示第3个不同点,YOLOv5中将原始的CBL

    55000编辑于 2023-05-20
  • 来自专栏White feathe 的博客

    H5 图像识别

    识别对比 ---- 1、百度识别 发现百度的图片搜索识别率不是特别,下面为测试图片跟测试后的结果: 测试图片: 下面为测试后的结果: 2、采用 tesseract.js 后结果 H5 图像识别 (采用Tesseract.js 进行识别) ---- 简单的文案之类的,识别的还算可以,但是稍微复杂点的,准确率就不是那么好了,在学习中。。。 font-family:"arial, helvetica, sans-serif"}fieldset{margin-bottom:10%;border:1px solid #ddd;border-radius:5px ratio for chucking outlines edges_debug 0 turn on debugging for this module edges_max_children_layers 5 classes matcher_rating_margin 0.1 New template margin (0-1) matcher_sufficient_examples_for_prototyping 5

    4.3K30编辑于 2021-12-08
  • 来自专栏四楼没电梯

    java验证码识别--5

    java验证码识别--1 http://blog.csdn.net/problc/article/details/5794460 java验证码识别--2 http://blog.csdn.net/problc /article/details/5797507 java验证码识别--3 http://blog.csdn.net/problc/article/details/5800093 java验证码识别-- 4 http://blog.csdn.net/problc/article/details/5846614 java验证码识别--5 http://blog.csdn.net/problc/article 得到model之后,把要识别的图片同样弄成libsvm的格式,存成predict.txt label indexi:valuei 0 1:0 2:0 3:0 4:0 5:0 6:0 7:0 8:0 9: 因为要识别的图片还不知道是哪个数字,所以其中label可以填成任何数 然后用svmpredict predict.txt data.txt.model output.txt 这样识别结果就在output.txt

    39410编辑于 2024-10-12
  • 来自专栏Datawhale专栏

    用YOLOv5模型识别出表情!

    作者:闫永强,算法工程师,Datawhale成员 本文利用YOLOV5对手势进行训练识别,并识别显示出对应的emoji,如同下图: 本文整体思路如下。 准备手势识别数据集 其中手势数据集已上传至开源数据平台Graviti,包含了完整代码。 在windows平台下ctrl+r cmd命令行窗口输入: onnx2ncnn.exe yolov5-best-sim.onnx yolov5s.param yolov5s.bin 转换的过程中会出现上图所示的 opt = opt; yolov5.register_custom_layer("YoloV5Focus", YoloV5Focus_layer_creator); // init param 识别出手势,然后利用图像ROI融合,把相应的Emoji缩放到80x80大小显示在手势框的旁边,实现根据不同的手势显示相应的Emoji。

    1.5K20发布于 2021-09-22
  • 来自专栏贾志刚-OpenCV学堂

    YOLOv5 实现无人机识别

    只要用了Pytorch版本YOLOv5框架,可以毫不夸张的说两个小时就可以学会目标检测。 01 第一步数据准备 想用视觉识别一下空中飞行的无人机,识别对象有: 1:鸟类bird 2:无人机UAV 3:直升机helicopter 想通过自己创建一个数据集,训练yolov5,在调用detect.py 来识别一下效果。 ,也就是uav bird 和helicopter 下面我贴两张图片,这两张图片是我训练了100张图后,测试的标签和测试的预测,基本上框的位置已经很好了,只有左上角的这个直升机helicopter没有被识别出来 第一个箭头: yolov5s.pt,这个是权重文件,用的是s版本,small,yolov5的权重文件不同分为几个不同版本,这里我用的是s版本,这里可以认为是模型的初始权重, 第二个箭头: 这个yolov5s.yaml

    1.2K40发布于 2021-07-14
  • 来自专栏AI算法与图像处理

    YOLOv5 实现无人机识别

    只要用了Pytorch版本YOLOv5框架,可以毫不夸张的说两个小时就可以学会目标检测。 01 第一步数据准备 想用视觉识别一下空中飞行的无人机,识别对象有: 1:鸟类bird 2:无人机UAV 3:直升机helicopter 想通过自己创建一个数据集,训练yolov5,在调用detect.py 来识别一下效果。 ,也就是uav bird 和helicopter 下面我贴两张图片,这两张图片是我训练了100张图后,测试的标签和测试的预测,基本上框的位置已经很好了,只有左上角的这个直升机helicopter没有被识别出来 第一个箭头: yolov5s.pt,这个是权重文件,用的是s版本,small,yolov5的权重文件不同分为几个不同版本,这里我用的是s版本,这里可以认为是模型的初始权重, 第二个箭头: 这个yolov5s.yaml

    2.1K30发布于 2021-07-13
  • 来自专栏Datawhale专栏

    我用YOLOv5做情感识别

    这看似简单的应用背后其实是复杂的理论和不断迭代的AI算法,今天笔者就教大家如何快速上手目标检测模型YOLOv5,并将其应用到情感识别中。 2.2 基本原理 看到这里可能会有小伙伴问了:如果我想识别别的图片该怎么改?可以支持视频和摄像头吗?实际应用中应该怎么修改YOLOv5的代码呢? save_one_box(xyxy, imc, file=save_dir / 'crops' / names[c] / f'{p.stem}.jpg', BGR=True) 其中det是YOLOv5识别出来的结果 这里我用了YOLOv5官方给的推理模型,其中包含很多类别,大家也可以自己训练一个只有“人”这一类别的模型,详细过程可以参考: 在识别出物体坐标后输入emotic模型就可以得到对应的情感,即 pred_cat YOLOv5项目地址:https://github.com/ultralytics/yolov5 Emotic项目地址:https://github.com/Tandon-A/emotic

    1.4K30编辑于 2022-02-17
  • 来自专栏燧机科技-视频AI智能分析

    工人规范操作识别检测 yolov5

    工人规范操作识别检测通过yolov5+python网络模型技术,工人规范操作识别检测对工人的操作进行实时监测,当工人规范操作识别系统检测到工人操作不符合规范时,将自动发出警报提示相关人员采取措施。 行为检测合规算法中应用到的YOLOv5中在训练模型阶段仍然使用了Mosaic数据增强方法,该算法是在CutMix数据增强方法的基础上改进而来的。 在YOLO系列算法中,工人规范操作识别检测算法模型针对不同的数据集,都需要设定特定长宽的锚点框。 YOLOv5中将此功能嵌入到代码中,每次训练时,根据数据集的名称自适应的计算出最佳的锚点框,用户可以根据自己的需求将功能关闭或者打开,具体的指令为parser.add_argument(‘–noautoanchor 工人规范操作识别检测应用到的YOLOv5是一种单阶段目标检测算法,该算法在YOLOv4的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。

    62820编辑于 2023-09-08
  • 来自专栏燧机科技-视频AI智能分析

    yolov5 摔倒检测 跌倒识别检测

    摔倒检测跌倒识别检测基于YOLOv5技术来实现的图像识别,是计算机视觉的基础算法,例如VGG,GoogLeNet,ResNet等,这类算法主要是判断图片中目标的种类。 目标检测算法和图像识别算法类似,但是目标检测算法不仅要识别出图像中的物体,还需要获得图像中物体的大小和位置,使用坐标的形式表示出来。 也很难对人群进行大规模的关键点检测和判断,因此关键点检测常用于智能运动检测等小规模人群场景,图上所示是先使用yolo进行预判断图片openpose和其他关键点检测模型只是给出人体各个器官的点位坐标,而具体需要识别什么

    1.5K00编辑于 2022-12-05
  • 来自专栏开源技术小栈

    工具系列 | H5如何实现人脸识别

    识别工具 百度人脸识别库 1、分析图片中人脸的遮挡度、模糊度、光照强度、姿态角度、完整度、大小等特征,基于输出的符合质量标准的图片,返回准确的相似度评分 2、比对图片中两张人脸的相似度,并返回相似度分值 你可以通过Python引用或者命令行的形式使用它,来管理和识别人脸。 该软件包使用dlib中最先进的人脸识别深度学习算法,使得识别准确率在《Labled Faces in the world》测试基准下达到了99.38%。 前端通过h5页面的getUserMedia方法调用摄像头获取视频流。 通过canvas抓取一帧视频转化为图片(base64),使用http或websocket发送到后台。 否则返回人脸识别失败的信息。 流程图 ? 时序图 ?

    4.3K10发布于 2020-07-23
  • 来自专栏Soul Joy Hub

    TensorFlow实战——CNN(LeNet5)——MNIST数字识别

    TensorFlowinAction/blob/master/InActionB1/chapter6/mnist_inference_6_4_1.py train train部分和《TensorFlow实战——DNN——MNIST数字识别 layer5 layer3和layer4前面的类似,我们跳过它们来看layer5: pool_shape = pool2.get_shape().as_list() nodes = pool_shape pool_shape[3] reshaped = tf.reshape(pool2,[pool_shape[0],nodes]) with tf.variable_scope('layer5- 其余部分就是全连接神经网络了,layer6也和layer5类似。

    64120发布于 2019-02-13
  • 来自专栏腾讯云开发者社区头条

    估值超10亿 同行者牵手腾讯 加速车联网布局

    发布会上,腾讯车联网事业部总经理钟学丹和同行者创始人杨德文签署了合作协议。 资料显示,云知声成立于2015年,专注物联网AI服务,技术上主攻智能语音识别技术,已经完成5轮融资,最近一轮于2017年8月获得3亿元的战略投资,估值已超30亿。 在杨德文看来,同行者不是一家靠烧钱发展的互联网公司。据悉,拥有近百号员工的同行者已实现盈亏平衡,“我们应该是国内第一家实现盈亏平衡的人工智能公司”,杨德文称。 未来3-5年内,预计全球车联网市场规模将达到3000亿元。 经过三年多时间的发展,国内的车联网领域已经发生翻天覆地的变化。 杨德文认为,在这个内容过剩的时代这主要归功于以下三方面的进步: 1.语音成熟度:过去三年语音的基础能力得到了快速的提升,特别是离线的唤醒打断技术还有云端的识别技术都日趋成熟。

    1.7K22发布于 2017-12-09
  • 来自专栏云云众生s

    识别和解决事件响应差距的5个步骤

    译自 5 Steps to Identify and Address Incident Response Gaps,作者 Debora Cambe。 5. 进行事故后审查以推动持续改进 拥有成熟的数字运营和事件响应方法的组织将始终从以往的事件中吸取教训。这是不断增强弹性和改进流程的最佳方法。

    20810编辑于 2024-09-20
  • 来自专栏燧机科技-视频AI智能分析

    河道水面垃圾识别检测算法 yolov5

    河道水面垃圾识别检测系统采用yolov5忘了模型计算机视觉技术,水面垃圾识别检测算法通过在河道的摄像头,对水面垃圾进行实时监测自动识别。近几年来,目标检测算法取得了很大的突破。 对于一个目标检测算法而言,我们通常可以将其划分为4个通用的模块,具体包括:输入端、基准网络、Neck网络与Head输出端,YOLOv5算法具有4个版本,具体包括:YOLOv5s、YOLOv5m、YOLOv5l 、YOLOv5x四种,本文重点讲解YOLOv5s,其它的版本都在该版本的基础上对网络进行加深与加宽。 在网络训练阶段,YOLOv5使用Mosaic数据增强操作提升模型的训练速度和网络的精度;并提出了一种自适应锚框计算与自适应图片缩放方法。 虽然YOLOv5同样用到了SPP模块、FPN+PAN模块,但是实现的细节有些不同。Head输出端-Head用来完成目标检测结果的输出。

    84110编辑于 2023-09-05
  • 来自专栏燧机科技-视频AI智能分析

    工厂人员违规行为识别 yolov5框架

    工厂人员违规行为识别借助yolov5深度学习框架技术,YOLOv5是一种单阶段目标检测算法,该算法在YOLOv4的基础上添加了一些新的改进思路,使得其速度与精度都得到了极大的性能提升,具体包括:输入端的 Yolov5中添加了FPN+PAN结构,相当于目标检测网络的颈部,也是非常关键的。 FPN是自顶向下,将高层的强语义特征传递下来,对整个金字塔进行增强,不过只增强了语义信息,对定位信息没有传递。

    69800编辑于 2022-12-18
  • 来自专栏区块链大本营

    5个入门网站教你识别去中心化项目

    所有我整理了下面5个实时更新当前去中心化信息的可靠网站,帮助大家少走弯路。 DeFi Pulse https://defipulse.com/ ?

    70510发布于 2020-09-08
  • 来自专栏往期博文

    【目标检测】YOLOv5分离检测和识别

    正好,YOLOv5-6.2版本提供了一个图像分类的网络,那么就可以借此将YOLOv5进行改造,分离检测和识别的过程。 Tag6.2版本,该版本在图像分类识别中仅支持单文件识别,而最新版本已经支持文件夹的批量识别。 然后运行classify/predict.py进行识别识别完成的结果如下: 这里每一张图片会对应一个label,label中包含了最大5个类别的概率和名称。 格式转换与可视化 下面就需要把识别出来的结果转回到YOLO检测格式。 在model/hub/yolov5s6.yaml中,对应了yolov5s6的模型,那么,如果用yolov5s.yaml来加载yolov5s6也是可行的。

    1.8K21编辑于 2022-11-14
  • 来自专栏燧机科技-视频AI智能分析

    员工工作服穿戴AI识别算法 yolov5

    员工工作服穿戴AI识别算法是基于yolov5+python网络模型人工智能技术,yolov5+python网络模型算法对现场人员的工作服穿戴情况进行实时监控,并对违规情况将自动发出警报。 我们选择当下YOLO卷积神经网络YOLOv5来进行火焰识别检测。现版本的YOLOv5每个图像的推理时间最快0.007秒,即每秒140帧(FPS),但YOLOv5的权重文件大小只有YOLOv4的1/9。 YOLOv5是一种单阶段目标检测算法,该算法在YOLOv4的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。 主要的改进思路如下所示:输入端在模型训练阶段,提出了一些改进思路,主要包括Mosaic数据增强、自适应锚框计算、自适应图片缩放;Mosaic数据增强:Mosaic数据增强的作者也是来自YOLOv5团队的成员 Yolov5中添加了FPN+PAN结构,相当于目标检测网络的颈部,也是非常关键的。

    65420编辑于 2023-06-24
  • 来自专栏小詹同学

    5行Python实现验证码识别,太稳了!

    在很久之前,分享过一次Python代码实现验证码识别的办法。 当时采用的是pillow+pytesseract,优点是免费,较为易用。 但其识别精度一般,若想要更高要求的验证码识别,初学者就只能去选择使用百度API接口了。 但其实百度API接口和pytesseract其实都需要进行前期配置,对于初学者来说就不太友好了。 成功识别出来了验证码文字! 而且优点也非常明显:首先代码非常精简,对比前文提到的两种方法,不需要额外设置环境变量等等,5行代码即可轻松识别验证码图片。 另一方面,我们使用魔法命令%%time也测试出来吗,这段代码识别速度非常快。 下面用更多的验证码图片继续测试: ? 我又找了6个验证码图片来测试,观察结果,发现这类简单的验证码基本可以进行快速识别。 总而言之,如果你需要进行验证码识别,且对精度要求不是过高。 那么,带带弟弟OCR(ddddocr)这个库是一个不错的选择~ ——END—— 最近发现一个点外卖每顿饭都能少花5-20元的宝藏号。

    14.5K30发布于 2021-07-27
领券