首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏White feathe 的博客

    H5 图像识别

    识别对比 ---- 1、百度识别 发现百度的图片搜索识别率不是特别,下面为测试图片跟测试后的结果: 测试图片: 下面为测试后的结果: 2、采用 tesseract.js 后结果 H5 图像识别 font-family:"arial, helvetica, sans-serif"}fieldset{margin-bottom:10%;border:1px solid #ddd;border-radius:5px adjustment chop_split_length 10000 Split Length chop_vertical_creep 0 Vertical creep chop_width_change_knob 5 ratio for chucking outlines edges_debug 0 turn on debugging for this module edges_max_children_layers 5 classes matcher_rating_margin 0.1 New template margin (0-1) matcher_sufficient_examples_for_prototyping 5

    4.3K30编辑于 2021-12-08
  • 来自专栏python3

    【python 图像识别图像识别从菜鸟

    jaist.dl.sourceforge.net/project/tesseract-ocr-alt/tesseract-ocr-setup-3.02.02.exe,安装在C:\Program Files\下 5

    12.4K41发布于 2020-01-10
  • 来自专栏AILearning

    图像识别

    我们现在正在采取下一步,发布在最新型号Inception-v3上运行图像识别的代码。 Inception-v3 使用2012年的数据对ImageNet大型视觉识别挑战进行了培训。 为了比较模型,我们检查了模型无法预测正确答案作为他们前5个猜测之一的频率 - 称为“前5个错误率”。  AlexNet通过在2012年验证数据集上设置了15%的前5个错误率来实现; 初创(GoogLeNet)达到6.67%; BN-Inception-v2达到4.9%; 初创v3达到3.46%。

    22.3K80发布于 2018-01-05
  • 来自专栏aardio

    aardio 图像识别

    今天终于学会了编程中的 OCR 技术!原来计算机真的能识别图片里的文字,这种让程序 "看懂" 图像的能力太神奇了,赶紧把学习过程记录下来。

    70210编辑于 2025-06-20
  • 来自专栏腾讯移动品质中心TMQ的专栏

    Airtest图像识别

    Airtest是一款网易出品的基于图像识别面向手游UI测试的工具,也支持原生Android App基于元素识别的UI自动化测试。 图示为AirtestIDE中脚本运行范例 本文重点是针对Airtest中的图像识别进行代码走读,加深对图像识别原理的理解(公众号贴出的代码显示不全仅供参考,详细代码可以在github查看)。 概括来说aircv.find_template 主要做了这几件事情: 1、校验图像输入; 2、计算模板匹配的结果矩阵res; 3、依次获取匹配结果; 4、求取可信度; 5、求取识别位置。 这里可以看到,Airtest也没有自研一套很牛的图像识别算法,直接用的OpenCV的模板匹配方法。 四、接着看另外一个方法 aircv.find_sift 定义在sift.py里面: ? ? 六、总结 1、图像识别,对不能用ui控件定位的地方的,使用图像识别来定位,对一些自定义控件、H5、小程序、游戏,都可以支持; 2、支持多个终端,使用图像识别的话可以一套代码兼容android和ios哦,

    14.6K21发布于 2019-01-08
  • 来自专栏企鹅号快讯

    图像识别——MNIST

    本文使用NEURAL程序来介绍一下在SAS里如何实现图像识别。例子所用的数据集是MNIST数据集,从http://yann.lecun.com/exdb/mnist/可以获取。

    7.1K40发布于 2018-02-28
  • 来自专栏专知

    【下载】苹果发布Turi Create机器学习框架,5行代码开发图像识别

    这一框架有可视化界面,非常简单易用,可以让开发者更容易构建机器学习模型,甚至可以用仅仅数行代码就可以开发出一个图像识别模型。 支持,请执行以下步骤: 安装CUDA 8.0(http://docs.nvidia.com/cuda/cuda-installation-guide-linux/) 为CUDA 8.0安装cuDNN 5

    1.5K80发布于 2018-04-11
  • 来自专栏小鹏的专栏

    图像识别之mixupcutmix

    本人kaggle分享链接:https://www.kaggle.com/c/bengaliai-cv19/discussion/126504

    7.5K10发布于 2020-02-18
  • 来自专栏小鹏的专栏

    图像识别之GridMask

    GridMask: https://arxiv.org/abs/2001.04086

    6.3K10发布于 2020-02-18
  • 来自专栏决策智能与机器学习

    算法集锦(14)|图像识别| 图像识别算法的罗夏测试

    随着对基于深度学习的图像识别算法的大量研究与应用,我们倾向于将各种各样的算法组合起来快速进行图片识别和标注。 罗夏测验材料由10张结构模棱两可的墨迹图组成,其中5张全为黑色,2张是在黑色和灰色图外加了红色墨迹,另3张全为彩色。 洛夏测验记分(编码)和解释目前主要依据美国的Exner的综合系统,该系统包括了大样本的儿童(5岁起)和成人常模资料、分析的解释策略和步骤,是用于正常和病理人格的理论和临床研究的主要洛夏测验分析系统。 hen-of-the-woods 29.40 pitcher 28.28 vase 25.00 king_crab 23.99 wall_clock 18.25 triumphal_arch 11.04 Card 5:

    6.8K20发布于 2020-08-04
  • 来自专栏小鹏的专栏

    图像识别之augmix

    augmix: https://github.com/google-research/augmix

    6.5K10发布于 2020-02-18
  • 来自专栏燧机科技-视频AI智能分析

    智能视频图像识别

    智能视频图像识别系统选用人工智能识别算法技术,能够随时监控和剖析现场各大品牌相机中的视频图像。 智能视频图像识别系统软件关键运用相机拍摄的图像开展智能实时分析,抓拍监控识别和检作业现场的违规操作及行为,并向责任人推送信息。 与传统监控系统软件对比,智能视频图像识别系统软件增强了自主监控报警的能力,增强了数据检测和解析功能。智能视频图像识别系统具备很大的经济价值和广泛的应用领域,引起了国内外研究工作人员的广泛关注。 智能视频图像识别识别系统实现了下列识别优化算法:(1)施工作业安全帽子识别(2)混色+响应式工作服装识别(3)未系安全带高处作业识别(4)超长距离地区警示(5)浓烟+明火识别(6)睡岗识别(7)手机识别 智能视频图像识别可应用于全部必须生产安全/工程施工的场地,包含在建工地、在建地铁/铁路线/道路、新建加工厂和经营加工厂、煤矿业和工作船,给施工作业产生很大的方便。

    8K40编辑于 2022-09-14
  • 来自专栏Bingo的深度学习杂货店

    图像识别——突破与应用

    最近,图像识别领域发布了白皮书,简单翻译一下做个总结。 ---- [2] 图像识别 图像识别的目标是识别图像中的对象和人,并理解上下文。图像识别属于机器知觉,机器知觉是机器学习(ML)和人工智能(AI)的一部分。 这是图像识别史上的一个转折点,也是这个领域前途光明的开始。这个成就将焦点从传统的图像识别方法转移到了使用深度神经网络的新方法。 在2015年的 ILSVRC 竞赛中,基于CNN的多种算法超过了95%的人类识别率(5%的错误率)。 图像识别技术也用于识别图像中的多个元素,如对象、活动、标识、背景场景等(图5)。这为自动图像字幕提供了一个智能的方法。自动图像字幕本身打开了大量新的业务用例的大门。

    15.8K113发布于 2018-04-25
  • 来自专栏瓜大三哥

    图像识别(自己训练模型)

    1.数据集:从VGG网下载,这是一些各种猫和狗的图片(每个文件夹下面大约200张图片,有点少,所以训练的结果并不是很好,最好是上万的数据) 2.做得图像识别网络模型:(这个是技术核心,但是在神经网络里也有一句话 训练过程就是将这些数据集传入网络,判断哪些猫属于同一种,哪些狗属于同一种,这个就是很复杂的过程了,我用的是GPU加速的tensorflow 4.预测:我搜集了一些图片,然后输入到这个网络中,判断这些分类到底对不对 5.

    6.7K70发布于 2018-02-24
  • 来自专栏梦无矶测开实录

    python文字图像识别tesseract

    [AI测试]python文字图像识别tesseract 七夕了,咱来学点知识! digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-5.3.1.20230401.exe 网速较慢的可以从我网盘下载 链接:https://pan.baidu.com/s/1B5CyYZ5D5qwCXzZ9dnSGpQ 进行安装 (1)双击下载好的exe,建议右键以管理员身份运行 (2)点击next (3)点击I Agree (4)根据需要选择,第一个是为这台电脑所有用户下载,第二个是只为当前用户下载 (5) 你可以用如下官方链接自己下载对应语言库数据,都是几十兆 https://github.com/tesseract-ocr/tessdata_best 网速不好的用这个 链接:https://pan.baidu.com/s/11k5od_fd3

    4.1K30编辑于 2023-09-08
  • 来自专栏数据科学与人工智能

    【研究】图像识别及应用

    1 图像识别是什么? 2 图像识别的应用场景有哪些? 什么是图像识别 图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。 实际上,图像识别和图像分割并不存在严格的界限。从某种意义上,图像分割的过程就是图像识别的过程。 图为图像识别系统图 图像识别的国内外研究现状 图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。 图像识别在安防领域应用较多,未来在软硬件铺设到后端软件管理平台的建设转型中,图像识别系统将成为打造智慧城市的核心环节。 5、医疗 ? 未来,将图像识别技术应用到医疗领域,可以更精准更快速地分辨 X 光片、MRI 和 CT 扫描图片,上至诊断预防癌症,下至加速发现治病救命的新药。

    8.3K70发布于 2018-02-26
  • AI图像识别检测系统

    在数字化转型浪潮中,图像识别检测系统正成为连接物理世界与数字空间的核心纽带。 一、核心技术优势解析相较于传统方案,AI图像识别检测系统在多个维度实现突破性提升:在识别精度上,传统方案受光照、角度影响大,而智能系统通过自适应环境增强模型鲁棒性,大幅降低环境干扰带来的误差;处理速度方面 更创新的是姿态识别技术的应用——当顾客拿起商品超过5秒未放回时,自动推送产品详情到其手机APP。某连锁超市应用后,关联销售转化率提升22%,库存周转天数缩短4天,优化零售运营效率。 某风电场案例表明,该方案将非计划停机次数压缩至原来的1/5,单台机组年维护成本节省12万元,降低企业运维成本,保障设备稳定运行。 这些突破将推动图像识别技术向更多长尾场景渗透,真正实现“所见即所知”的智慧愿景。

    57710编辑于 2025-10-16
  • 来自专栏飞鸟的专栏

    使用python实现图像识别

    图像识别是人工智能中的重要分支之一,通过使用机器学习算法来训练模型,使其能够识别图像中的物体、场景或人脸等。 在本文中,我们将介绍使用Python实现图像识别的方法,其中主要使用的是深度学习框架Keras和OpenCV库。 可以通过pip命令安装: pip install keras tensorflow opencv-python 数据准备 图像识别的第一步是准备数据集。

    14.3K72编辑于 2023-03-28
  • 来自专栏燧机科技-视频AI智能分析

    视频监控智能图像识别

    视频监控智能图像识别技术实际上是一种,它为建筑工程施工品质和安全工作给予了优秀的方式方法。施工人员的安全隐患因为欠缺高度重视或因为缺少较好的监管方式 ,施工工地安全事故的次数较高。 视频监控智能图像识别根据在施工工地安装的各种各样不限品牌的监控设备,可以有效的填补传统式监控方式 和技术性的缺点,完成工作人员、机械设备、原材料、自然环境的全方位即时监控,将处于被动监管变化为积极监控, 视频监控智能图像识别分析系统依据在施工工地进出口、安全通道、护栏等地方组装智能监控摄像头,将监控视频与云服务平台进行联接,管理者依据监控器大屏幕可以检查施工工地各地区的及时情况。

    6K20编辑于 2022-09-12
  • 来自专栏阮一峰的网络日志

    PhotoSynth:图像识别建模技术

    PhotoSynth是微软公司从华盛顿大学购买来的一项技术,主要作用是通过平面照片自动建立空间模型,目前已经接近即将发布的前夕。 举例来说,游客来到上海,外滩是必去的。假定我们收集了某天中游客拍下的所有关于外滩的照片,PhotoSynth就能够自动建立一个外滩的三维模型,每张照片就是空间中的一个点,每个点按照实际的位置排列起来,点一下就能自动看到相同地点的所有照片。这就相当于建立一个虚拟外滩。 这就是说,这项技术实际上可以用来处理世界上所有含有地理信息的照片,然后将外部环境复原出来。Google Eart

    5.2K100发布于 2018-04-13
领券