首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏人工智能领域

    视觉识别技术:开启智能视觉新时代

    视觉识别技术的简介 视觉识别技术,通常被称为计算机视觉,是指使用计算机模拟人类视觉系统来解释和理解图像和视频数据的过程。 视觉识别系统 (简称VI,英文Visual Identity的缩写 )是运用系统的、统一的视觉符号系统。视觉识别是静态的识别符号具体化、视觉化的传达形式,项目最多,层面最广,效果更直接。 视觉识别(VI)在CIS系统大众所接受,具有主导的地位。 视觉识别在现代科技中的重要性 视觉识别技术在现代科技中扮演着越来越重要的角色。 视觉识别技术的挑战与未来趋势:分析当前视觉识别技术面临的技术挑战、伦理与法律问题,并展望其未来的发展趋势。 结语:总结视觉识别技术对社会的深远影响,并强调持续创新的重要性。 2.视觉识别技术的工作原理 视觉识别技术的核心在于将图像数据转换成计算机可以理解的信息,进而实现对图像内容的识别和理解。

    1.7K10编辑于 2024-12-18
  • 来自专栏啄木鸟软件测试

    利用Applitools Eyes识别视觉bug

    eyes.open(self.driver,"Baidu首页","检查百度首页及搜索结果") self.driver.get('https://www.baidu.com') #第一个视觉验证检查点 eyes.check("百度首页视觉验证",Target.window()) self.driver.find_element(By.ID,"kw").send_keys ("hello world") self.driver.find_element(By.ID,"su").click() #第二个视觉验证检查点 eyes.check ("百度搜索结果视觉验证",Target.window()) eyes.close() self.driver.quit() if __name__ == "__main

    38500编辑于 2025-07-27
  • 来自专栏智慧物联产品&方案

    AI视觉识别有哪些工业应用

    AI视觉识别,主要是利用人工智能算法对图像或视频数据进行分析和处理,以提取关键信息并执行筛选、判断、预警等任务。AI视觉识别涵盖多种应用,如人脸识别、目标检测和识别、图像分割、行为识别、视频分析等。 本篇就简单介绍一下AI视觉识别的应用场景。1、质量控制和检验在制造领域,AI视觉识别可用于检查生产线上的产品是否存在缺陷,确保产品质量稳定,减少残次品。 2、物体识别和跟踪AI视觉识别可用于辅助机器人执行对物体的捡拾、放置、运输等操作,以及无人车辆的自主导航等任务。 4、智慧医疗AI视觉识别还可用于医学图像的识别检测和诊断,包括识别判断病人的X光片、MRI 和 CT 扫描等图像,实现病情评估和提供治疗建议。 5、智慧零售在零售领域,AI视觉识别可以通过监控店铺客流、货架消耗来分析营销和库存水平,提升店铺经营效率。6、智慧农业AI视觉识别可以通过空中或地面图像,识别监测作物生长状态、健康状况、病虫害情况等。

    1.6K10编辑于 2023-11-27
  • 来自专栏Python编程和深度学习

    BBN:长尾视觉识别模型(CVPR 2020)

    如上图所示,计算机视觉识别任务中经常面临长尾数据分布的挑战,即少数类占有多数样本,多数类只有少数样本。

    2.2K20发布于 2020-09-04
  • 来自专栏云开发小程序1

    python进阶——人工智能视觉识别

    opencv库 opencv是最经典的python视觉库,它里面包含了很多种视觉识别类型供开发者们使用。 当安装完成之后,我们就可以看到安装路径下的这些文件:  里面包含眼睛识别,面部识别等一些强大的识别算法! 键保存到'E:/tupian/'路径下的图片): path = 'E:/tupian/' 获取图像数组和id标签数组和姓名: faces,ids=getImageAndLabels(path) 加载识别器 : warningtime = 0 识别视频中人脸模块: def face_detect_demo(img): gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) cv2.circle(img,center=(x+w//2,y+h//2),radius=w//2,color=(0,255,0),thickness=1) # 人脸识别

    77030编辑于 2023-10-14
  • 来自专栏全栈程序员必看

    ccd视觉定位教程_CCD视觉定位识别系统,视觉系统ccd定位原理

    CCD机器视觉系统是用于工业检测及识别的高科技产品,生产的核心问题是工业计算机系统选型,可采集加工品的高清图像直接传输给到机子的GPIO接口。 CCD视觉定位系统工作原理及过程 ccd视觉定位由于数字图像处理和计算机视觉技术的迅速发展,越来越多的研究者采用摄像机作为全自主用移动机器人的感知传感器。 这主要是因为原来的超声或红外传感器感知信息量有限,鲁棒性差,而视觉系统则可以弥补这些缺点 ccd视觉定位算法:基于滤波器的定位算法主要有KF、SEIF、PF、EKF、UKF等。 d.图像描述识别 VisionMAX视觉软件系统 VisionMAX www.schnoka.cn 软件具有很好的适用性,无需任何编程,全可视化操作,能够快速搭建起一个具有高性能、高稳定性的解决方案 应用领域 1、2D/3D读码 2、OCR字符识别 3、定位抓取 4、尺寸测量 5、颜色分析 6、缺陷检测 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/148541

    1.6K10编辑于 2022-07-02
  • HarmonyOS NEXT AI基础视觉服务-文字识别

    案例描述这是一个基于AI基础视觉服务实现的文字识别案例,通过调用设备相机拍摄照片后识别图片中的文字内容。实现步骤:1. 图像处理流程// 将图片转换为可识别的像素图const fileSource = await fileIo.open(imageUri, fileIo.OpenMode.READ_ONLY);const 文字识别核心实现// 配置视觉识别参数let visionInfo: textRecognition.VisionInfo = { pixelMap: pixelMap};// 执行文字识别并获取结果 // 按钮点击事件处理 async openCamera() { // 整合上述步骤的完整调用逻辑 } build() { Column() { Button('拍照 文字识别 完整业务逻辑整合各功能模块的完整调用流程总结梳理:核心点相机调用需设备权限与硬件支持图像转换确保兼容不同格式图片文字识别接口返回结构化识别结果完整代码// 原始代码保持完整,仅添加说明注释import

    37900编辑于 2025-03-30
  • 来自专栏音视频技术

    图像识别解释方法的视觉演变

    正文字数:4270 阅读时长:7分钟 图像识别(即 对图像中所显示的对象进行分类)是计算机视觉中的一项核心任务,因为它可以支持各种下游的应用程序(自动为照片加标签,为视障人士提供帮助等),并已成为机器学习 在过去的十年中,深度学习(DL)算法已成为最具竞争力的图像识别算法。但是,它们默认是“黑匣子”算法,也就是说很难解释为什么它们会做出特定的预测。 为什么这会成为一个问题呢? 在本文中,我们概述了一些为图像识别而发明的解释方法,讨论了它们之间的权衡,并提供了一些示例和代码,您可以自己使用Gradio来尝试这些方法。 在实践中,LOO的一个巨大优势是它不需要任何访问模型内部的功能,甚至可以处理除识别之外的其他计算机视觉任务,从而使它成为一个灵活的通用工具。 那有什么缺点呢?首先,它很慢。 该方法在Attribution in Scale and Space [2020],中提出,旨在解决具有集成梯度的特定问题,包括消除“基线”参数,并消除某些易于在解释中出现的视觉伪像。

    1.4K30发布于 2021-02-05
  • HarmonyOS NEXT AI基础视觉服务-人脸识别

    案例描述这是一个基于AI基础视觉服务实现的人脸识别案例,通过调用设备相册选择图片后检测图像中的人脸信息并展示结构化识别结果。实现步骤:1. 人脸检测核心实现// 初始化人脸检测器faceDetector.init();// 配置视觉识别参数const visionInfo: faceDetector.VisionInfo = { pixelMap 界面构建build() { Column() { Button('选择相册 人脸识别') .onClick(() => { this.checkFace() } ({ message: JSON.stringify(visionResult) }) } build() { Column() { Button('选择相册 人脸识别

    44510编辑于 2025-03-30
  • 来自专栏燧机科技-视频AI智能分析

    加油站ai视觉识别系统

    加油站ai视觉识别系统通过yolov7网络模型深度学习,加油站ai视觉识别系统对现场画面中人员打电话抽烟等违规行为,还有现场出现明火烟雾等危险状态。 加油站ai视觉识别系统还可以对卸油时灭火器未正确摆放、人员离岗不在现场、卸油过程静电释放时间不足等不规范情形进行智能识别记录。

    65230编辑于 2023-03-05
  • 来自专栏算法与编程之美

    计算机视觉|图像中的信息识别

    1.为什么需要电脑对图片中的数字和字将进行识别: 在生活中,很多时候需要识别一些图片中的数字和字母,就像很多网站的验证码识别,对于个人来说,单个的此类事件需要的时间和精力很少,可对于一些机构、企业来说, 2.3方法步骤简介: 首先是图片的预处理操作,一般顺序为先进行图像的二值化,之后再对图片进行数字形态学运算(主要是开运算),由于pytesseract内置函数识别的图片是image形式而不是opencv 中的多维数组形式,所以在识别之前需要先使用pil中的image函数将图片格式进行转换,最后再通过pytesseracr中的函数进行识别

    98120发布于 2019-10-31
  • 来自专栏燧机科技-视频AI智能分析

    泥石流山体滑坡监控视觉识别检测

    泥石流山体滑坡监控视觉识别检测算法通过yolov8+python深度学习框架模型,泥石流山体滑坡监控视觉识别检测算法识别到泥石流及山体滑坡灾害事件的发生,算法会立即进行图像抓拍,并及时进行预警。 泥石流山体滑坡监控视觉识别检测算法代码将构建一个end-to-end的Yolo的预测模型,泥石流山体滑坡监控视觉识别检测算法利用的已经训练好的权重文件,你将可以用自然的图片去测试检测效果。 泥石流山体滑坡监控视觉识别检测算法采用卷积网络来提取特征,然后使用全连接层来得到预测值。网络结构参考GooLeNet模型,包含24个卷积层和2个全连接层。 泥石流山体滑坡监控视觉识别检测算法如此设计的原因应该是同一套缩放系数下的通道设置不是最优设计,YOLOv7 网络设计时也没有遵循一套缩放系数作用于所有模型。 考虑到动态分配策略的优异性,泥石流山体滑坡监控视觉识别检测算法中则直接引用了 TOOD 的 TaskAlignedAssigner。

    1K30编辑于 2023-09-24
  • 来自专栏燧机科技-视频AI智能分析

    PCB板缺陷检测机器视觉识别系统

    PCB板缺陷检测机器视觉识别系统通过python+yolo系列网络深度学习模型对PCB电路板外观实时监测,PCB板缺陷检测机器视觉识别系统监测到有缺陷的PCB板时立即抓拍存档。

    1K40编辑于 2023-01-09
  • 来自专栏AIGC 先锋科技

    LLM 视觉语言模型在动作识别中是否有效?

    当前的视觉语言基础模型(如CLIP)在各种下游任务上表现出了显著的性能提升。然而,这些基础模型是否在显著提升更复杂的细微动作识别任务上仍是一个开放性问题。 由于这些任务对于许多应用(例如,健康监测和机器人学习)至关重要,因此了解针对细粒度人类动作识别视觉语言模型的当前挑战至关重要。 作者对当前的视觉语言基础模型进行了大规模研究,重点关注在野外行动识别任务上的迁移学习。 Discussions and Novel Direction 从作者的研究中,作者发现当前最先进的视觉语言基础模型在动作识别方面仍存在挑战,视觉特征与动作描述之间的语义鸿沟使得捕捉细粒度细节变得困难。 5 Conclusion 在这项研究中,作者评估了最先进的视觉-语言模型在细粒度动作识别方面的表现,重点关注零样本动作分类和动作分割。

    89410编辑于 2024-11-11
  • 来自专栏arXiv每日学术速递

    计算机视觉与模式识别学术速递

    然而,亮度下降和视觉障碍(如眩光、雾)会导致视觉摄像机的图像质量差,从而导致性能下降。为了克服这些挑战,我们探讨了利用不同的数据模式的想法,该模式与可视数据完全不同,但又是互补的。 分类|识别相关(5篇) 【1】 Cross Attentional Audio-Visual Fusion for Dimensional Emotion Recognition 标题:交叉注意视听融合在空间情感识别中的应用 多模态情感识别的最有效技术有效地利用各种互补信息源,如面部、声音和生理模式,以提供全面的特征表示。在本文中,我们重点研究了基于视频中人脸和声音模式融合的多维情感识别,其中可能捕捉到复杂的时空关系。 然而,随着范式的变化,传统的CV和ML中的许多技术都不适用于这些基于事件的时空视觉流。因此,存在数量有限的识别、检测和分割方法。 使用深度学习并不总是解决与计算机视觉相关的问题。

    1.2K30发布于 2021-11-17
  • 来自专栏ATYUN订阅号

    Keras和PyTorch的视觉识别与迁移学习对比

    图像分类,是计算机视觉任务之一。由于在大多数情况下从头开始训练很难实施(因为它很需要数据),我们使用在ImageNet上预训练的ResNet-50进行迁移学习。我们尽可能贴合实际地展示概念差异和惯例。 这足以学习很多可能在其他视觉任务中有用的纹理和模式,甚至可以辨别异形大战铁血战士中的异形。这样,我们使用更少的计算能力来取得更好的结果。 几乎所有的视觉任务都在不同程度上受益于训练的数据增加。在我们的案例中,我们随机剪切,缩放和水平翻转我们的异形和铁血战士。

    5.1K40发布于 2018-10-25
  • 来自专栏arXiv每日学术速递

    计算机视觉与模式识别学术速递

    ,如动作识别和启示检测。 虽然简单,但像素级ZS3公式显示,集成视觉语言模型的能力有限,这些模型通常通过图像-文本对进行预训练,目前显示出视觉任务的巨大潜力。 我们的框架增强了被抑制的尾部类激活,然后,使用以一类数据为中心的方法来有效地识别尾部类示例。我们在跨越两个计算机视觉任务的三个数据集上对我们的框架进行了详尽的评估。 因此,视觉表现作为一种交流手段,使用元素构建叙事,就像口头和书面语言一样。 尽管已经提出了一些超分辨率方法来解决这个问题,但它们通常将文本图像视为一般图像,而忽略了笔画(文本的原子单位)的视觉质量对文本识别起着至关重要的作用这一事实。

    1.5K20编辑于 2021-12-17
  • 来自专栏智慧物联产品&方案

    AI智能视觉识别在智慧城市中的应用

    基于AI智能的视觉识别,是当前人工智能最主要的应用功能之一。 要实现强大的AI视觉识别功能,离不开强大的硬件支持。 AI智能视觉识别在智慧城市的应用1、智慧照明:基于AI智能视觉识别,路灯杆可监测感知道路车辆的通行流量、频次、速率等数据,从而智能调节路灯照明功率、启停,实现智慧节能,减少浪费。 3、道路监测:AI智能视觉识别还可以监测感知路面变化,诸如路段积水、井盖缺失、路面出现垃圾杂物等,实现自动告警反馈,提醒路管人员前往处置。 4、安防监测:AI视觉识别最常用的场景也包括安防监控,视频视觉算法包括翻越围栏告警、区域入侵告警、出入人脸识别等,在居民社区、校园、重要设施等场景中起到7*24小时不间断实时安防监控,保障安全放心。

    71300编辑于 2023-04-18
  • 来自专栏arXiv每日学术速递

    计算机视觉与模式识别学术速递

    Yuille,Cihang Xie 机构:Johns Hopkins University, University of California, Santa Cruz 摘要:Transformer是一种强大的视觉识别工具 分类|识别相关(2篇) 【1】 Handwritten Digit Recognition Using Improved Bounding Box Recognition Technique 标题:基于改进边界框识别技术的手写体数字识别 该项目将拍摄一个角色的照片,并对其进行处理,以识别该角色的图像,就像人脑识别各种数字一样。该项目包含对图像处理技术的深刻理解,以及机器学习的大研究领域和机器学习的构造块神经网络。 学习到的表征在许多下游任务上进行评估,即动作识别、声音分类和检索。Crosscross展示了动作识别(UCF101和HMDB51)和声音分类(ESC50)的最新性能。代码和预训练模型将公开提供。 事实上,在视觉领域中,存在许多容易识别的无关特征模式。例如,靠近边界的图像区域不太可能包含分类任务的有用信息。基于这一观点,我们建议重新构建CNN中的注意机制,使其学会忽略,而不是学会参与。

    1.2K20发布于 2021-11-17
  • 来自专栏arXiv每日学术速递

    计算机视觉与模式识别学术速递

    我们展示了我们的FSKD在(i)未知物种的新关键点检测和(ii)少量镜头细粒度视觉识别(FGVR)和(iii)语义对齐(SA)下游任务上的有效性。对于FGVR,检测到的关键点提高了分类精度。 分类|识别相关(13篇) 【1】 Tracking and Long-Term Identification Using Non-Visual Markers 标题:使用非视觉标记进行跟踪和长期识别 链接 最后,我们收集了常用的基准数据集,并报告了UDA在视觉识别问题上的最新方法的结果。 CNN也是预测视觉识别任务中神经和行为反应的主要定量模型。然而,CNN模型有一个广为接受的批评:与新生动物学习迅速有效不同,CNN被认为是“数据饥饿”,需要大量的训练数据来开发准确的对象识别模型。 当CNN接收到与小鸡相似的视觉训练数据时,CNN成功地解决了与小鸡相同的具有挑战性的视图不变对象识别任务。

    1.7K10编辑于 2021-12-17
领券