首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI

    视觉

    学习如何使用 GPT-4 来理解图像介绍具有视觉功能的 GPT-4 Turbo 允许模型接收图像并回答与之相关的问题。在历史上,语言模型系统受限于仅接收单一输入模态,即文本。 在探索视觉理解可以应用于哪些用例时,牢记模型的局限性是很重要的。 限制虽然具备视觉功能的 GPT-4 功能强大,可以在许多情况下使用,但了解模型的局限性是很重要的。以下是我们所知的一些限制:医学图像:模型不适合解释专业医学图像,如 CT 扫描,不应用于医疗建议。 视觉元素:模型可能难以理解图表或文字中颜色或样式(如实线、虚线或点线)变化的情况。空间推理:模型在需要精确空间定位的任务上表现不佳,例如识别国际象棋位置。

    1K10编辑于 2024-04-22
  • 来自专栏深度学习和计算机视觉

    视觉工程师必备视觉知识

    一 、机器视觉优势 机器视觉系统具有高效率、高度自动化的特点,可以实现很高的分辨率精度与速度。机器视觉系统与被检测对象无接触,安全可靠。 人工检测与机器视觉自动检测的主要区别有: 二 、案例 为了更好地理解机器视觉,下面,我们来介绍在具体应用中的几种案例。 如果视觉系统检测到一个啤酒瓶未填充到位,即未通过检测,视觉系统将会向转向器发出信号,将该啤酒瓶从生产线上剔除。操作员可以在显示屏上查看被剔除的啤酒瓶和持续的流程统计数据。 该应用采用了深圳视觉龙公司VD200视觉定位系统,该系统通过判断玩偶正反面,把玩偶处于正面的坐标值通过串口发送给机器人,机器人收到坐标后运动抓取产品,当振动盘中有很多玩偶处于反面时,VD200视觉定位系统需判断反面玩偶数量 通过VD200视觉定位系统实现自动上料,大大减少人工成本,大幅提高生产效率。 03 视觉检测在电子元件的应用 此产品为电子产品的按钮部件,产品来料为料带模式,料带上面为双排产品。

    44510编辑于 2024-09-25
  • 来自专栏人工智能领域

    视觉识别技术:开启智能视觉新时代

    视觉识别技术的简介 视觉识别技术,通常被称为计算机视觉,是指使用计算机模拟人类视觉系统来解释和理解图像和视频数据的过程。 视觉识别技术的核心在于能够从视觉世界中提取有用的信息,并将其转化为可操作的数据。 视觉识别系统 (简称VI,英文Visual Identity的缩写 )是运用系统的、统一的视觉符号系统。 视觉识别是静态的识别符号具体化、视觉化的传达形式,项目最多,层面最广,效果更直接。 视觉识别(VI)在CIS系统大众所接受,具有主导的地位。 视觉识别在现代科技中的重要性 视觉识别技术在现代科技中扮演着越来越重要的角色。 一、视觉识别技术的基础 1.计算机视觉的起源和发展 1.1计算机视觉的基本概念 计算机视觉是一门研究如何使机器“看”的科学,它旨在利用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理

    1.7K10编辑于 2024-12-18
  • 来自专栏机器人视觉

    为何工业4.0离不开机器视觉 看人类视觉VS机器视觉

    机器视觉是实现工业自动化强有力的工具,与人类视觉相比,机器视觉的可靠性更高,客观性更强,持续工作时间越长。   如果到了高温、寒冷、狭窄或者高空等极端的场景下,人类的视觉检测就没办法用了。所以,高效准确、灵活稳定、信息丰富、应用广泛的机器视觉开始逐渐代替人类视觉,带领生产制造业走向提速增效的发展之路。   一套机器视觉系统一般包含光源、镜头、工业相机、机器视觉软件等软硬件产品,工业相机在合适的光照下采集被测物的图像,再由机器视觉视觉软件对图像进行数字化分析及处理。 在机器视觉中,相机快门时间可达微秒级,还能够感知紫外到红外的宽波段范围光谱,且机器视觉产品有宽温、抗振等不同性能可以选择,适应性强,因此,相较于人类视觉,机器视觉成本更低,且更加高效稳定,应用广泛。 机器视觉和人类视觉的差别:  1、观测精度  人类视觉:人类手工操作无法达到高精度要求。  机器视觉:识别精度和抓取精度均高于人类操作精度,可精准地控制位移量。  

    92220编辑于 2022-11-14
  • 来自专栏智能算法

    机器视觉与计算机视觉的区别?

    计算机视觉与机器视觉,首先是应用场景不一样,就像@Vinjn张静 回答的那样:你把摄像头对着人就是CV,对着车间就是MV。 计算机视觉和机器视觉应用场景不同,就像拉货车和载客车是的,侧重点不同而已,一个侧重人工智能分支,一个侧重工业应用! 机器视觉,主要侧重对量的分析,比如通过视觉去测量一个零件的直径,一般来说,对准确度要求很高。我记得以前接触过一个需求: 视觉测量铁路道岔缺口。 有些机器视觉也需要分析质,比如零件自动分拣。但,计算机视觉一般来说对量的要求不会很高,商场人数统计误差个百分之几死不了人的,但机器视觉真的会,比如那个道岔缺口测量。 既然要求这么高,是不是机器视觉就比计算机视觉难呢?也不是的,应该说各有各的难处。 计算机视觉的应用场景相对复杂,要识别的物体类型也多,形状不规则,规律性不强。

    3.5K111发布于 2018-04-03
  • 来自专栏智能算法

    机器视觉算法(系列一)--机器视觉简短入门

    机器视觉是人工智能正在快速发展的一个分支。机器视觉作为生产过程中关键技术之一,在机器或者生产线上,机器视觉可以检测产品质量以便将不合格的产品剔除,或者指导机器人完成组装工作,与整个生产密切相关。 由于笔者正处于机器视觉行业,所以准备和大家一起系统的学习机器视觉方面相关知识,主要包括常见的机器视觉算法,以及常见的应用领域算法的实现等,欢迎大家的讨论和交流。 本文主要介绍机器视觉经典系统,常用领域以及机器视觉常用的图像处理库,希望以此作为一个简短入门。 1.机器视觉经典系统 简单说来,机器视觉就是用机器代替人眼来做测量和判断。 机器视觉系统是通过机器视觉产品(即图像摄取装置,分CMOS和CCD两种)将被摄取目标转换成图像信号,传送给专用的图像处理系统,得到被摄目标的形态信息,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征 那么一个经典的机器视觉系统长什么样呢? ?

    3.7K80发布于 2018-04-03
  • 来自专栏行走的机械人

    机器视觉简述

    21世纪初期,随着机器视觉技术的深入研究,机器视觉替代人眼开始成为共识,在工业,医疗,交通,生活等等多个领域开始快速发展并走向成熟。 我国机器视觉发展较晚,从零几年开始至今仅有十几年的时间。 机器视觉系统简述 机器视觉有其成熟的系统组成元素,包括相机、镜头、光源、计算机、软件与算法等等。机器视觉系统与自动化生产线相交互,以此达到产业智能化的功能。 由于没有通用的机器视觉照明设备,所以针对每个特定的应用实例,要选择相应的视觉光源,以达到最佳效果。 机器视觉软件 机器视觉软件是机器视觉系统中自动化处理的关键部件,根据具体应用需求,对软件包进行二次开发,可自动完成对图像采集、显示、存储和处理。 其原理是由计算机、图像处理器以及相关设备来模拟人的视觉行为,完成得到人的视觉系统所得到的信息。

    1.2K60编辑于 2022-09-19
  • 视觉信息理论

    视觉上来看,这看起来像是一些正方形膨胀的概率增加了,而其他方格正在缩小,因为这两个事件不太可能相互关联: prob-2D-dependant-rain-squish.png 但是,虽然这可能看起来很有意思 这使您可以在视觉上一起显示出分布概率和代码。 在视觉上,这意味着H(X|Y)是指H(X)的条形图中不与H(Y)重叠的部分。 现在,您可以从下面的图中看到不等式 的表示。 Hxy-info-4.png 另一个标识是 。 这使我们在证明中具有很多log(2),使它在视觉上更好。↩ 请注意,这个交叉熵的记号是非标准的。正态分布是H(p,q)。这个符号是很容易弄混了的,有两个原因。首先,联合熵也使用完全相同的符号。

    1.4K60发布于 2018-02-02
  • 来自专栏全栈程序员必看

    ccd视觉定位教程_CCD视觉定位识别系统,视觉系统ccd定位原理

    CCD机器视觉系统是用于工业检测及识别的高科技产品,生产的核心问题是工业计算机系统选型,可采集加工品的高清图像直接传输给到机子的GPIO接口。 由于数字图像处理和计算机视觉技术的迅速发展,越来越多的研究者采用摄像机作为全自主用移动机器人的感知传感器。这主要是因为原来的超声或红外传感器感知信息量有限,鲁棒性差,而视觉系统则可以弥补这些缺点。 而现实世界是三维的,而投射于摄像镜头(CCD/CMOS)上的图像则是二维的,视觉处理的最终目的就是要从感知到的二维图像中提取有关的三维世界信息。 CCD视觉定位系统工作原理及过程 ccd视觉定位由于数字图像处理和计算机视觉技术的迅速发展,越来越多的研究者采用摄像机作为全自主用移动机器人的感知传感器。 这主要是因为原来的超声或红外传感器感知信息量有限,鲁棒性差,而视觉系统则可以弥补这些缺点 ccd视觉定位算法:基于滤波器的定位算法主要有KF、SEIF、PF、EKF、UKF等。

    1.6K10编辑于 2022-07-02
  • 来自专栏深度学习

    【计算机视觉】一、计算机视觉概述

    一、计算机视觉 模仿人类视觉系统 如何使计算机从数字图像或视频中获得高层次的理解   计算机视觉是人工智能的重要组成部分,是赋予机器自然视觉能力的学科,相当于是人工智能的大门。    二、计算机视觉与其它学科领域的关系   计算机视觉与其他许多学科领域存在紧密联系,相互借鉴、交叉渗透,这种跨学科的交叉正是推动计算机视觉不断发展的重要动力。 计算机视觉中已有的许多方法与人类视觉极为相似。许多计算机视觉研究者对研究人类视觉计算模型比研究计算机视觉系统更感兴趣,希望计算机视觉更加自然化,更加接近生物视觉。    人类视觉系统设计给了计算机视觉极大的启发,很多生物视觉计算模型都被成功应用于视觉算法中,如卷积神经网络等。 四、计算机视觉的意义 自动识别图像或视频中的对象 从视觉数据中提取出潜在信息 使计算机看到/学习程序员没有告诉它们的东西 用计算算法模仿人类的视觉感知 训练计算机理解视觉世界 通过视觉感知来认识世界 How

    1.9K10编辑于 2024-07-30
  • 来自专栏TechBlog

    通用视觉框架OpenMMLab图像分类与基础视觉模型

    {\Theta^{*}}(\hat{X}) 传统方法:设计图像特征(1990s~2000s) 特征工程的天花板 在ImageNet 图像识别挑战赛里,2010 和2011 年的冠军队伍都使用了经典的视觉方法 从特征工程到特征学习 层次化特征的实现方式 AlexNet 的诞生& 深度学习时代的开始 在2012 年的竞赛中,来自多伦多大学的团队首次使用深度学习方法,一举将错误率降低至15.3% ,而传统视觉算法的性能已经达到瓶颈 卷积神经网络 • 轻量化卷积神经网络 • 神经结构搜索 • Transformer 模型学习:求解一组好的参数Θ • 监督学习:基于标注数据学习 • 损失函数 • 随机梯度下降算法 • 视觉模型常用训练技巧

    98420编辑于 2023-02-24
  • 来自专栏52ai人工智能

    什么是计算机视觉?什么是机器视觉

    然而,小伙伴们知道视觉对于机器人是多么难能可贵吗?我们平时所说的计算机视觉和机器视觉又有什么区别呢?今天小编就为大家讲一讲什么是计算机视觉、什么又是机器视觉。 机器视觉则偏重于计算机视觉技术工程化,能够自动获取和分析特定图像,以控制相应的行为。 1 计算机视觉 计算机视觉是指用摄像机和电脑及其他相关设备,对生物视觉的一种模拟。 在一些不适合于人工作业的危险工作环境或人工视觉难以满足要求的场合,常用机器视觉来替代人工视觉;同时在大批量工业生产过程中,用人工视觉检查产品质量效率低且精度不高,用机器视觉检测方法可以大大提高生产效率和生产的自动化程度 3 计算机视觉与机器视觉的异同 毋庸置疑,计算机视觉与机器视觉在技术和应用领域上都有相当大的重叠,这表明这两个学科的基础理论大致是相同的,但细究其机理,确实也有一些不同之处: 计算机视觉的研究对象主要是映射到单幅多幅图像上的三维场景 计算机视觉的研究很大程度上是针对图像的内容。如下图所示,如何让计算机判断出图片中都是猫,才是计算机视觉研究的内容。 机器视觉主要是指工业领域的视觉研究,例如自主机器人的视觉,用于检测和测量的视觉

    1.6K31发布于 2019-01-18
  • 来自专栏又见苍岚

    机器视觉 —— 成像

    本文记录《机器视觉》 第二章图像成像原理相关内容,主要介绍图像是如何产生的。 参考资料 《机器视觉》第二章。

    1.9K20编辑于 2022-08-09
  • 来自专栏全栈程序员必看

    视觉slam和激光slam结合_视觉slam和激光slam

    激光 SLAM 地图构建 VSLAM(基于视觉的定位与建图): 随着计算机视觉的迅速发展,视觉 SLAM 因为信息量大,适用范围广等优点受到广泛关注。 ,再通过累计位姿变化来计算距离物体的距离,并进行定位与地图构建; 视觉SLAM和激光SLAM的对比 一直以来,不管是产业界还是学术界,对激光 SLAM 和 VSLAM 到底谁更胜一筹,谁是未来的主流趋势这一问题 其他 除了上面几点之外,在探测范围、运算强度、实时数据生成、地图累计误差等方面,激光 SLAM 和视觉 SLAM 也会存在一定的差距。 激光 SLAM 是目前比较成熟的定位导航方案,视觉 SLAM 是未来研究的一个主流方向。所以,未来,多传感器的融合是一种必然的趋势。 视觉SLAM相关资料 常用方法 特征法: ORB SLAM https://github.com/raulmur/ORB_SLAM2 优势: 在静态环境下定位准确,稳定, 单目和双目版本都可以达到实时

    1.4K31编辑于 2022-09-23
  • 来自专栏一点人工一点智能

    视觉系统 | 基于目标检测的动态环境视觉SLAM

    01 中文摘要 许多视觉同步定位和映射(VSLAM)系统需要在环境中假设静态特征。然而,移动物体会极大地损害VSLAM系统的性能,因为VSLAM系统是基于静态环境假设的。 为了减少动态内容的影响,我们将基于深度学习的目标检测方法引入视觉里程计中,然后加入动态目标概率模型,以提高目标检测深度神经网络的效率,提高系统的实时性能。 02 主要结论 本文提出了一种实时视觉SLAM系统,该系统在具有许多独立运动目标的高度动态环境中运行良好。ORB-SLAM2系统将目标检测和动态目标概率模型结合起来,在高动态环境下有了显著改进。 这表明我们能够处理具有挑战性的动态目标,并大幅改善视觉里程计估计。因此,在高度动态的场景中,可获得更稳健、更准确的定位和映射结果。 尽管如此,研究仍有改进空间。 在本文提出的视觉SLAM系统中,用于目标检测线程的深度神经网络是一种有监督的方法。也就是说,当训练场景与实际场景之间存在显著差异时,检测器模型可能很难预测正确的结果。

    73120编辑于 2022-12-27
  • 来自专栏新智元

    剑桥构建视觉“语义大脑”:兼顾视觉信息和语义表示

    剑桥大学的神经科学研究人员将计算机视觉与语义相结合,开发出一种新模型,可以更清晰地理解大脑对视觉目标的处理方式。 与之前的大多数研究相比,这一识别技术既考虑了视觉信息,也考虑了关于被识别目标的概念知识。 计算机视觉的模型可以区分香蕉和猕猴桃,但这些模型并不是对更抽象的知识进行编码,即:它们都是水果。” 研究人员认识到神经网络在计算机视觉应用方面的局限性,将AlexNet视觉算法与神经网络相结合,将概念性的意义(包括语义知识)纳入到对方程的分析中。 与传统的深度神经网络(DNN)视觉模型相比,新方法能够识别与视觉和语义处理相关的不同脑区。 ? 图为视觉深度神经网络(紫色)和语义吸引网络(红色-黄色)的不同层如何映射到大脑的不同区域。

    88020发布于 2018-08-01
  • 来自专栏杀马特

    计算机视觉:撕裂时空的视觉算法革命狂潮

    一·本篇介绍: 在科技飞速发展的今天,计算机视觉作为人工智能领域的重要分支,正以前所未有的速度改变着我们的生活。从智能手机的人脸识别解锁功能,到自动驾驶汽车的环境感知系统,计算机视觉技术无处不在。 本文将深入探讨计算机视觉领域的关键技术和算法,并结合 C++ 代码进行详细的实现和分析,带领读者领略这场视觉算法的革命狂潮。 二计算机视觉基础: 2.1 图像表示与处理: 2.1.1 图像的基本概念: 在计算机视觉中,图像通常被表示为一个二维矩阵,矩阵中的每个元素代表一个像素点的颜色值。 OpenCV 是一个广泛应用于计算机视觉领域的开源库,提供了丰富的图像处理和计算机视觉算法。 本篇直观呈现了计算机视觉技术的实现过程。计算机视觉正以前所未有的速度发展,未来将在更多领域创造惊喜,推动科技进步迈向新高度。

    28800编辑于 2025-01-26
  • 来自专栏一点人工一点智能

    小白系列(3)| 计算机视觉之直接视觉跟踪

    首先,我们将介绍几种视觉跟踪方法。然后,我们将解释如何对它们进行分类。我们还将讨论直接视觉跟踪的基本内容,特别关注基于区域的方法和基于梯度的方法。 目录: 视觉跟踪简介 对视觉跟踪方法进行分类 基于区域的跟踪方法 基于梯度的方法 总结 01 视觉跟踪 视觉跟踪,也称为目标跟踪或视频跟踪,是使用视觉信息估计场景中目标对象的轨迹的问题。 视觉信息可以来自不同的成像源。我们可以使用光学相机、热像仪、超声波、X 射线或磁共振等。 以下是最常见的成像设备列表: 此外,视觉跟踪是一个非常受欢迎的话题,因为它在各种各样的问题中都有应用。 02 视觉跟踪方法的分类 视觉跟踪方法可以根据以下主要组成部分进行分类: 现在,让我们更详细地看一下这些组件。 在视觉跟踪中称为目标表示(Target Representation)。

    98220编辑于 2022-12-27
  • 来自专栏iOS开发攻城狮的集散地

    UIScrollView视觉差动画

    前言:看到凤凰新闻 头条栏目的编辑推荐新闻是这个效果,觉得不错,就想着实现一下,以下就是我的实现过程,示例代码请看这儿→UIScrollView视觉差动画。 SCROLLVIEW_WIDTH; leftView横坐标 = leftIndex * SCROLLVIEW_WIDTH; [刚向左拖拽时的结构示意图] 以上就是我实现这个效果的过程,示例代码请看这儿UIScrollView视觉差动画

    1.1K140发布于 2018-05-21
  • 来自专栏iOS开发攻城狮的集散地

    UIScrollView视觉差动画

    前言:看到凤凰新闻 头条栏目的编辑推荐新闻是这个效果,觉得不错,就想着实现一下,以下就是我的实现过程,示例代码请看这儿→UIScrollView视觉差动画。 SCROLLVIEW_WIDTH; leftView横坐标 = leftIndex * SCROLLVIEW_WIDTH; 刚向左拖拽时的结构示意图 以上就是我实现这个效果的过程,示例代码请看这儿UIScrollView视觉差动画

    1K60发布于 2018-05-22
领券