搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏深度学习
【计算机视觉】一、计算机视觉概述
一、计算机视觉模仿人类视觉系统如何使计算机从数字图像或视频中获得高层次的理解 计算机视觉是人工智能的重要组成部分，是赋予机器自然视觉能力的学科，相当于是人工智能的大门。近年来,计算机视觉取得了长足进步,尤其是在深度学习等人工智能新技术的推动下,计算机视觉系统的性能不断提高,逐步向着人类水平迈进。二、计算机视觉与其它学科领域的关系 计算机视觉与其他许多学科领域存在紧密联系,相互借鉴、交叉渗透,这种跨学科的交叉正是推动计算机视觉不断发展的重要动力。 计算机视觉中已有的许多方法与人类视觉极为相似。许多计算机视觉研究者对研究人类视觉计算模型比研究计算机视觉系统更感兴趣，希望计算机视觉更加自然化，更加接近生物视觉。四、计算机视觉的意义自动识别图像或视频中的对象从视觉数据中提取出潜在信息使计算机看到/学习程序员没有告诉它们的东西用计算算法模仿人类的视觉感知训练计算机理解视觉世界通过视觉感知来认识世界 How
2K10编辑于 2024-07-30
来自专栏编程
计算机视觉
一.计算机视觉 计算机视觉是人工智能 (AI) 的一个领域，是指让计算机和系统能够从图像、视频和其他视觉输入中获取有意义的信息，并根据该信息采取行动或提供建议。如果说人工智能赋予计算机思考的力，那么计算机视觉就是赋予发现、观察和理解的能力。计算机视觉的工作原理与人类视觉类似，只不过人类起步更早。多样性与适应性：深度学习在多个领域都有应用，包括视觉识别、语音识别、自然语言处理、游戏、医学影像分析等五.计算机视觉领域六.计算机视觉应用 1.工业中的计算机视觉在工业中，图像识别被应用于人工智能视觉检测 3.农业中的计算机视觉 计算机视觉在农业中的应用同样正经历着快速发展，旨在提高农业生产的效率和可持续性。七.计算机视觉前景 计算机视觉的前景非常广阔，它被认为是人工智能和机器学习领域最具潜力的技术之一。
75010编辑于 2024-05-11
来自专栏计算机工具
计算机视觉-LeNet
LeNet是最早的卷积神经网络之一。1998年，Yann LeCun第一次将LeNet卷积神经网络应用到图像分类上，在手写数字识别任务中取得了巨大成功。LeNet通过连续使用卷积和池化层的组合提取图像特征，其架构如图1 所示，这里展示的是用于MNIST手写体数字识别任务中的LeNet-5模型：
63610编辑于 2024-12-14
来自专栏信息安全
计算机视觉入门
随着科技的飞速发展，计算机视觉技术逐渐渗透到我们生活的方方面面。无论是手机拍照的自动美颜功能，还是无人驾驶汽车的障碍物识别，都离不开计算机视觉的支持。那么，什么是计算机视觉？它又有哪些应用呢？接下来，让我们一起走进计算机视觉的世界。 计算机视觉是一门研究如何使计算机从图像或视频中获取信息并理解其内容的学科。简单来说，就是让计算机像人一样“看”世界，并从中提取有用的信息。在计算机视觉的应用中，人脸识别无疑是最为人们所熟知的。无论是手机解锁，还是车站安检，人脸识别技术都发挥着重要作用。此外，计算机视觉还在医疗影像分析、安防监控、自动驾驶等领域发挥着巨大作用。比如，在医疗领域，医生可以通过计算机视觉技术快速准确地识别出病变区域；在安防领域，智能监控系统可以实时监测并识别出异常行为。当然，计算机视觉技术的发展也离不开深度学习的支持。对于初学者来说，学习计算机视觉可能会有些困难，但只要掌握了基础知识，并多加实践，就一定能够掌握这门技术。同时，随着技术的不断进步，相信计算机视觉将会在未来的更多领域发挥更大的作用。
47710编辑于 2024-10-09
来自专栏智能算法
机器视觉与计算机视觉的区别？
计算机视觉与机器视觉，首先是应用场景不一样，就像@Vinjn张静回答的那样：你把摄像头对着人就是CV，对着车间就是MV。 计算机视觉和机器视觉应用场景不同，就像拉货车和载客车是的，侧重点不同而已，一个侧重人工智能分支，一个侧重工业应用！既然要求这么高，是不是机器视觉就比计算机视觉难呢？也不是的，应该说各有各的难处。 计算机视觉的应用场景相对复杂，要识别的物体类型也多，形状不规则，规律性不强。关于速度，一般机器视觉的分辨率远高于计算机视觉，而且往往要求实时，所以处理速度很关键，目前基本上不适合采用深度学习。以上讨论的是技术，商业方面，计算机视觉的应用面更广一些，毕竟很多业务是跟人相关，比如人脸识别，行为分析等，很多垂直领域都有计算机视觉潜在需求，相对来说，更适合创业；而机器视觉顾名思义，业务主要跟机器相关
3.6K111发布于 2018-04-03
来自专栏流川疯编写程序的艺术
推荐一个计算机视觉图书：python计算机视觉编程
) #axis('off') title('Plotting: "empire.jpg"') show() 这个编辑器着实不错，可以下断点，单步调试啥的，完全满足日常需要，python又降低了进行计算机视觉相关研究的门槛啊
1.1K20发布于 2019-01-18
来自专栏52ai人工智能
什么是计算机视觉？什么是机器视觉？
然而，小伙伴们知道视觉对于机器人是多么难能可贵吗？我们平时所说的计算机视觉和机器视觉又有什么区别呢？今天小编就为大家讲一讲什么是计算机视觉、什么又是机器视觉。机器视觉则偏重于计算机视觉技术工程化，能够自动获取和分析特定图像，以控制相应的行为。 1 计算机视觉 计算机视觉是指用摄像机和电脑及其他相关设备，对生物视觉的一种模拟。 计算机视觉的最终目标是使计算机能像人那样通过视觉观察和理解世界，具有自主适应环境的能力。如何让计算机从这些死板的数字里面读取到有意义的视觉线索，是计算机视觉应该解决的问题。然而，计算机视觉发展多年，却依然存在着一系列难以解决的难题。 计算机视觉的研究很大程度上是针对图像的内容。如下图所示，如何让计算机判断出图片中都是猫，才是计算机视觉研究的内容。机器视觉主要是指工业领域的视觉研究，例如自主机器人的视觉，用于检测和测量的视觉。
1.7K31发布于 2019-01-18
来自专栏arXiv每日学术速递
计算机视觉学术速递
利用扩展数据集，我们开发和训练了接管时间（TOT）模型，这些模型在计算机视觉算法产生的中高级特征上依次运行，这些特征在不同的面向驾驶员的摄像机视图上运行，显示了在扩展数据集上训练的模型优于初始数据集。 Winter Conference of Computer Vision (WACV 2022) 链接：https://arxiv.org/abs/2107.12859 摘要：物体的自主装配是机器人技术和三维计算机视觉中的一项重要任务 respectively. 【3】 Computer Vision-Based Guidance Assistance Concept for Plowing Using RGB-D Camera 标题：基于计算机视觉的 on Imaging Systems and Techniques, August 24-26 2021 链接：https://arxiv.org/abs/2107.12646 摘要：提出了一种基于计算机视觉的农用车辅助导航系统的概念像ImageNet这样的数据集彻底改变了计算机视觉应用，可以加速新型作物制图技术的发展。目前，美国农业部（USDA）每年发布耕地数据层（CDL），该数据层包含整个美利坚合众国分辨率为30m的作物标签。
2.7K40发布于 2021-07-29
来自专栏机器视觉工坊
计算机视觉入门基础
1、计算机视觉是一门研究如何使机器“看”的科学。是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给一起检测的图像。 2、计算机视觉的应用无人驾驶无人安防人脸识别文字识别车牌识别以图搜图 VR/AR 3D重构医学图像分析诊断 4、计算机视觉的实现基本过程为： 1）计算机从图片中生成数学模型。 2）计算机图形在模型中对图像进行绘制，然后在图像处理过程中将其作为输入，另外给出处理图像作为输出。 ? 5、计算机视觉的理念在某些方面其实与很多概念有部分重叠，包括：人工智能、数字图像处理、机器学习、深度学习、模式识别、概率图模型、科学计算以及一系列的数学计算等。 6、计算机视觉库OpenCV是Intel开源计算机视觉库。它由一系列 C 函数和少量 C++ 类构成，实现了图像处理和计算机视觉方面的很多通用算法。
1K20发布于 2020-07-28
来自专栏arXiv每日学术速递
计算机视觉学术速递
Information Technology, School of Computer Science, Beijing Institute of Technology, Beijing , China 摘要：图像共分割在计算机视觉领域引起了广泛的关注然而，在生成性对抗网络（GAN）的训练中利用这些视觉解释是计算机视觉研究中一个尚未探索的领域。事实上，我们认为这类信息可以以积极的方式影响GANs训练。 Centre for Craniofacial and Regenerative Biology, King’s College London, London SE,RT, UK 摘要：近年来，深入学习计算机视觉技术在许多成像领域取得了许多成功，因为超过85%的外部信息是通过视觉系统获得的。 TUM-VIE包括具有挑战性的序列，其中最先进的视觉SLAM算法要么失败，要么导致大漂移。因此，我们的数据集有助于推动未来基于事件的视觉惯性感知算法的研究。
2.5K30发布于 2021-08-24
来自专栏SIGAI学习与实践平台
计算机视觉文章盘点
cycle-consistency，降低视频标注成本关键词：视频标注论文解读 Receptive Field Block Net for Accurate and Fast 关键词：检测模型 计算机视觉技术目标跟踪相关行人检测算法综述关键词：行人检测行人重识别 PCB-RPP，SGGNN 关键词：行人重识别【CVPR2018】最新 Video-based ReID 论文解读关键词：ReID 视觉多目标跟踪算法综述关键词：图匹配图像分割技术介绍关键词：图像分割视频分割在移动端的算法进展综述关键词：语义分割视频语义分割介绍关键词：语义分割三维深度学习中的目标分类与语义分割关键词：语义分割基于单目视觉的三维重建算法综述
1.2K20发布于 2019-05-17
来自专栏arXiv每日学术速递
计算机视觉学术速递
其中一个特征就是火焰中不同辐射区域的分割，因此本文对几种传统的计算机视觉和深度学习分割方法进行了探索性的研究。张量能够有效地捕捉结构化的、潜在的语义空间和高阶的交互作用，在计算机视觉领域有着悠久的应用历史。随着计算机视觉深度学习范式转换的到来，张量变得更加重要。本文在表征学习和深度学习的背景下对张量和张量方法进行了深入而实用的回顾，特别侧重于视觉数据分析和计算机视觉应用。具体地说，除了基于张量的可视化数据分析方法的基础工作之外，我们还关注最近的发展，这些发展导致了张量方法的逐渐增加，特别是在深度学习体系结构中，以及它们在计算机视觉应用中的含义。该算法在未来的量子计算体系结构中具有向更高维度扩展的潜力，为解决三维计算机视觉和图形中的匹配问题开辟了多个新的方向。
2.6K20发布于 2021-07-27
来自专栏arXiv每日学术速递
计算机视觉学术速递
了解DNN模型对计算机辅助诊断模型的信心对于获得临床医生对基于DL的解决方案的信心和信任是必要的。为了解决这个问题，这项工作提出了三种不同的方法来量化皮肤癌检测图像的不确定性。我们提出的FoleyGAN模型能够调节视觉事件的动作序列，从而产生视觉对齐的真实音轨。在这篇文章中，我们详细介绍了各种基于医学影像学的研究，如X射线和计算机断层扫描（CT）图像，以及分类COVID-19感染与肺炎的DL方法。近年来，计算机视觉和医学成像领域中的生成性对抗网络（Generative敌对网络，GANs）的发展为增强肿瘤检测和分析能力提供了基础。，具有触觉或视觉先验知识，用于指导形状探索。
2.1K20发布于 2021-07-27
来自专栏arXiv每日学术速递
计算机视觉学术速递
\url{this https URL} 链接：https://arxiv.org/abs/2107.12292 摘要：具有自我关注的Transformer引发了自然语言处理领域的一场革命，并在众多的计算机视觉任务中激发了 IEEE International Conference on Computer Vision (ICCV), 2021 链接：https://arxiv.org/abs/2107.12081 摘要：视觉文本识别无疑是计算机视觉中研究最广泛的课题之一 unchen,ETH Zurich,Westwell lab 备注：Accepted to ICCV 2021 链接：https://arxiv.org/abs/2107.11992 摘要：点云配准是三维计算机视觉中的一个基本问题我们从计算机视觉和自然语言处理的不同数据集和任务来评估我们的方法。在本文中，我们提出了一种多实例学习（MIL）技术，通过计算机视觉分析LC手术图像来评估胆囊壁血管。这些滤袋对应于53例手术中181gb图像的标记（低与高）血管数据集。
3.3K20发布于 2021-07-28
来自专栏arXiv每日学术速递
计算机视觉学术速递
我们还用计算机视觉中流行的ResNet图像分类器进行了实验，进一步验证了我们的观点。Kinetics400上的结果与一些基于时空建模的最佳CNN方法相当。 Corresponding author 链接：https://arxiv.org/abs/2106.14306 摘要：从多个立体和立体图像中提取三维信息，作为基于图像的透视几何的一个重要应用，在计算机视觉卷积神经网络（CNN）通过引入图像处理中的诱导偏差，在许多计算机视觉任务中取得了优异的性能，并被确立为事实上的主干。近年来，受Transformer在NLP任务中取得巨大成功的启发，视觉Transformer模型应运而生。与CNN相比，使用更少的诱导偏差，他们在计算机视觉任务中取得了很好的效果。在这篇综述文章中，我们讨论了具身视觉语言规划（EVLP）任务，这是一系列突出的具身导航和操作问题，它们共同使用计算机视觉和自然语言。
3.1K30发布于 2021-07-02
来自专栏计算机工具
什么是计算机视觉,计算机视觉的主要任务及应用
什么是计算机视觉研究者为了让机器像人一样“看懂”图像，研究了人类视觉系统，该系统包含眼球（接收光信号）、视网膜（光信号转换为电信号，传输到大脑）、大脑皮层（提取电信号中的有效特征，引导人做出反应）。为了让机器模拟人类视觉系统，研究者用摄像头模拟“眼球”获得图像信息；用数字图像处理模拟“视网膜”将模拟图像变成数字图像，让计算机能识别；用计算机视觉模拟“大脑皮层”，设计算法提取图像特征，做识别检测等任务机器模拟人类视觉系统便是机器视觉，也称计算机视觉（Computer Vision, CV），是在解决机器如何‘看’的问题。 2. 计算机视觉的主要任务及应用 计算机视觉应用非常广泛，有图像分类（Image Classification）、目标检测(Object Detection)、图像分割(Image Segmentation) 目标跟踪是计算机视觉中一个课题，具有重要的理论研究意义和应用价值，在智能视频监控系统、智能人机交互、智能交通和视觉导航系统等方面具有广泛应用。
3.4K10编辑于 2024-12-14
来自专栏深度学习自然语言处理
计算机视觉如何入门
第三点，可能是大家都比较感兴趣的，就是计算机视觉作为人工智能的一个分支，它不可避免的要跟深度学习做结合，而深度学习也可以说是融合到了计算机视觉、图像处理，包括我们说的自然语言处理，所以本文也会简单介绍一下计算机视觉与深度学习的结合 2.什么是计算机视觉 计算机视觉是一门研究如何使机器“看”的科学。 计算机视觉的应用无人驾驶无人安防人脸识别车辆车牌识别以图搜图 VR/AR 3D重构医学图像分析无人机其他了解了计算机视觉是什么之后，给大家列了一下当前计算机视觉领域的一些应用，几乎可以说是无处不在 6.计算机视觉与其他学科的关系 计算机视觉目前跟其他学科的关系非常的多，包括机器人，以及刚才提到的医疗、物理、图像、卫星图片的处理，这些都会经常使用到计算机视觉，那这里呢，最常问到的问题无非就是有三个概念 9.需要了解和学习的开源框架 OpenCV 它是一个很经典的计算机视觉库，实现了很多计算机视觉的常用算法。可以帮助大家快速上手。 Caffe 如果是做计算机视觉的话，比较建议 Caffe。
86520发布于 2018-07-25
来自专栏arXiv每日学术速递
计算机视觉学术速递
Classification of Blood Cells - End to End Computer Vision based diagnosis case study 标题：血细胞多级分类--基于计算机视觉的端到端诊断案例研究我们证明了我们的视觉变换器是卷积神经网络（CNNs）和视觉变换器的强大竞争对手。迄今为止，大多数应用都是在计算机视觉领域，尽管一些医疗领域的工作已经开始出现。近年来，深度学习（DL）在心脏MR分割中的应用已经取得了令人印象深刻的成果，这些技术也开始被应用到临床实践中。随着神经网络在计算机视觉中的成功应用，有监督的深度学习方法在单幅图像去噪中表现出了突出的性能，这种方法依赖于大数据集的干净图像对和有噪声的图像对。 Ltd 备注：10 pages, 9 figures 链接：https://arxiv.org/abs/2106.12302 摘要：基于单个图像的三维人脸重建是计算机视觉领域的一个研究热点，特别是由于其在真实感三维化身创建
2.1K20发布于 2021-07-02
来自专栏PyVision
计算机视觉在特斯拉
作者：Jeremy Cohen 编译：McGL 当我们观察计算机视觉世界时，可以看到现实与网络课程之间的真实差距。特别是，我们需要解决特斯拉的一个大问题: 大约50个任务必须同时在设备上运行，只用一台计算机，不能占用太多的空间。 ? FSD计算机那么让我们开始吧！ 1. 两个摄像头的深度估计使用这种立体视觉和传感器融合，特斯拉不需要激光雷达。他们可以根据这两个摄像头进行距离估计。唯一的窍门是摄像头使用不同的镜头: 在右边，更远的距离显得更近。推理@FSD ——特斯拉制造了自己的计算机，拥有自己的神经处理单元(NPU)和用于推理的GPU。下面是我们刚才讨论的所有内容的总结: 特斯拉同时运行50项任务，这些任务都必须在一台名为 FSD (完全自动驾驶)的非常小的计算机上运行。
1.2K20发布于 2020-09-03
来自专栏arXiv每日学术速递
计算机视觉学术速递
pages, 3 figures, 8 tables, Submitted to Neurips 2021 链接：https://arxiv.org/abs/2106.08382 摘要：近年来，注意机制在计算机视觉领域得到了广泛的应用我们利用计算机视觉和音频信号中大规模数据集上预先训练好的模型来提取视频中时间戳的深度表示。由于时间卷积网络在内存消耗和并行性方面的优势，它被用来研究时间关系，而不是类似于RNN的体系结构。 currently under review in an international journal 链接：https://arxiv.org/abs/2106.08710 摘要：移动增强现实（MAR）将计算机生成的虚拟对象与移动设备的物理环境相结合，在物联网中，大量的视觉信号必须被压缩并输入机器。本文提出并研究了用压缩视觉表示支持多个机器视觉分析任务的新问题，即分析分类学中的信息压缩问题。
2.1K20发布于 2021-07-02

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

【计算机视觉】一、计算机视觉概述

计算机视觉

计算机视觉-LeNet

计算机视觉入门

机器视觉与计算机视觉的区别？

推荐一个计算机视觉图书：python计算机视觉编程

什么是计算机视觉？什么是机器视觉？

计算机视觉学术速递

计算机视觉入门基础

计算机视觉学术速递

计算机视觉文章盘点

计算机视觉学术速递

计算机视觉学术速递

计算机视觉学术速递

计算机视觉学术速递

什么是计算机视觉,计算机视觉的主要任务及应用

计算机视觉如何入门

计算机视觉学术速递

计算机视觉在特斯拉

计算机视觉学术速递

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐