搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏信数据得永生
树莓派计算机视觉编程：11~13
十一、计算机视觉的实际应用在上一章中，我们研究了计算机视觉中的各种高级概念，例如形态运算和轮廓。本章是我们在前面各章中学习和展示的所有计算机视觉概念的最终总结。在本章中，我们将使用我们较早学习的计算机视觉操作来实现一些实际项目。我们还将学习一些新概念，例如背景减法和光流计算，然后在小型应用中进行演示。从现在开始，利用从本书实验中获得的知识，我们可以更详细地探索 OpenCV 的图像处理和计算机视觉领域。我们围绕 OpenCV 库的旅程到此结束。它实现了许多与计算机视觉相关的算法。它已经用 C++ 实现，并且可以在 NumPy 数组上运行。它还具有适用于 Python 3 的简洁接口。我们可以结合使用各种库的代码来创建具有所需功能的各种计算机视觉应用。在下一部分中，我们将探索 Jupyter 笔记本。
2.3K10编辑于 2023-04-27
来自专栏智能算法
机器视觉算法(第11期)----OpenCV中的绘图与注释
上期我们一起学习来了图像处理中64个常用的算子，机器视觉算法(第10期)----图像处理中64个常用的算子从今天我们仍将以OpenCV为工具，来学习下算法中常用的绘图和注释有哪些？ 1.
1.7K20发布于 2019-07-12
来自专栏ShowMeAI研究中心
深度学习与CV教程(11) | 循环神经网络及视觉应用
--- 本篇重点 RNN的概念与多种形式语言模型图像标注、视觉问答、注意力模型 RNN梯度流 1.RNN的概念与多种形式关于RNN的详细知识也可以对比阅读ShowMeAI的以下内容深度学习教程 | （虽然这些已经不是计算机视觉的内容了） 3.看图说话、视觉问答、注意力模型之前提过很多次图片描述/看图说话（Image Captioning），即训练一个模型，输入一张图片，然后得到它的自然语言语义描述如下图所示：图片这个结构的模型也可以用于其他任务，比如视觉问答（Visual Question Answering）。图片在视觉问答任务中，会有两个输入，一个是图像，一个是关于图像的用自然语言描述的问题。模型从一些答案中选择一个正确的。 , VGG, Googlenet, Restnet等) 深度学习与CV教程(10) | 轻量化CNN架构 (SqueezeNet, ShuffleNet, MobileNet等) 深度学习与CV教程(11
1.4K41编辑于 2022-06-09
来自专栏机器人课程与技术
ROS2+Gazebo11+Car+OpenCV录制视觉数据和控制学习
录制视觉数据如下： ---- 控制效果如下： ---- 如上控制案例参考： 2019年的一篇旧文，大概三年前了。不变的配方，熟悉的味道。 [gazebo-1] [gazebo-1] libcurl: (6) Could not resolve host: fuel.ignitionrobotics.org ---- 录制视觉参考代码如下：
93010编辑于 2022-06-08
来自专栏机器人课程与技术
ROS2+Gazebo11+Car+OpenCV获取巡线视觉数据学习
环境介绍：主系统win11，子系统ubuntu22.04，Gazebo11.10，ROS2 humble。完成后，整体效果如下： ---- 然后，对获取视觉数据进行处理可以实现巡线跑程序，后面一节再叙述。需要配置摄像头也就是视觉插件： <sensor name='camera' type='camera'> <always_on>1</always_on> 需要熟练掌握Gazebo11使用，此部分基础ROS1/2差异不大，内容和方法基本通用的。
76220编辑于 2022-06-06
来自专栏信数据得永生
OpenCV3 和 Qt5 计算机视觉：11~12
转换为标准 C++ 代码（确切地说，是在最新版本的 Qt 中，转换为 C++ 11 或更高版本）。本书的最后一章旨在帮助您结合使用 OpenCV 和极其易于使用且美观的 Qt Quick Controls，开始开发用于移动设备（Android 和 iOS）的计算机视觉应用。在最后一章中，我们还将学习如何使用与 Qt 和 OpenCV 相同的桌面项目来创建移动计算机视觉应用，并将我们的跨平台范围扩展到桌面平台之外，并扩展到移动世界。完整，美观的跨平台计算机视觉应用。首先，让我们看一下项目（*.pro）文件中的区别。通过使用 Qt 和 OpenCV 框架，尤其是 QML 的功能，可以快速轻松地构建应用，您可以立即开始实现所有计算机视觉创意。
8.7K20编辑于 2023-04-27
来自专栏数据派THU
你需要知道的11个Torchvision计算机视觉数据集
来源：新机器视觉本文约3800字，建议阅读8分钟本文介绍了11个Torchvision计算机视觉数据集。计算机视觉是一个显著增长的领域，有许多实际应用，从自动驾驶汽车到面部识别系统。 Torchvision数据集是计算机视觉中常用的用于开发和测试机器学习模型的流行数据集集合。 Torchvision中的数据集共有11种：MNIST、CIFAR-10等，下面具体说说。 02 Torchvision中的11种数据集 1、MNIST手写数字数据库这个Torchvision数据集在机器学习和计算机视觉领域中非常流行和广泛应用。它由7万张手写数字0-9的灰度图像组成。参考链接： https://hackernoon.com/11-torchvision-datasets-for-computer-vision-you-need-to-know 编辑：王菁校对：林亦霖
2.1K21编辑于 2023-04-25
来自专栏机器学习与生成对抗网络
视觉CV-AIGC一周最新技术精选(2023-11)
将物体计数形式化为一种集成视觉提示的开放式物体检测任务。用户可以通过在参考图像上标记点或框来指定感兴趣的物体，然后T-Rex可以检测到所有具有相似模式的物体。在TRex的视觉反馈指导下，用户还可以通过提示缺失或错误检测的物体来交互地改进计数结果。T-Rex在几个类不可知计数基准上取得了最先进的性能。还展示了T-Rex在各种实际应用场景中的潜力，说明其在视觉提示领域的潜力。
49510编辑于 2023-11-27
来自专栏信数据得永生
Python3 OpenCV4 计算机视觉学习手册：6~11
了解 BoW BoW 是最初不用于计算机视觉的概念；相反，我们在计算机视觉的背景下使用了该概念的演进版本。在计算机视觉的背景下，有时 BoW 被称为视觉词袋（BoVW）。但是，我们将仅使用术语 BoW，因为这是 OpenCV 使用的术语。既然我们已经掌握了 BoW 的基本概念，那么让我们看一下它如何应用于计算机视觉世界。将 BoW 应用于计算机视觉现在，我们已经熟悉了特征和描述符的概念。 getStructuringElement(cv2.MORPH_ELLIPSE, (7, 5)) dilate_kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (17, 11 getStructuringElement(cv2.MORPH_ELLIPSE, (13, 9)) dilate_kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (17, 11
5.2K20编辑于 2023-04-27
来自专栏WflynnWeb
微软 Win11 全新画图、照片 App 视觉更新曝光，采用流畅设计
IT之家 8 月 2 日消息外媒 Windows Latest 报道，微软画图和照片 App 的视觉更新已经公布，展示了一个与Windows 11 设计语言相匹配的新的现代界面。微软画图抛弃了传统的 Ribbon 菜单，采用了类似于新的文件资源管理器的流畅标头，而且与 Windows 11 操作系统的其他部分一致。下面是当前版本的 Windows 11 上的画图：正如一开始提到的，我们还将得到新的微软照片应用程序，它有一个新的界面，以及改进，和更好的性能。新的 Windows 11 应用程序即将推出微软将在未来几周内开始为 Windows 11 推出更新的库应用程序，以获得消费者的反馈。微软还计划在 Insider 计划的 Dev 开发频道发布 Windows 11 22H2（明年的功能更新），但新功能可能不包括在初始构建版本中。
88220编辑于 2022-10-28
来自专栏计算机视觉理论及其实现
计算机视觉最新进展概览2021年11月7日到2021年11月13日
由于动态环境中激光雷达点的稀疏性，点云中的三维目标跟踪仍然是一个具有挑战性的问题。在本文中，我们提出了一种voxel-to-BEV跟踪器，它可以显著提高稀疏三维点云的跟踪性能。具体来说，它由Siamese形状感知特征学习网络和voxel-to-BEV目标定位网络组成。Siamese形状感知特征学习网络可以获取目标的三维形状信息，学习目标的判别特征，从而识别出稀疏点云背景中的潜在目标。为此，我们首先进行模板特征嵌入，将模板的特征嵌入到潜在目标中，然后生成密集的三维形状来表征潜在目标的形状信息。对于跟踪目标的定位，体素-BEV目标定位网络以无锚的方式将目标的二维中心和z轴中心从稠密鸟瞰(稠密鸟瞰)特征地图上回归。具体来说，我们通过最大池化将体素化后的点云沿z轴压缩，得到稠密的BEV特征图，可以更有效地进行二维中心与z轴中心的回归。对KITTI和nuScenes数据集的广泛评价表明，我们的方法明显优于目前最先进的方法。
60220编辑于 2022-09-02
来自专栏AI
视觉
学习如何使用 GPT-4 来理解图像介绍具有视觉功能的 GPT-4 Turbo 允许模型接收图像并回答与之相关的问题。在历史上，语言模型系统受限于仅接收单一输入模态，即文本。在探索视觉理解可以应用于哪些用例时，牢记模型的局限性是很重要的。限制虽然具备视觉功能的 GPT-4 功能强大，可以在许多情况下使用，但了解模型的局限性是很重要的。以下是我们所知的一些限制：医学图像：模型不适合解释专业医学图像，如 CT 扫描，不应用于医疗建议。视觉元素：模型可能难以理解图表或文字中颜色或样式（如实线、虚线或点线）变化的情况。空间推理：模型在需要精确空间定位的任务上表现不佳，例如识别国际象棋位置。
1.4K10编辑于 2024-04-22
来自专栏机器之心
教程 | 如何使用Swift在iOS 11中加入原生机器学习视觉模型
选自Hackernoon 机器之心编译作者：Alex Wulff 参与：侯韵楚、李泽南随着 WWDC 大会上 iOS 11 的发布，苹果终于推出了原生机器学习和机器视觉框架，由此开启了许多崭新的可能性，使所有性质的应用程序和游戏有望取得显著进步，本文作者 Alex Wulff 将对在 iOS 11 中加入机器学习模型的方法进行简要介绍。苹果公司还凭借 Core ML 模型推出了自己的机器视觉 API，并命名为 Vision。尽情享受模拟器的崭新外观与体验，以及对 iOS 11 的少许预览吧！希望我的示例项目对「如何轻松在 iOS 11 中实现机器学习」进行了成功概述。只需拖入一个模型并对结果加以处理，你就离成功不远了！原文链接：https://hackernoon.com/swift-tutorial-native-machine-learning-and-machine-vision-in-ios-11-11e1e88aa397
3.7K50发布于 2018-05-07
来自专栏深度学习和计算机视觉
视觉工程师必备视觉知识
一、机器视觉优势机器视觉系统具有高效率、高度自动化的特点，可以实现很高的分辨率精度与速度。机器视觉系统与被检测对象无接触，安全可靠。人工检测与机器视觉自动检测的主要区别有：二、案例为了更好地理解机器视觉，下面，我们来介绍在具体应用中的几种案例。如果视觉系统检测到一个啤酒瓶未填充到位，即未通过检测，视觉系统将会向转向器发出信号，将该啤酒瓶从生产线上剔除。操作员可以在显示屏上查看被剔除的啤酒瓶和持续的流程统计数据。该应用采用了深圳视觉龙公司VD200视觉定位系统，该系统通过判断玩偶正反面，把玩偶处于正面的坐标值通过串口发送给机器人，机器人收到坐标后运动抓取产品，当振动盘中有很多玩偶处于反面时，VD200视觉定位系统需判断反面玩偶数量（11）相机--智能相机智能工业相机是一种高度集成化的微小型机器视觉系统。它将图像的采集、处理与通信功能集成于单一相机内，从而提供了具有多功能、模块化、高可靠性、易于实现的机器视觉解决方案。
58410编辑于 2024-09-25
来自专栏新智元
超CLIP准确率11%！伯克利港大阐明「LLM文本-视觉」对齐深层机制
LIFT首次阐明了LLM文本嵌入驱动语言-视觉对齐的关键机制，并为未来高效多模态模型的设计提供了全新思路。 LIFT在MMBench的细粒度感知与关系推理子任务上取得最大增益，这表明LIFT的组合语义理解优势可无缝迁移到大型多模态模型，显著提升物体定位、属性识别及物理关系判断等视觉任务能力。数据特征的适配在合成长文本中优势显著由多模态模型合成的长文本在语言-视觉对齐中正发挥日益重要的作用，因其能提供更丰富的图像细节信息。为探究哪些设计真正有助于语言-视觉对齐，团队选取了五种7B规模的LLM作为LIFT的文本编码器进行对比实验。未来，团队将把该简化范式与自监督等视觉表征学习策略结合，进一步细化并丰富语义联结。此外，当前对齐仍主要停留在低阶统计层面，如何实现局部视觉特征与对应语义的深度耦合，将成为下一阶段的核心研究方向。
35310编辑于 2025-07-03
来自专栏人工智能领域
视觉识别技术：开启智能视觉新时代
视觉识别技术的简介视觉识别技术，通常被称为计算机视觉，是指使用计算机模拟人类视觉系统来解释和理解图像和视频数据的过程。视觉识别技术的核心在于能够从视觉世界中提取有用的信息，并将其转化为可操作的数据。视觉识别系统 (简称VI，英文Visual Identity的缩写 )是运用系统的、统一的视觉符号系统。视觉识别是静态的识别符号具体化、视觉化的传达形式，项目最多，层面最广，效果更直接。视觉识别（VI）在CIS系统大众所接受，具有主导的地位。视觉识别在现代科技中的重要性视觉识别技术在现代科技中扮演着越来越重要的角色。一、视觉识别技术的基础 1.计算机视觉的起源和发展 1.1计算机视觉的基本概念计算机视觉是一门研究如何使机器“看”的科学，它旨在利用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理
2K10编辑于 2024-12-18
来自专栏机器人视觉
为何工业4.0离不开机器视觉看人类视觉VS机器视觉
机器视觉是实现工业自动化强有力的工具，与人类视觉相比，机器视觉的可靠性更高，客观性更强，持续工作时间越长。如果到了高温、寒冷、狭窄或者高空等极端的场景下，人类的视觉检测就没办法用了。所以，高效准确、灵活稳定、信息丰富、应用广泛的机器视觉开始逐渐代替人类视觉，带领生产制造业走向提速增效的发展之路。一套机器视觉系统一般包含光源、镜头、工业相机、机器视觉软件等软硬件产品，工业相机在合适的光照下采集被测物的图像，再由机器视觉视觉软件对图像进行数字化分析及处理。在机器视觉中，相机快门时间可达微秒级，还能够感知紫外到红外的宽波段范围光谱，且机器视觉产品有宽温、抗振等不同性能可以选择，适应性强，因此，相较于人类视觉，机器视觉成本更低，且更加高效稳定，应用广泛。机器视觉和人类视觉的差别： 1、观测精度人类视觉：人类手工操作无法达到高精度要求。机器视觉：识别精度和抓取精度均高于人类操作精度，可精准地控制位移量。
1.1K20编辑于 2022-11-14
来自专栏贾志刚-OpenCV学堂
超CLIP准确率11%！伯克利港大阐明「LLM文本-视觉」对齐深层机制
LIFT首次阐明了LLM文本嵌入驱动语言-视觉对齐的关键机制，并为未来高效多模态模型的设计提供了全新思路。 LIFT在MMBench的细粒度感知与关系推理子任务上取得最大增益，这表明LIFT的组合语义理解优势可无缝迁移到大型多模态模型，显著提升物体定位、属性识别及物理关系判断等视觉任务能力。数据特征的适配在合成长文本中优势显著由多模态模型合成的长文本在语言-视觉对齐中正发挥日益重要的作用，因其能提供更丰富的图像细节信息。为探究哪些设计真正有助于语言-视觉对齐，团队选取了五种7B规模的LLM作为LIFT的文本编码器进行对比实验。未来，团队将把该简化范式与自监督等视觉表征学习策略结合，进一步细化并丰富语义联结。此外，当前对齐仍主要停留在低阶统计层面，如何实现局部视觉特征与对应语义的深度耦合，将成为下一阶段的核心研究方向。
16910编辑于 2026-04-02
来自专栏智能算法
机器视觉与计算机视觉的区别？
计算机视觉与机器视觉，首先是应用场景不一样，就像@Vinjn张静回答的那样：你把摄像头对着人就是CV，对着车间就是MV。计算机视觉和机器视觉应用场景不同，就像拉货车和载客车是的，侧重点不同而已，一个侧重人工智能分支，一个侧重工业应用！机器视觉，主要侧重对量的分析，比如通过视觉去测量一个零件的直径，一般来说，对准确度要求很高。我记得以前接触过一个需求: 视觉测量铁路道岔缺口。有些机器视觉也需要分析质，比如零件自动分拣。但，计算机视觉一般来说对量的要求不会很高，商场人数统计误差个百分之几死不了人的，但机器视觉真的会，比如那个道岔缺口测量。既然要求这么高，是不是机器视觉就比计算机视觉难呢？也不是的，应该说各有各的难处。计算机视觉的应用场景相对复杂，要识别的物体类型也多，形状不规则，规律性不强。
3.6K111发布于 2018-04-03
来自专栏智能算法
机器视觉算法(系列一)--机器视觉简短入门
机器视觉是人工智能正在快速发展的一个分支。机器视觉作为生产过程中关键技术之一，在机器或者生产线上，机器视觉可以检测产品质量以便将不合格的产品剔除，或者指导机器人完成组装工作，与整个生产密切相关。由于笔者正处于机器视觉行业，所以准备和大家一起系统的学习机器视觉方面相关知识，主要包括常见的机器视觉算法，以及常见的应用领域算法的实现等，欢迎大家的讨论和交流。本文主要介绍机器视觉经典系统，常用领域以及机器视觉常用的图像处理库，希望以此作为一个简短入门。 1.机器视觉经典系统简单说来，机器视觉就是用机器代替人眼来做测量和判断。机器视觉系统是通过机器视觉产品(即图像摄取装置，分CMOS和CCD两种)将被摄取目标转换成图像信号，传送给专用的图像处理系统，得到被摄目标的形态信息，根据像素分布和亮度、颜色等信息，转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征那么一个经典的机器视觉系统长什么样呢？ ?
3.8K80发布于 2018-04-03

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

树莓派计算机视觉编程：11~13

机器视觉算法(第11期)----OpenCV中的绘图与注释

深度学习与CV教程(11) | 循环神经网络及视觉应用

ROS2+Gazebo11+Car+OpenCV录制视觉数据和控制学习

ROS2+Gazebo11+Car+OpenCV获取巡线视觉数据学习

OpenCV3 和 Qt5 计算机视觉：11~12

你需要知道的11个Torchvision计算机视觉数据集

视觉CV-AIGC一周最新技术精选(2023-11)

Python3 OpenCV4 计算机视觉学习手册：6~11

微软 Win11 全新画图、照片 App 视觉更新曝光，采用流畅设计

计算机视觉最新进展概览2021年11月7日到2021年11月13日

视觉

教程 | 如何使用Swift在iOS 11中加入原生机器学习视觉模型

视觉工程师必备视觉知识

超CLIP准确率11%！伯克利港大阐明「LLM文本-视觉」对齐深层机制

视觉识别技术：开启智能视觉新时代

为何工业4.0离不开机器视觉看人类视觉VS机器视觉

超CLIP准确率11%！伯克利港大阐明「LLM文本-视觉」对齐深层机制

机器视觉与计算机视觉的区别？

机器视觉算法(系列一)--机器视觉简短入门

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

树莓派计算机视觉编程：11~13

机器视觉算法(第11期)----OpenCV中的绘图与注释

深度学习与CV教程(11) | 循环神经网络及视觉应用

ROS2+Gazebo11+Car+OpenCV录制视觉数据和控制学习

ROS2+Gazebo11+Car+OpenCV获取巡线视觉数据学习

OpenCV3 和 Qt5 计算机视觉：11~12

你需要知道的11个Torchvision计算机视觉数据集

视觉CV-AIGC一周最新技术精选(2023-11)

Python3 OpenCV4 计算机视觉学习手册：6~11

微软 Win11 全新画图、照片 App 视觉更新曝光，采用流畅设计

计算机视觉最新进展概览2021年11月7日到2021年11月13日

视觉

教程 | 如何使用Swift在iOS 11中加入原生机器学习视觉模型

视觉工程师必备视觉知识

超CLIP准确率11%！伯克利港大阐明「LLM文本-视觉」对齐深层机制

视觉识别技术：开启智能视觉新时代

为何工业4.0离不开机器视觉 看人类视觉VS机器视觉

超CLIP准确率11%！伯克利港大阐明「LLM文本-视觉」对齐深层机制

机器视觉与计算机视觉的区别？

机器视觉算法(系列一)--机器视觉简短入门

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

为何工业4.0离不开机器视觉看人类视觉VS机器视觉