首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏快乐学AI系列

    快乐学AI系列——计算机视觉3)目标检测

    图片本系列是由“MATRIX.矩阵之芯”精炼的AI快速入门系列,特色是内容简洁,学习快速。相关要求:学员需要掌握Python编程基础,另外还需要有一定的线性代数、概率论基础。 目标检测基础知识目标检测和目标识别都是计算机视觉领域中的重要问题,但它们之间有着明显的区别。 官方GitHub仓库中获取:具体操作步骤如下:1、访问OpenCV官方GitHub仓库 https://github.com/opencv/opencv2、进入/data/haarcascades目录3、 cat_cascade.detectMultiScale(img[y:y+win_size[1], x:x+win_size[0]], scaleFactor=1.05, minNeighbors=3) LBP描述子可以对图像纹理特征进行编码,并具有旋转不变性、灰度不变性和计算效率高等优点,因此在很多计算机视觉任务中得到广泛应用。

    1.1K00编辑于 2023-03-30
  • 来自专栏优图实验室的专栏

    视觉AI,第一!

    刚刚,腾讯的视觉AI能力得到了国际权威行业研究机构IDC的认可。 在IDC发布的“2021年亚太地区(不含日本)视觉人工智能软件平台供应商”评估报告中,腾讯的视觉AI能力位列中国厂商战略维度第一! 作为中国最大的人工智能服务提供商之一,腾讯云在AI领域的技术和应用一直走在前列。目前,腾讯云AI已提供了超过300多项标准化AI开放能力和80+AI行业解决方案。 在本次的评估中,依托腾讯优图实验室等顶尖实验室多年的技术研究和落地探索,腾讯云AI为数十万家内外部客户提供AI技术服务和丰富的计算机视觉产品组合,包括人脸识别、人脸核身、图像视频处理和分析、OCR与AI 泛娱乐等,同时也为国家人口普查、健康码、粤港澳小程序等提供核心的自研AI技术能力,为金融、工业、汽车等传统企业提供端到端的解决方案,腾讯云都提供了非常丰富的视觉AI产品组合,这也是IDC给出高分的一大原因 作为腾讯顶级的人工智能实验室,腾讯优图实验室始终专注基础研究、产业落地两条腿走路的发展战略,持续输出顶尖的视觉AI能力。

    1.1K30发布于 2021-10-28
  • 来自专栏hotarugaliの技术分享

    3D视觉

    简介 随着自动驾驶、AR & VR 等技术的发展,3D 视觉的研究正方兴未艾。 目前 3D 视觉的两个主要问题是: 从一张 2D 图像预测得到 3D 表示 处理 3D 表示数据来实现下游任务(分类、检测、分割等) 2. 3D 表示 目前 3D 视觉表示主要有 555 种方法:深度图 Eigen 等人提出的神经网络结构如下: image.png 2.1.2 RGB + Surface Normal 另一种类似表示 3D 视觉信息的方法是对 RGB 图像中的每个像素,给出其所在物体表面的法向量 这样也能在一定程度上表示 3D 物体的空间结构信息。 {1}{n} \sum_i N_i \cdot N_i^* \tag{3} Lnormal​(N,N∗)=−n1​i∑​Ni​⋅Ni∗​(3) 其中, 和 分别表示网络预测的 Surface

    1.6K20编辑于 2022-05-27
  • 来自专栏张国平_玩转树莓派

    树莓派综合项目3AI视觉机械臂小车(一)蜂鸣器

    我对农业很感兴趣,也喜欢养花种菜,想做智能温室的树莓派物联网,但是我家里没有院子,房间也小,做个mini的都困难; 二是AI视觉和机械臂。 在各类树莓派创客书籍中发现,视觉识别是一个主要内容,是信息输入的重要方式,而机械臂是机器人输出、工作的重要方式,比如农业采摘机器人。    [jw9m29a414.jpeg]   做视觉处理对硬件的计算力有要求,为了让运行更流畅,我选择了树莓派4B 8G版本,整个套件花了我1777大洋,虽然有点心疼,但是投资学习是不会亏的。 [3], CM[2], CM[2], CM[3], CM[5], CM[2], CM[3], CM[3], CL[6], CL[6], CL[6], CM[1], CM[3], CM[4], CM[4], CM[3], CM[2], CM[3], CM[1], CM[1], CM[3], CM[2], CL[5], CL[7], CM[2

    1.4K40发布于 2021-04-01
  • 来自专栏机器人小农

    机器人视觉3

    随着技术的发展,3D相机的使用越来越频繁,当然如果价格亲民点、再亲民点,那将得到更多的使用。 今天我们就来说说3D相机和机器人之间那些思维。 往往3D相机是标定工具的,因此相机给出的位置信息对于机器人来说相当于绝对坐标值,就是说相机给了这个产品的位置信息,机器人拿到就直接执行这个位置就可以了。 首先我们来了解一下3D相机的原理: 3D相机是通过“激光”扫描得到镜头下物体轮廓的点云,并且计算出预先设置好的特征,并且计算出机器人tcp的位置 由此看来相机需要知道机器人的base坐标系位置,tcp

    66710编辑于 2022-06-29
  • 来自专栏张国平_玩转树莓派

    树莓派综合项目3AI视觉机械臂小车(二)轻触按键

    一、介绍 树莓派综合项目3AI视觉机械臂小车(一)蜂鸣器 树莓派基础实验   本实验也是一个简单的轻触按键实验,在基础实验系列中讲过类似的一篇,树莓派基础实验6:轻触开关按键实验,当中使用了 interrupt GPIO.cleanup() 第3步: 使用GPIO Zero库的LED、Button方法来编写,更简洁,更直观。 #!

    1.6K40发布于 2021-05-13
  • 来自专栏张国平_玩转树莓派

    树莓派综合项目3AI视觉机械臂小车(三)基本运动

    一、介绍 树莓派综合项目3AI视觉机械臂小车(一)蜂鸣器 树莓派综合项目3AI视觉机械臂小车(二)轻触按键   本实验将实现履带车的基本运动,前进、后退、左转、右转。 GPIO.output(BIN1,False) time.sleep(t_time) try: while True: t_up(50,3) t_down(50,3) t_left(50,3) t_right(50,3) t_stop(3) except KeyboardInterrupt : GPIO.cleanup() 第3步:使用GPIO Zero库来重新编写程序,程序更简洁,语句更容易阅读和理解,基本不用注释就能明白语句的含义。 # 0.5即为占空比50的速度 t_down(0.5,3) t_left(0.5,3) t_right(0.5,3) t_stop(3

    2.2K41发布于 2021-05-17
  • 来自专栏张国平_玩转树莓派

    树莓派综合项目3AI视觉机械臂小车(四)红外避障

    一、介绍 树莓派综合项目3AI视觉机械臂小车(一)蜂鸣器 树莓派综合项目3AI视觉机械臂小车(二)轻触按键 树莓派综合项目3AI视觉机械臂小车(三)基本运动   本实验将实现履带车的红外避障功能 GPIO.cleanup() 第3步:使用GPIO Zero库来重新编写程序,引入了Button,Motor,LED,LineSensor几个基本类,使得程序变得简洁易懂,降低了编程难度,特别是等待按键按下的

    1.8K10发布于 2021-05-24
  • 来自专栏流川疯编写程序的艺术

    机器视觉3——电磁波

    通过以上图我们可以看出,正弦波上的点和圆上的点相对应,我们假想圆是一个时钟的表盘,那么指针每走的一步都会相应体现在正弦波的前进起伏上。

    75750发布于 2019-07-03
  • 来自专栏3D视觉从入门到精通

    视比特“AI+3D视觉”核心产品 | 智能下料分拣产线

    随着工业4.0和中国制造2025的深度推进,各行业的制造型企业都开始跨入智能制造领域,机器人及AI视觉技术作为智能化转型的先锋,给制造业带来了全新的生产管理模式。 智能下料分拣产线 视比特机器人深耕行业数年,不断分析和探究客户需求,依托自主研发的3D视觉技术和多机器人智能协同控制软件,在行业内首次推出基于AI+3D视觉的智能下料分拣产线。 ► 高精度大工件测量与缺陷检测 针对切割工件生产过程中存在质量检测精度低、缺陷检测不全等问题,本产品基于AI+视觉技术,融合了高精度3D模板匹配、3D点云边缘精准提取和平面分割、小样本学习等技术,能够实现工件亚毫米尺寸测量以及缺陷的精确检测 视比特:AI+3D视觉助力智能制造,软件定义智能塑造未来工厂 近年来,视比特充分发挥技术领先优势,不断创新与研发,根据客户智慧工厂迭代升级的要求进阶,并在产品端持续打磨,致力于为客户提供最高性价比、最优质服务的全自动解决方案 未来,视比特将持续响应国家智能制造战略,通过标准化、通用化工业视觉软件平台推动AI+机器视觉技术与产业场景的深度融合,深耕并探索更多落地场景,不断为智造化创新发展注入新动能。

    1.3K10编辑于 2022-06-28
  • 来自专栏云深之无迹

    巴塞罗那自治大学.3D视觉课件.3

    巴塞罗那自治大学,3D视觉课件.1 巴塞罗那自治大学.3D视觉课件.2 我还是一句话,自己推导一些这些定理,过了理论关,再去看代码实现,永远都是那么割裂,这不是一个学习的好法子。

    46120编辑于 2022-11-29
  • 来自专栏一点人工一点智能

    小白系列(3)| 计算机视觉之直接视觉跟踪

    首先,我们将介绍几种视觉跟踪方法。然后,我们将解释如何对它们进行分类。我们还将讨论直接视觉跟踪的基本内容,特别关注基于区域的方法和基于梯度的方法。 目录: 视觉跟踪简介 对视觉跟踪方法进行分类 基于区域的跟踪方法 基于梯度的方法 总结 01 视觉跟踪 视觉跟踪,也称为目标跟踪或视频跟踪,是使用视觉信息估计场景中目标对象的轨迹的问题。 视觉信息可以来自不同的成像源。我们可以使用光学相机、热像仪、超声波、X 射线或磁共振等。 以下是最常见的成像设备列表: 此外,视觉跟踪是一个非常受欢迎的话题,因为它在各种各样的问题中都有应用。 02 视觉跟踪方法的分类 视觉跟踪方法可以根据以下主要组成部分进行分类: 现在,让我们更详细地看一下这些组件。 在视觉跟踪中称为目标表示(Target Representation)。

    98620编辑于 2022-12-27
  • 嵌入式AI视觉落地的那些事儿——直面AI视觉落地难的挑战

    一、QT界面开发:算法与界面必须解耦嵌入式AI应用通常需要图形界面,QT是常见选择。但开发中容易陷入一个误区:把算法函数直接写在界面类的响应函数里。点一下“开始检测”,界面就卡住,直到检测完成才能动。 三、嵌入式平台适配:每块板子有自己的脾气RK3588和Jetson Orin是当前主流的嵌入式AI平台,但开发体验差异不小。交叉编译环境搭建就是个开端,库依赖容易出问题。 五、从原型到产品,每一步都不能省嵌入式AI产品开发,不是“写个算法然后拷过去”那么简单。界面要响应快,算法要跑得稳,硬件资源要榨干,还要考虑设备长时间运行的散热和稳定性。 高培觉得嵌入式AI开发需要的不是单点技术,而是全局视角:QT界面、OpenCV算法、模型部署、多线程优化、硬件加速、系统稳定性,缺一不可。

    4900编辑于 2026-03-23
  • 来自专栏点云PCL

    SLAM综述(3)-视觉与惯导,视觉与深度学习SLAM

    第二部分重点介绍了Visual SLAM,包括相机传感器,不同稠密SLAM的开源视觉SLAM系统。 第三部分介绍视觉惯性里程法SLAM,视觉SLAM中的深度学习以及未来。 第四部分中,将介绍激光雷达与视觉的融合。 视觉SLAM的稳定性是一项技术挑战。因为基于单目的视觉SLAM需要初始化、尺度的不确定性和尺度漂移等问题[1]。 针对以上这些问题传感器的融合方案逐渐流行起来,IMU与相机融合的视觉里程计成为研究热点。 视觉与惯导 论文[2][3][4]是比较早期对VIO进行的一些研究。 深度学习与视觉SLAM 目前,深度学习在计算机视觉方面起着至关重要的作用。随着视觉SLAM的发展,越来越多的研究者开始关注基于深度学习的SLAM的研究。 Pix3d: Dataset and methods for single-image 3d shape modeling.

    3.3K22发布于 2020-05-19
  • 来自专栏周景超的专栏

    腾讯 AI Lab 计算机视觉中心人脸 & OCR团队近期成果介绍(3

    1 人脸进展 人脸是最重要的视觉信息之一。以貌识人、以貌取人是人的本性,也是最自然、最常用的身份确认和交互方式之一。 在AI Lab自研的AI有嘻哈项目中,人脸技术也将被用于识别图片中的名人脸,以便进一步的提高图片配文的质量。 ch=1&com=evaluation&view=method_samples&task=4&m=31774>v=1 [图片] [图片] [图片] 图3. 近期,我们团队参与的“AI在腾讯信息安全中的应用”项目获得了2017年下半年技术突破奖银奖,截图如下。 [图片] 在2017腾讯全球合作伙伴大会上,AI Lab计算机视觉中心负责人刘威博士也向公司的合作伙伴和行业精英介绍了我们团队在人脸与OCR上的若干研究成果,如下图所示: [图片] [图片]

    2K20发布于 2017-11-27
  • 来自专栏智慧物联产品&方案

    AI视觉识别有哪些工业应用

    AI视觉识别,主要是利用人工智能算法对图像或视频数据进行分析和处理,以提取关键信息并执行筛选、判断、预警等任务。AI视觉识别涵盖多种应用,如人脸识别、目标检测和识别、图像分割、行为识别、视频分析等。 本篇就简单介绍一下AI视觉识别的应用场景。1、质量控制和检验在制造领域,AI视觉识别可用于检查生产线上的产品是否存在缺陷,确保产品质量稳定,减少残次品。 3、智能安防在公共安全领域,AI视觉可以识别和跟踪公共场所中的在逃嫌疑人,以及可用于安全管制区域的访问控制。 5、智慧零售在零售领域,AI视觉识别可以通过监控店铺客流、货架消耗来分析营销和库存水平,提升店铺经营效率。6、智慧农业AI视觉识别可以通过空中或地面图像,识别监测作物生长状态、健康状况、病虫害情况等。 7、自动驾驶汽车AI视觉可以帮助车辆感知环境、检测障碍物并安全导航,这已成为智能化新能源车的必备能力之一。以上人工智能视觉识别在不同行业的多样化应用的几个例子。

    1.6K10编辑于 2023-11-27
  • 来自专栏理论坞

    视觉数据和AI的“杀手应用”

    虽然许多人正在寻找“杀手级”的视觉,但更有可能视觉AI和计算机的“杀手级应用”。 ? 今天有AI模块的app,只需拍摄一个照片,便可在几秒钟内告诉你狗的种类,或植物的种类。 例如,最前沿的AI系统采用在人脑神经网络之后建模的深度学习或深层神经网络。(当然,他们没有任何地方接近人类相同的能力)。 AI系统和视觉数据 视觉对于我们具有非常重要的意义,这解释了为什么65%的人都是视觉工作者。 要做到这一点,它需要更高质量的视觉数据和复杂的算法将信息翻译成有意义的东西。 当涉及到AI,领先的科技公司都在这个领域寻求突破和探索。他们知道,AI是一个改变我们生活和工作的游戏规则。 虽然许多人正在寻找“杀手级”视觉,但我想说,视觉AI和计算领域的“杀手级” 。 我们已经依赖于视觉内容。然而,飞飞预测,随着相机技术和传感器的使用越来越多,未来将更加依赖它。

    52930发布于 2018-08-06
  • 来自专栏做数据的二号姬

    认真聊AI | 计算机视觉

    计算机视觉是一门研究如何对数字图像或视频进行高层理解的交叉学科。 据说人一生中70%的信息都是通过看获得的,很容易联想到,对于致力于和人类一样拥有智能的AI也很看重看得能力。 实际上,计算机视觉的技术在生活的方方面面都有着应用,如指纹识别、车牌识别、人脸识别、视频监控、自动驾驶、增强现实等。 视觉任务处理对人类来说非常简单,但是对计算机来说确很复杂。 尽管计算机视觉任务繁多,但大多数任务本质上可以建模为广义的函数拟合问题。即对任意输入图像X,需要学习一个以Θ为参数的函数F,使得y=F0(X)。 除此之外,基于深度学习的计算机视觉应用也比较多,神经网络之类的方法在计算机视觉上的应用还是比较广的。 比如现在应用比较广的人脸识别技术,仅从步骤上来说,也就是简单的几个步骤: 第一步,人脸检测。 尽管深度学习给计算机视觉带来了很多革命性的改变,但是目前的计算机视觉领域还是一个以来大规模、强监督的数据路线上。从这个角度上来说,计算机视觉可能更像一个劳动密集型的产业,大量依赖于数据标注。

    32200编辑于 2025-07-14
  • 来自专栏人工智能

    多模态AI视觉语言模型

    然而,真实世界的智能需要跨越感官的界限,实现视觉、语言、声音等多种信息的统一理解与生成。 CLIP:连接视觉与语言的桥梁 CLIP原理 CLIP(Contrastive Language-Image Pre-training)由OpenAI于2021年发布,通过简单而强大的理念实现了视觉和语言的统一理解 CLIP的影响 CLIP证明了大规模对比预训练的有效性,开启了视觉-语言模型的新纪元。 从零样本分类到图像生成,从视觉问答到多模态对话,多模态技术正在不断拓展AI的能力边界。 未来,随着模型规模的扩大和训练数据的积累,多模态AI将在更多领域发挥作用,为人机交互带来革命性变化。 掌握多模态学习的技术,将帮助读者在AI浪潮中把握机遇,创造更智能的应用。

    41710编辑于 2026-01-21
  • 来自专栏CreateAMind

    彻底解决AI视觉深度估计

    [3,4],⽽颞下皮层则⽀持基于相对差异创建 3D 形状对象之间[2,5]。 在到达模型中也存在类似的限制,其中要到达的物体的 3D 位置直接作为视觉观察提供[19,20]。 (i) 和视觉可能性(1)3 与对眼睛角度 µθ 的置信度不同,该置信度仅受到以下级别的可能性的偏差,该置信度同时受到 中编码的先验和来自 的视觉可能性的影响。 3.3. 仅考虑非均匀感觉分布,相对于主动视觉,推断聚散条件下的性能更好 可能是因为在前一种情况下,智能体从固定在正确的 3D 位置的状态开始推理过程。因此,推理聚散条件下的主动视觉策略只需要估计物体的深度。 与直接为代理提供 3D 环境作为视觉观察 [20] 或从变分自动编码器重建的潜在空间 [50] 的最先进模型相比,这将允许代理的 3D 位置 通过眼睛的投射来推断物体,然后用于后续任务,例如伸手和抓握。

    75711编辑于 2024-04-11
领券