首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏优图实验室的专栏

    视觉AI,第一!

    刚刚,腾讯的视觉AI能力得到了国际权威行业研究机构IDC的认可。 在IDC发布的“2021年亚太地区(不含日本)视觉人工智能软件平台供应商”评估报告中,腾讯的视觉AI能力位列中国厂商战略维度第一! 作为中国最大的人工智能服务提供商之一,腾讯云在AI领域的技术和应用一直走在前列。目前,腾讯云AI已提供了超过300多项标准化AI开放能力和80+AI行业解决方案。 在本次的评估中,依托腾讯优图实验室等顶尖实验室多年的技术研究和落地探索,腾讯云AI为数十万家内外部客户提供AI技术服务和丰富的计算机视觉产品组合,包括人脸识别、人脸核身、图像视频处理和分析、OCR与AI 泛娱乐等,同时也为国家人口普查、健康码、粤港澳小程序等提供核心的自研AI技术能力,为金融、工业、汽车等传统企业提供端到端的解决方案,腾讯云都提供了非常丰富的视觉AI产品组合,这也是IDC给出高分的一大原因 作为腾讯顶级的人工智能实验室,腾讯优图实验室始终专注基础研究、产业落地两条腿走路的发展战略,持续输出顶尖的视觉AI能力。

    1.1K30发布于 2021-10-28
  • 来自专栏AI科技大本营的专栏

    5分钟速通 AI 计算机视觉发展应用

    作者 | 李秋键 出品 | AI科技大本营(ID:rgznai100) 计算机视觉是进步最大、发展最快的领域之一。 人工智能计算机视觉的使用案例几乎不计其数,其中最受欢迎的是无人机以及自动和半自动车辆。今天小编带大家几分钟速通 AI 计算机视觉发展应用。 (5)纺织品及服装: 纤维及织物组织识别 纺织阶段,图像识别技术可用于识别区分各类纤维及其织物,还可用于原棉加工前识别非棉杂质。 (5)基于稀疏表示和多特征融合的 SAR 图像识别: 当采用稀疏表示进行 SAR 图像目标识别时,可采用的特征包括灰度特征、局部特征(HOG 特征)及基于信号变换提取的特征(单演信号特征)等。 传统图像分割方法 基于阈值的分割方法 基于边缘的分割方法 基于区域的分割方法 基于聚类分析的图像分割方法 基于小波变换的分割方法 基于数学形态学的分割方法 基于人工神经网络的分割方法 以上就是给大家整理的AI

    59230编辑于 2022-04-05
  • 来自专栏快乐学AI系列

    快乐学AI系列——计算机视觉5)图像分类和识别

    本系列是由“MATRIX.矩阵之芯”精炼的AI快速入门系列,特色是内容简洁,学习快速。 img2, None)# 初始化FLANN匹配器FLANN_INDEX_KDTREE = 0index_params = dict(algorithm=FLANN_INDEX_KDTREE, trees=5)

    1.1K20编辑于 2023-04-06
  • 嵌入式AI视觉落地的那些事儿——直面AI视觉落地难的挑战

    一、QT界面开发:算法与界面必须解耦嵌入式AI应用通常需要图形界面,QT是常见选择。但开发中容易陷入一个误区:把算法函数直接写在界面类的响应函数里。点一下“开始检测”,界面就卡住,直到检测完成才能动。 定义一套算法接口,YOLOv5、YOLOv8等不同模型都实现这个接口。界面只调用接口,不关心具体实现。换模型只需要改配置,界面代码几乎不用动。 三、嵌入式平台适配:每块板子有自己的脾气RK3588和Jetson Orin是当前主流的嵌入式AI平台,但开发体验差异不小。交叉编译环境搭建就是个开端,库依赖容易出问题。 五、从原型到产品,每一步都不能省嵌入式AI产品开发,不是“写个算法然后拷过去”那么简单。界面要响应快,算法要跑得稳,硬件资源要榨干,还要考虑设备长时间运行的散热和稳定性。 高培觉得嵌入式AI开发需要的不是单点技术,而是全局视角:QT界面、OpenCV算法、模型部署、多线程优化、硬件加速、系统稳定性,缺一不可。

    4900编辑于 2026-03-23
  • 来自专栏一点人工一点智能

    小白系列(5)| 计算机视觉:3D立体视觉

    作者:DrMax 编辑:东岸因为@一点人工一点智能 01 介绍 本文中,我们将讨论立体视觉,这是一种使用两个或多个摄像机来生成全视场三维测量的机器视觉技术。 02 什么是立体(3D)视觉? 计算机立体视觉是从二维图像中提取三维信息的过程,例如由CCD相机产生的图像。它结合每个视角中物体的相对位置,来融合多个视角的数据。因此,我们在高级驾驶辅助系统和机器人导航等应用中使用立体视觉。 这类似于人类视觉的工作原理。我们大脑同时整合来自两只眼睛的图像,从而产生三维视觉: 尽管每只眼睛只产生二维图像,但人脑可以通过结合两个视角并识别它们之间的差异来感知深度。我们称这种能力为立体视觉。 它感知深度和三维形状的能力被称为立体视觉。 04 计算机系统如何实现立体视觉 我们需要估计每个点的深度,从而从二维图像中生成三维图像。 这是在3D计算机图形和计算机视觉中表示场景深度的常见方式。我们可以在上述图像的左下角看到深度图的一个示例。 05 立体视觉的几何基础 对极几何是立体视觉的几何学基础。

    87130编辑于 2023-09-08
  • 来自专栏一点人工一点智能

    小白系列(5)| 计算机视觉:3D立体视觉

    01  介绍 本文中,我们将讨论立体视觉,这是一种使用两个或多个摄像机来生成全视场三维测量的机器视觉技术。 02  什么是立体(3D)视觉? 计算机立体视觉是从二维图像中提取三维信息的过程,例如由CCD相机产生的图像。它结合每个视角中物体的相对位置,来融合多个视角的数据。因此,我们在高级驾驶辅助系统和机器人导航等应用中使用立体视觉。 这类似于人类视觉的工作原理。我们大脑同时整合来自两只眼睛的图像,从而产生三维视觉: 尽管每只眼睛只产生二维图像,但人脑可以通过结合两个视角并识别它们之间的差异来感知深度。我们称这种能力为立体视觉。 它感知深度和三维形状的能力被称为立体视觉。 04  计算机系统如何实现立体视觉 我们需要估计每个点的深度,从而从二维图像中生成三维图像。 这是在3D计算机图形和计算机视觉中表示场景深度的常见方式。我们可以在上述图像的左下角看到深度图的一个示例。 05  立体视觉的几何基础 对极几何是立体视觉的几何学基础。

    1.6K50编辑于 2023-09-04
  • 来自专栏ZackSock

    【计算机视觉处理5】阈值处理

    【计算机视觉处理5】阈值处理 1、阈值处理 阈值处理就是设定某个阈值,然后对大于阈值的像素或者小于阈值的像素统一处理的过程。比如下面这个简单的图像: ?

    1.5K30发布于 2021-05-18
  • 来自专栏信数据得永生

    Python OpenCV 计算机视觉:1~5

    它们在第 5 章“分隔前景/背景区域深度”的整个过程中使用,但在其他各章或附录中未使用。 在撰写本文时,OpenCV 2.4.3 是最新版本。 在某些操作系统上,设置早期版本(2.3.1)更容易。 例如,我们可以在照片/视频编辑器,动作控制游戏,机器人的 AI 或心理学实验中使用它来记录参与者的眼球运动。 在这样的不同用例中,我们可以真正研究一组有用的抽象吗? 使用网络摄像头,我发现7的blurKsize值和5的edgeKsize值看起来最好。 不幸的是,medianBlur()与像7这样的大型ksize一样昂贵。 您现在具备使用 OpenCV 在 Python 中开发计算机视觉应用的技能。 尽管如此,总会有更多的东西要学习和做! 希望您能够将本书及其代码库用作奖励计算机视觉工作的起点。 让我知道您接下来要学习或发展的内容!

    3.3K20编辑于 2023-04-27
  • 来自专栏智慧物联产品&方案

    AI视觉识别有哪些工业应用

    AI视觉识别,主要是利用人工智能算法对图像或视频数据进行分析和处理,以提取关键信息并执行筛选、判断、预警等任务。AI视觉识别涵盖多种应用,如人脸识别、目标检测和识别、图像分割、行为识别、视频分析等。 本篇就简单介绍一下AI视觉识别的应用场景。1、质量控制和检验在制造领域,AI视觉识别可用于检查生产线上的产品是否存在缺陷,确保产品质量稳定,减少残次品。 3、智能安防在公共安全领域,AI视觉可以识别和跟踪公共场所中的在逃嫌疑人,以及可用于安全管制区域的访问控制。 5、智慧零售在零售领域,AI视觉识别可以通过监控店铺客流、货架消耗来分析营销和库存水平,提升店铺经营效率。6、智慧农业AI视觉识别可以通过空中或地面图像,识别监测作物生长状态、健康状况、病虫害情况等。 7、自动驾驶汽车AI视觉可以帮助车辆感知环境、检测障碍物并安全导航,这已成为智能化新能源车的必备能力之一。以上人工智能视觉识别在不同行业的多样化应用的几个例子。

    1.6K10编辑于 2023-11-27
  • 来自专栏理论坞

    视觉数据和AI的“杀手应用”

    虽然许多人正在寻找“杀手级”的视觉,但更有可能视觉AI和计算机的“杀手级应用”。 ? 今天有AI模块的app,只需拍摄一个照片,便可在几秒钟内告诉你狗的种类,或植物的种类。 例如,最前沿的AI系统采用在人脑神经网络之后建模的深度学习或深层神经网络。(当然,他们没有任何地方接近人类相同的能力)。 AI系统和视觉数据 视觉对于我们具有非常重要的意义,这解释了为什么65%的人都是视觉工作者。 要做到这一点,它需要更高质量的视觉数据和复杂的算法将信息翻译成有意义的东西。 当涉及到AI,领先的科技公司都在这个领域寻求突破和探索。他们知道,AI是一个改变我们生活和工作的游戏规则。 虽然许多人正在寻找“杀手级”视觉,但我想说,视觉AI和计算领域的“杀手级” 。 我们已经依赖于视觉内容。然而,飞飞预测,随着相机技术和传感器的使用越来越多,未来将更加依赖它。

    52930发布于 2018-08-06
  • 来自专栏做数据的二号姬

    认真聊AI | 计算机视觉

    计算机视觉是一门研究如何对数字图像或视频进行高层理解的交叉学科。 据说人一生中70%的信息都是通过看获得的,很容易联想到,对于致力于和人类一样拥有智能的AI也很看重看得能力。 实际上,计算机视觉的技术在生活的方方面面都有着应用,如指纹识别、车牌识别、人脸识别、视频监控、自动驾驶、增强现实等。 视觉任务处理对人类来说非常简单,但是对计算机来说确很复杂。 尽管计算机视觉任务繁多,但大多数任务本质上可以建模为广义的函数拟合问题。即对任意输入图像X,需要学习一个以Θ为参数的函数F,使得y=F0(X)。 除此之外,基于深度学习的计算机视觉应用也比较多,神经网络之类的方法在计算机视觉上的应用还是比较广的。 比如现在应用比较广的人脸识别技术,仅从步骤上来说,也就是简单的几个步骤: 第一步,人脸检测。 尽管深度学习给计算机视觉带来了很多革命性的改变,但是目前的计算机视觉领域还是一个以来大规模、强监督的数据路线上。从这个角度上来说,计算机视觉可能更像一个劳动密集型的产业,大量依赖于数据标注。

    32200编辑于 2025-07-14
  • 来自专栏人工智能

    多模态AI视觉语言模型

    然而,真实世界的智能需要跨越感官的界限,实现视觉、语言、声音等多种信息的统一理解与生成。 CLIP:连接视觉与语言的桥梁 CLIP原理 CLIP(Contrastive Language-Image Pre-training)由OpenAI于2021年发布,通过简单而强大的理念实现了视觉和语言的统一理解 CLIP的影响 CLIP证明了大规模对比预训练的有效性,开启了视觉-语言模型的新纪元。 从零样本分类到图像生成,从视觉问答到多模态对话,多模态技术正在不断拓展AI的能力边界。 未来,随着模型规模的扩大和训练数据的积累,多模态AI将在更多领域发挥作用,为人机交互带来革命性变化。 掌握多模态学习的技术,将帮助读者在AI浪潮中把握机遇,创造更智能的应用。

    41710编辑于 2026-01-21
  • 来自专栏CreateAMind

    彻底解决AI视觉深度估计

    [3,4],⽽颞下皮层则⽀持基于相对差异创建 3D 形状对象之间[2,5]。 图 5 提供了该模型的神经级说明,其中两个分支源自顶部的两个信念。请注意,虽然眼睛角度信念 为两只眼睛生成单独的预测,但本体感受预测直接对聚散调节系统中的角度进行编码,该系统用于动作执行 [10]。 这反映了这样一个事实,即生物中央凹中心的受体远多于周边视觉的受体,而周边视觉之前是用指数关联建模的[25]。 长期以来,聚散度的作用一直被认为是促进双目融合 [5] 和最大化单一环境表示中的编码效率的关键 [26];然而,最近的研究极大地降低了这种机制在深度估计中的重要性。 这与仅靠聚散度无法预测具有模糊线索的深度的发现是一致的[5],这表明深度信念不断受到自上而下的机制和更高层次的线索的影响,而不仅仅是直接从感知中产生。

    75711编辑于 2024-04-11
  • 来自专栏量子位

    5分钟端侧部署视觉大模型!专为Transformer优化的AI芯片来了

    5分钟就能完成原版Swin Transformer端侧部署 AX650N是AI芯片公司爱芯元智发布的第三代端侧芯片。 而目前的大部分端侧AI芯片由于其架构限制为了保证CNN结构的模型效率更好,基本上对MHA结构没有过多性能优化,因此我们需要修改Swin Transformer的网络结构才能勉强将其部署在端侧—— 一旦修改网络结构 爱芯元智联合创始人、副总裁刘建伟介绍: 用AX650N在端侧部署原版Swin Transformer,从拿到测试板到demo复现,只需要5分钟,再到在自己的私有环境里跑起来私有模型,只要1个小时就能搞定 爱芯元智介绍,相比CNN网络,在端侧部署Transformer最大的好处之一就是可以解决以前长尾场景下,AI智能投入太高的问题。 关于爱芯元智 爱芯元智成立于2019年5月,是一家人工智能视觉感知芯片研发及基础算力平台公司。 创始人、董事长兼CEO仇肖莘本硕毕业于清华大学自动化专业,博士毕业于美国南加州大学电子工程专业。

    1.3K20编辑于 2023-08-03
  • 来自专栏信数据得永生

    OpenCV3 和 Qt5 计算机视觉:1~5

    因此,要了解计算机视觉的真正含义,最好知道计算机视觉旨在开发方法以实现所提到的理想,使数字设备具有查看和理解周围环境的能力。 此基础应用将在接下来的两章中扩展:第 4 章,“Mat和QImage”和第 5 章,“图形视图框架”,然后在本书的其余部分中使用插件,尤其是在第 6 章,“OpenCV 中的图像处理”之后,我们将开始深入研究计算机视觉主题和 没有适当的工具来查看和播放图像,涉及计算机视觉的应用将一无所获。 本主题和所有相关主题将在第 5 章,“图形视图框架”中介绍。 在第 5 章,“图形视图框架”中,我们将通过引入一个非常强大的类QGraphicsScene和图形视图框架来完成 Qt 和OpenCV中的计算机视觉难题,它可用于以非常灵活的方式查看和操作图像数据。 第 5 章,“图形视图框架”将是进入计算机视觉和图像处理领域的最后一章,因为我们全面的计算机视觉应用将通过最重要的功能之一完成,那就是图像查看器和操纵器,我们将继续学习新的计算机视觉技巧,每次都向其添加新的插件

    7.4K20编辑于 2023-04-27
  • 视觉智能·场景进化:AI 视频系统训练平台重塑智能视觉新范式

    AI 视频系统训练平台通过构建端到端的视频理解与生成训练体系,实现了从"单帧识别"到"时序理解"、从"通用模型"到"场景专家"的技术跨越,为智能视频分析提供全方位的模型训练支持。 核心痛点解析场景迁移性能差:在特定场景训练的模型,迁移到新环境时性能急剧下降标注成本极其高昂:视频标注需要逐帧处理,时间成本是图像的数十倍时序关系建模困难:传统方法难以有效捕捉视频中的长时序依赖关系多模态融合低效:视觉 工业视觉检测针对制造业质量检测需求,提供小样本缺陷检测训练方案。通过生成对抗网络合成缺陷样本,解决正负样本不均衡问题,使缺陷检出率提升至 99.3%,误报率降至 0.02%。

    34410编辑于 2025-10-30
  • 来自专栏信数据得永生

    树莓派计算机视觉编程:1~5

    一、计算机视觉和 Raspberry Pi 简介 OpenCV 是用于计算机视觉的简单而强大的编程框架。 计算机视觉领域的新手和专家都喜欢它。 计算机视觉意味着模仿生物(即人类和非人类)视觉。 大多数计算机视觉系统的最终目标是从静止图像和视频(包括预先录制的视频和实时提要)中提取有用的信息,以用于决策。 生物视觉系统的工作方式与此类似。 另外,与生物视觉不同,计算机视觉还可以从生物实体不可见的可见光谱中获取图像并进行处理,例如红外图像和深度图像。 计算机视觉还涉及领域,该领域从捕获的图像和视频中提取信息。 2016 年 5 月,英特尔收购了 Itseez。 下图显示了华硕 Tinkerboard 的俯视图: 图 1.3 –华硕 Tinkerboard NVIDIA Jetson NVIDIA Jetson 是系列模块,用于计算机视觉AI 和语音处理任务

    9.8K20编辑于 2023-04-27
  • 来自专栏燧机科技-视频AI智能分析

    加油站ai视觉识别系统

    加油站ai视觉识别系统通过yolov7网络模型深度学习,加油站ai视觉识别系统对现场画面中人员打电话抽烟等违规行为,还有现场出现明火烟雾等危险状态。 加油站ai视觉识别系统还可以对卸油时灭火器未正确摆放、人员离岗不在现场、卸油过程静电释放时间不足等不规范情形进行智能识别记录。

    65230编辑于 2023-03-05
  • HarmonyOS NEXT AI基础视觉服务-人脸识别

    案例描述这是一个基于AI基础视觉服务实现的人脸识别案例,通过调用设备相册选择图片后检测图像中的人脸信息并展示结构化识别结果。实现步骤:1. 人脸检测核心实现// 初始化人脸检测器faceDetector.init();// 配置视觉识别参数const visionInfo: faceDetector.VisionInfo = { pixelMap

    44810编辑于 2025-03-30
  • 来自专栏AI掘金志

    万亿 AIoT,「AI 视觉」企业群雄逐鹿

    大华还推出了一站式AI开发平台“大华巨灵”,解决碎片化孤岛网络问题,以及全栈式智慧物联终端体系睿智5系列产品。 在城市管理的各场景中,商汤以AI大装置作为基础,基于方舟城市开放平台建设城市级的视觉中枢。 2020年初,智能安防产品线更名为“华为机器视觉”,今年5月级别再被二度抬高,摇身一变成“机器视觉军团”。 组织架构一再变化,华为进攻智能物联的动作声势浩大,每一步都透露着华为的野心。 在“城市大脑”是未来的主战场,“城市视觉”是发力点的共识下,紫光华智于2020年11月发布AI视觉中枢全栈解决方案。 新一代AI视觉中枢最大的特点,就是让感知海量数据的“大脑”更加智慧。

    1.3K20编辑于 2022-11-08
领券