搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏计算机视觉战队
AI魔幻行为大赏：细数机器视觉的9大应用场景
机器视觉系统通过图像/视频采集装置，将采集到的图像/视频输入到视觉算法中进行计算，最终得到人类需要的信息。这里提到的视觉算法有很多种，例如，传统的图像处理方法以及近些年的深度学习方法等。以下将以9个场景为例，对一些常见的应用场景进行介绍，让读者直观地理解机器视觉都能解决哪些问题。 06 三维图像视觉三维图像视觉主要是对三维物体进行识别，其主要应用于三维机器视觉、双目立体视觉、三维重建、三维扫描、三维测绘、三维视觉测量、工业仿真等领域。驾驶证、银行卡、营业执照、户口本、签证、房产证等证件类文字识别票据类识别：定额发票、火车票、飞机票、出租车票等票据类文字识别出版类识别：书籍、报刊等印刷物的识别实体标识识别：道路指示牌识别（如图1-9） ▲图1-9 文字识别技术的应用场景 09 图像/视频的生成及设计人工智能技术不仅可以对现有的图片、视频进行分析、编辑，还可以进行再创造。
3.3K21发布于 2019-08-14
来自专栏华章科技
AI魔幻行为大赏：细数机器视觉的9大应用场景
机器视觉系统通过图像/视频采集装置，将采集到的图像/视频输入到视觉算法中进行计算，最终得到人类需要的信息。这里提到的视觉算法有很多种，例如，传统的图像处理方法以及近些年的深度学习方法等。以下将以9个场景为例，对一些常见的应用场景进行介绍，让读者直观地理解机器视觉都能解决哪些问题。 06 三维图像视觉三维图像视觉主要是对三维物体进行识别，其主要应用于三维机器视觉、双目立体视觉、三维重建、三维扫描、三维测绘、三维视觉测量、工业仿真等领域。驾驶证、银行卡、营业执照、户口本、签证、房产证等证件类文字识别票据类识别：定额发票、火车票、飞机票、出租车票等票据类文字识别出版类识别：书籍、报刊等印刷物的识别实体标识识别：道路指示牌识别（如图1-9） ▲图1-9 文字识别技术的应用场景 09 图像/视频的生成及设计人工智能技术不仅可以对现有的图片、视频进行分析、编辑，还可以进行再创造。
1.4K30发布于 2019-07-24
来自专栏优图实验室的专栏
视觉AI，第一！
刚刚，腾讯的视觉AI能力得到了国际权威行业研究机构IDC的认可。在IDC发布的“2021年亚太地区（不含日本）视觉人工智能软件平台供应商”评估报告中，腾讯的视觉AI能力位列中国厂商战略维度第一！作为中国最大的人工智能服务提供商之一，腾讯云在AI领域的技术和应用一直走在前列。目前，腾讯云AI已提供了超过300多项标准化AI开放能力和80+AI行业解决方案。在本次的评估中，依托腾讯优图实验室等顶尖实验室多年的技术研究和落地探索，腾讯云AI为数十万家内外部客户提供AI技术服务和丰富的计算机视觉产品组合，包括人脸识别、人脸核身、图像视频处理和分析、OCR与AI 泛娱乐等，同时也为国家人口普查、健康码、粤港澳小程序等提供核心的自研AI技术能力，为金融、工业、汽车等传统企业提供端到端的解决方案，腾讯云都提供了非常丰富的视觉AI产品组合，这也是IDC给出高分的一大原因作为腾讯顶级的人工智能实验室，腾讯优图实验室始终专注基础研究、产业落地两条腿走路的发展战略，持续输出顶尖的视觉AI能力。
1.1K30发布于 2021-10-28
来自专栏腾讯NEXT学位
9个独特的 CSS 背景视觉效果
其实，借助于CSS和JavaScript的力量，可以创建一些独特的视觉效果，可以使体验更加优雅。斜切视觉效果把背景图片进行一定角度的斜切的视觉效果，在最近这段时间已经风靡设计圈了。在之前要实现这样的效果，可能要做很多额外的事情。渐变动画视觉效果如果，运用大量背景图片动画，可能会分散用户的注意力。使用渐变颜色的动画，在一些场景下就不会有这样的问题，因为渐变颜色的动画效果非常的微弱，在视觉上不会造成很大的干扰： ? 滚动模糊视觉效果滚动模糊这种视觉效果也应用的非常广，特别是当你想使用背景图片吸引用户而且还能让用户在滚动的时候阅读图片上文字的时候，就很适合使用它。滚动改变颜色视觉效果有时候仅仅是简简单单的改变一下背景的颜色就可以起到四两拨千斤的效果。比如下面这个效果，就是通过监听网页滚动的位置来改变背景颜色，简简单单就可以营造一种别样的视觉效果。 ?
2.9K50发布于 2018-05-14
嵌入式AI视觉落地的那些事儿——直面AI视觉落地难的挑战
一、QT界面开发：算法与界面必须解耦嵌入式AI应用通常需要图形界面，QT是常见选择。但开发中容易陷入一个误区：把算法函数直接写在界面类的响应函数里。点一下“开始检测”，界面就卡住，直到检测完成才能动。三、嵌入式平台适配：每块板子有自己的脾气RK3588和Jetson Orin是当前主流的嵌入式AI平台，但开发体验差异不小。交叉编译环境搭建就是个开端，库依赖容易出问题。五、从原型到产品，每一步都不能省嵌入式AI产品开发，不是“写个算法然后拷过去”那么简单。界面要响应快，算法要跑得稳，硬件资源要榨干，还要考虑设备长时间运行的散热和稳定性。高培觉得嵌入式AI开发需要的不是单点技术，而是全局视角：QT界面、OpenCV算法、模型部署、多线程优化、硬件加速、系统稳定性，缺一不可。
7500编辑于 2026-03-23
来自专栏磐创AI技术团队的专栏
使用skimage处理图像数据的9个技巧｜视觉进阶
事实证明,在计算机视觉领域(图像、视频等等),预处理是一个至关重要的步骤。skimage是scikit-learn家族的一部分,它是一个非常有用的库,可以帮助我们开始学习。 ? 你将在计算机视觉之旅中遇到很多类似这种情况的例子。因此,在这里,我们可以使用rescale函数并指定缩放比例。该函数基于图像的原始尺寸,所有图像将以此比例缩放。可以使用具有不同亮度的图像使我们的计算机视觉模型对光照条件的变化具有鲁棒性。这对于在室外照明下工作的系统(例如,交通信号灯的闭路电视摄像机)非常重要。 9.在skimage中使用滤镜我们可以使用滤镜(Filters)来修改或增强图像的特征。如果你曾经在社交媒体平台上玩过图像,就会对滤镜非常熟悉。结尾祝贺你在计算机视觉领域迈出了第一步!
2.9K60发布于 2019-10-15
来自专栏信数据得永生
Python OpenCV3 计算机视觉秘籍：6~9
计算机视觉问题通常需要求解线性方程组。即使在许多 OpenCV 函数中，这些线性方程也是隐藏的。可以肯定的是，您将在计算机视觉应用中面对它们。创建一个FAST检测器并将其应用于图像： fast = cv2.FastFeatureDetector_create(30, True, cv2.FAST_FEATURE_DETECTOR_TYPE_9_ cv2.IMREAD_COLOR) fast = cv2.FastFeatureDetector_create(160, True, cv2.FAST_FEATURE_DETECTOR_TYPE_9_ 该函数非常通用，通常用作许多计算机视觉应用的构建块。在我们的案例中，我们使用了9x6的棋盘。我们使用cv2.findChessboardCorners函数找到板的角，将用于相机参数估计。我们还需要在其本地坐标系中的校准图案点。
3.2K20编辑于 2023-04-27
来自专栏智慧物联产品＆方案
AI视觉识别有哪些工业应用
AI视觉识别，主要是利用人工智能算法对图像或视频数据进行分析和处理，以提取关键信息并执行筛选、判断、预警等任务。AI视觉识别涵盖多种应用，如人脸识别、目标检测和识别、图像分割、行为识别、视频分析等。本篇就简单介绍一下AI视觉识别的应用场景。1、质量控制和检验在制造领域，AI视觉识别可用于检查生产线上的产品是否存在缺陷，确保产品质量稳定，减少残次品。 3、智能安防在公共安全领域，AI视觉可以识别和跟踪公共场所中的在逃嫌疑人，以及可用于安全管制区域的访问控制。 5、智慧零售在零售领域，AI视觉识别可以通过监控店铺客流、货架消耗来分析营销和库存水平，提升店铺经营效率。6、智慧农业AI视觉识别可以通过空中或地面图像，识别监测作物生长状态、健康状况、病虫害情况等。 7、自动驾驶汽车AI视觉可以帮助车辆感知环境、检测障碍物并安全导航，这已成为智能化新能源车的必备能力之一。以上人工智能视觉识别在不同行业的多样化应用的几个例子。
1.6K10编辑于 2023-11-27
来自专栏ADAS性能优化
AI Weekly | Nov. 9, 2019
Researchers tout AI that can predict 25 video frames into the future In a preprint paper, researchers propose an AI model that can predict up to 25 video frames into the future given only two to five starting Applause targets AI bias by sourcing training data at scale Software-testing company Applause wants to reinvent AI testing with a service that detects AI bias by crowdsourcing larger training data sets. Remember that scary AI text-generator that was too dangerous to release?
28410编辑于 2022-05-13
来自专栏理论坞
视觉数据和AI的“杀手应用”
虽然许多人正在寻找“杀手级”的视觉，但更有可能视觉是AI和计算机的“杀手级应用”。 ? 今天有AI模块的app，只需拍摄一个照片，便可在几秒钟内告诉你狗的种类，或植物的种类。例如，最前沿的AI系统采用在人脑神经网络之后建模的深度学习或深层神经网络。（当然，他们没有任何地方接近人类相同的能力）。 AI系统和视觉数据视觉对于我们具有非常重要的意义，这解释了为什么65％的人都是视觉工作者。要做到这一点，它需要更高质量的视觉数据和复杂的算法将信息翻译成有意义的东西。当涉及到AI，领先的科技公司都在这个领域寻求突破和探索。他们知道，AI是一个改变我们生活和工作的游戏规则。虽然许多人正在寻找“杀手级”视觉，但我想说，视觉是AI和计算领域的“杀手级” 。我们已经依赖于视觉内容。然而，飞飞预测，随着相机技术和传感器的使用越来越多，未来将更加依赖它。
54030发布于 2018-08-06
来自专栏人工智能
多模态AI与视觉语言模型
然而，真实世界的智能需要跨越感官的界限，实现视觉、语言、声音等多种信息的统一理解与生成。 CLIP：连接视觉与语言的桥梁 CLIP原理 CLIP（Contrastive Language-Image Pre-training）由OpenAI于2021年发布，通过简单而强大的理念实现了视觉和语言的统一理解 CLIP的影响 CLIP证明了大规模对比预训练的有效性，开启了视觉-语言模型的新纪元。从零样本分类到图像生成，从视觉问答到多模态对话，多模态技术正在不断拓展AI的能力边界。未来，随着模型规模的扩大和训练数据的积累，多模态AI将在更多领域发挥作用，为人机交互带来革命性变化。掌握多模态学习的技术，将帮助读者在AI浪潮中把握机遇，创造更智能的应用。
52810编辑于 2026-01-21
来自专栏做数据的二号姬
认真聊AI | 计算机视觉
计算机视觉是一门研究如何对数字图像或视频进行高层理解的交叉学科。据说人一生中70%的信息都是通过看获得的，很容易联想到，对于致力于和人类一样拥有智能的AI也很看重看得能力。实际上，计算机视觉的技术在生活的方方面面都有着应用，如指纹识别、车牌识别、人脸识别、视频监控、自动驾驶、增强现实等。视觉任务处理对人类来说非常简单，但是对计算机来说确很复杂。尽管计算机视觉任务繁多，但大多数任务本质上可以建模为广义的函数拟合问题。即对任意输入图像X，需要学习一个以Θ为参数的函数F，使得y=F0(X)。除此之外，基于深度学习的计算机视觉应用也比较多，神经网络之类的方法在计算机视觉上的应用还是比较广的。比如现在应用比较广的人脸识别技术，仅从步骤上来说，也就是简单的几个步骤：第一步，人脸检测。尽管深度学习给计算机视觉带来了很多革命性的改变，但是目前的计算机视觉领域还是一个以来大规模、强监督的数据路线上。从这个角度上来说，计算机视觉可能更像一个劳动密集型的产业，大量依赖于数据标注。
34500编辑于 2025-07-14
来自专栏CreateAMind
彻底解决AI视觉深度估计
(i) 和视觉可能性(1)3 与对眼睛角度 µθ 的置信度不同，该置信度仅受到以下级别的可能性的偏差，该置信度同时受到中编码的先验和来自的视觉可能性的影响。 3.3. 这反映了这样一个事实，即生物中央凹中心的受体远多于周边视觉的受体，而周边视觉之前是用指数关联建模的[25]。在均匀条件下，视觉噪声设置为零。最后，同时实现深度估计和目标固定的主动视觉模型所达到的性能水平几乎与在正确位置初始化固定的模型相当。事实上，后两个条件之间唯一明显的区别是主动视觉条件下的时间步数稍多。我们的结果表明主动视觉可以改善深度估计。然而，如果聚散度不能提供有用的深度提示，那么这怎么可能呢？答案在于中央凹的分辨率不均匀，其注视中心的感受器远多于周边视觉的感受器。
82611编辑于 2024-04-11
来自专栏白话互联
【Ai Agent】Ai Agent News | 9月11日速递
今天是9月11日星期四，让我们一起来看看今天 Ai Agent 带来的 AI 领域的重要动态吧！ ❤ Indeed Unveils AI Agents for Job Seekers and Recruiters 求职招聘领域迎来AI助手新时代 Indeed推出了两款AI Agents，分别面向求职者和招聘方 ❤ Secure AI Agents at Runtime with Docker Docker推出AI Agent运行时安全解决方案 Docker发布了关于如何在运行时保护AI Agent的新方法，随着AI工具的强大和普及，它们也变得不可预测且易受攻击。从LLM输出中的幻觉到提示注入，AI工作流面临多重安全威胁。 AI Agent时嵌入运行时安全，为AI原生开发提供更可靠的安全保障。
36110编辑于 2025-09-17
视觉智能·场景进化：AI 视频系统训练平台重塑智能视觉新范式
AI 视频系统训练平台通过构建端到端的视频理解与生成训练体系，实现了从"单帧识别"到"时序理解"、从"通用模型"到"场景专家"的技术跨越，为智能视频分析提供全方位的模型训练支持。核心痛点解析场景迁移性能差：在特定场景训练的模型，迁移到新环境时性能急剧下降标注成本极其高昂：视频标注需要逐帧处理，时间成本是图像的数十倍时序关系建模困难：传统方法难以有效捕捉视频中的长时序依赖关系多模态融合低效：视觉工业视觉检测针对制造业质量检测需求，提供小样本缺陷检测训练方案。通过生成对抗网络合成缺陷样本，解决正负样本不均衡问题，使缺陷检出率提升至 99.3%，误报率降至 0.02%。
39610编辑于 2025-10-30
HarmonyOS NEXT AI基础视觉服务-人脸识别
案例描述这是一个基于AI基础视觉服务实现的人脸识别案例，通过调用设备相册选择图片后检测图像中的人脸信息并展示结构化识别结果。实现步骤：1. 人脸检测核心实现// 初始化人脸检测器faceDetector.init();// 配置视觉识别参数const visionInfo: faceDetector.VisionInfo = { pixelMap
46810编辑于 2025-03-30
来自专栏燧机科技-视频AI智能分析
加油站ai视觉识别系统
加油站ai视觉识别系统通过yolov7网络模型深度学习，加油站ai视觉识别系统对现场画面中人员打电话抽烟等违规行为，还有现场出现明火烟雾等危险状态。加油站ai视觉识别系统还可以对卸油时灭火器未正确摆放、人员离岗不在现场、卸油过程静电释放时间不足等不规范情形进行智能识别记录。
66930编辑于 2023-03-05
HarmonyOS NEXT AI基础视觉服务-文字识别
案例描述这是一个基于AI基础视觉服务实现的文字识别案例，通过调用设备相机拍摄照片后识别图片中的文字内容。实现步骤：1. 文字识别核心实现// 配置视觉识别参数let visionInfo: textRecognition.VisionInfo = { pixelMap: pixelMap};// 执行文字识别并获取结果 camera.CameraPosition.CAMERA_POSITION_BACK }) // 步骤2：检查OCR能力可用性// 使用canIUse接口检测设备是否支持文字识别能力 if (canIUse('SystemCapability.AI.OCR.TextRecognition
41100编辑于 2025-03-30
来自专栏AI掘金志
万亿 AIoT，「AI 视觉」企业群雄逐鹿
在城市管理的各场景中，商汤以AI大装置作为基础，基于方舟城市开放平台建设城市级的视觉中枢。紫光华智：“AI+AR”双剑合璧，向“数字政府+百行百业”奋力进击紫光华智，是紫光集团的核心企业，AI视觉业务的唯一载体。自带“紫光”与“新华三”双重基因，紫光华智迅速成长为AI视觉赛道的新势力，让整个视频物联市场为之侧目。在“城市大脑”是未来的主战场，“城市视觉”是发力点的共识下，紫光华智于2020年11月发布AI视觉中枢全栈解决方案。新一代AI视觉中枢最大的特点，就是让感知海量数据的“大脑”更加智慧。
1.3K20编辑于 2022-11-08
来自专栏MixLab科技+设计实验室
视觉特效·AI视频抠图·换脸
好学的 ace 我最近在学习blender里的VFX，秀下我的学习成果~~ 视觉特效 Visual effects, 简称VFX 合成真人拍摄的镜头和计算机生成图像，以创造虚拟的真实场景。其实不用呀，可以好好研究下AI视频抠图的技术 shadow eva 大批量的绿幕视频就有了。。无界配合上AI换脸之类的，素材更多了~~ 3D实时换脸技术对，如果是偏艺术的素材，还可以有这种复活名画的玩法~~ shadow AR艺术滤镜使用mediapipe的facemesh模型实现的
4.9K10发布于 2021-08-26

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

AI魔幻行为大赏：细数机器视觉的9大应用场景

AI魔幻行为大赏：细数机器视觉的9大应用场景

视觉AI，第一！

9个独特的 CSS 背景视觉效果

嵌入式AI视觉落地的那些事儿——直面AI视觉落地难的挑战

使用skimage处理图像数据的9个技巧｜视觉进阶

Python OpenCV3 计算机视觉秘籍：6~9

AI视觉识别有哪些工业应用

AI Weekly | Nov. 9, 2019

视觉数据和AI的“杀手应用”

多模态AI与视觉语言模型

认真聊AI | 计算机视觉

彻底解决AI视觉深度估计

【Ai Agent】Ai Agent News | 9月11日速递

视觉智能·场景进化：AI 视频系统训练平台重塑智能视觉新范式

HarmonyOS NEXT AI基础视觉服务-人脸识别

加油站ai视觉识别系统

HarmonyOS NEXT AI基础视觉服务-文字识别

万亿 AIoT，「AI 视觉」企业群雄逐鹿

视觉特效·AI视频抠图·换脸

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐