首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏优图实验室的专栏

    视觉AI,第一!

    刚刚,腾讯的视觉AI能力得到了国际权威行业研究机构IDC的认可。 在IDC发布的“2021年亚太地区(不含日本)视觉人工智能软件平台供应商”评估报告中,腾讯的视觉AI能力位列中国厂商战略维度第一! 作为中国最大的人工智能服务提供商之一,腾讯云在AI领域的技术和应用一直走在前列。目前,腾讯云AI已提供了超过300多项标准化AI开放能力和80+AI行业解决方案。 在本次的评估中,依托腾讯优图实验室等顶尖实验室多年的技术研究和落地探索,腾讯云AI为数十万家内外部客户提供AI技术服务和丰富的计算机视觉产品组合,包括人脸识别、人脸核身、图像视频处理和分析、OCR与AI 泛娱乐等,同时也为国家人口普查、健康码、粤港澳小程序等提供核心的自研AI技术能力,为金融、工业、汽车等传统企业提供端到端的解决方案,腾讯云都提供了非常丰富的视觉AI产品组合,这也是IDC给出高分的一大原因 作为腾讯顶级的人工智能实验室,腾讯优图实验室始终专注基础研究、产业落地两条腿走路的发展战略,持续输出顶尖的视觉AI能力。

    1.1K30发布于 2021-10-28
  • 来自专栏信数据得永生

    Python OpenCV 计算机视觉:6~7

    Pygame 提供了更多功能,包括: 绘制 2D 几何 绘制文字 管理可绘制 AI 实体(精灵)的分组 捕获与窗口,键盘,鼠标和操纵杆/游戏手柄相关的各种输入事件 创建自定义事件 播放和合成声音和音乐 例如,Pygame 可能是使用计算机视觉的游戏的合适后端,而 HighGUI 则不是。 unzip_destination>\bin\Release 如果要将可执行文件的文件夹添加到系统的Path变量中,请参考第 1 章,“设置 OpenCV”的“在 Windows XP,Windows Vista,Windows 7

    2K20编辑于 2023-04-27
  • 嵌入式AI视觉落地的那些事儿——直面AI视觉落地难的挑战

    一、QT界面开发:算法与界面必须解耦嵌入式AI应用通常需要图形界面,QT是常见选择。但开发中容易陷入一个误区:把算法函数直接写在界面类的响应函数里。点一下“开始检测”,界面就卡住,直到检测完成才能动。 三、嵌入式平台适配:每块板子有自己的脾气RK3588和Jetson Orin是当前主流的嵌入式AI平台,但开发体验差异不小。交叉编译环境搭建就是个开端,库依赖容易出问题。 五、从原型到产品,每一步都不能省嵌入式AI产品开发,不是“写个算法然后拷过去”那么简单。界面要响应快,算法要跑得稳,硬件资源要榨干,还要考虑设备长时间运行的散热和稳定性。 高培觉得嵌入式AI开发需要的不是单点技术,而是全局视角:QT界面、OpenCV算法、模型部署、多线程优化、硬件加速、系统稳定性,缺一不可。

    4900编辑于 2026-03-23
  • 来自专栏大数据文摘

    视觉直观感受 7 种常用排序算法

    点击标题下「大数据文摘」可快捷关注 10月14日发布《统计世界的十大算法》后,很多朋友在后台询问,哪里有“视觉直观感受 7 种常用排序算法”,今天分享给大家,感谢todayx.org。 在已经排序的元素序列中从后向前扫描 如果该元素(已排序)大于新元素,将该元素移到下一位置 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置 将新元素插入到该位置中 重复步骤2 排序效果: (暂无) 7.

    64050发布于 2018-05-22
  • 来自专栏智慧物联产品&方案

    AI视觉识别有哪些工业应用

    AI视觉识别,主要是利用人工智能算法对图像或视频数据进行分析和处理,以提取关键信息并执行筛选、判断、预警等任务。AI视觉识别涵盖多种应用,如人脸识别、目标检测和识别、图像分割、行为识别、视频分析等。 本篇就简单介绍一下AI视觉识别的应用场景。1、质量控制和检验在制造领域,AI视觉识别可用于检查生产线上的产品是否存在缺陷,确保产品质量稳定,减少残次品。 3、智能安防在公共安全领域,AI视觉可以识别和跟踪公共场所中的在逃嫌疑人,以及可用于安全管制区域的访问控制。 5、智慧零售在零售领域,AI视觉识别可以通过监控店铺客流、货架消耗来分析营销和库存水平,提升店铺经营效率。6、智慧农业AI视觉识别可以通过空中或地面图像,识别监测作物生长状态、健康状况、病虫害情况等。 7、自动驾驶汽车AI视觉可以帮助车辆感知环境、检测障碍物并安全导航,这已成为智能化新能源车的必备能力之一。以上人工智能视觉识别在不同行业的多样化应用的几个例子。

    1.6K10编辑于 2023-11-27
  • 来自专栏理论坞

    视觉数据和AI的“杀手应用”

    虽然许多人正在寻找“杀手级”的视觉,但更有可能视觉AI和计算机的“杀手级应用”。 ? 今天有AI模块的app,只需拍摄一个照片,便可在几秒钟内告诉你狗的种类,或植物的种类。 例如,最前沿的AI系统采用在人脑神经网络之后建模的深度学习或深层神经网络。(当然,他们没有任何地方接近人类相同的能力)。 AI系统和视觉数据 视觉对于我们具有非常重要的意义,这解释了为什么65%的人都是视觉工作者。 要做到这一点,它需要更高质量的视觉数据和复杂的算法将信息翻译成有意义的东西。 当涉及到AI,领先的科技公司都在这个领域寻求突破和探索。他们知道,AI是一个改变我们生活和工作的游戏规则。 虽然许多人正在寻找“杀手级”视觉,但我想说,视觉AI和计算领域的“杀手级” 。 我们已经依赖于视觉内容。然而,飞飞预测,随着相机技术和传感器的使用越来越多,未来将更加依赖它。

    52930发布于 2018-08-06
  • 来自专栏做数据的二号姬

    认真聊AI | 计算机视觉

    计算机视觉是一门研究如何对数字图像或视频进行高层理解的交叉学科。 据说人一生中70%的信息都是通过看获得的,很容易联想到,对于致力于和人类一样拥有智能的AI也很看重看得能力。 实际上,计算机视觉的技术在生活的方方面面都有着应用,如指纹识别、车牌识别、人脸识别、视频监控、自动驾驶、增强现实等。 视觉任务处理对人类来说非常简单,但是对计算机来说确很复杂。 尽管计算机视觉任务繁多,但大多数任务本质上可以建模为广义的函数拟合问题。即对任意输入图像X,需要学习一个以Θ为参数的函数F,使得y=F0(X)。 除此之外,基于深度学习的计算机视觉应用也比较多,神经网络之类的方法在计算机视觉上的应用还是比较广的。 比如现在应用比较广的人脸识别技术,仅从步骤上来说,也就是简单的几个步骤: 第一步,人脸检测。 尽管深度学习给计算机视觉带来了很多革命性的改变,但是目前的计算机视觉领域还是一个以来大规模、强监督的数据路线上。从这个角度上来说,计算机视觉可能更像一个劳动密集型的产业,大量依赖于数据标注。

    32200编辑于 2025-07-14
  • 来自专栏人工智能

    多模态AI视觉语言模型

    然而,真实世界的智能需要跨越感官的界限,实现视觉、语言、声音等多种信息的统一理解与生成。 CLIP:连接视觉与语言的桥梁 CLIP原理 CLIP(Contrastive Language-Image Pre-training)由OpenAI于2021年发布,通过简单而强大的理念实现了视觉和语言的统一理解 CLIP的影响 CLIP证明了大规模对比预训练的有效性,开启了视觉-语言模型的新纪元。 从零样本分类到图像生成,从视觉问答到多模态对话,多模态技术正在不断拓展AI的能力边界。 未来,随着模型规模的扩大和训练数据的积累,多模态AI将在更多领域发挥作用,为人机交互带来革命性变化。 掌握多模态学习的技术,将帮助读者在AI浪潮中把握机遇,创造更智能的应用。

    41710编辑于 2026-01-21
  • 来自专栏CreateAMind

    彻底解决AI视觉深度估计

    事实上,如果假设中心凹分辨率是均匀的(例如在人工代理的相机模型中),则通过保持眼睛平行可以实现最佳精度(图 7,推断平行条件)。 这会进一步增加主动视觉模型估计深度所需的时间。 Figure 7.仿真结果。 此外,我们的结果表明,主动视觉动力学使推理特别有效 并且固定目标极大地提高了任务准确性(见图 7)。 在此假设下,当双眼固定在物体上时,可以获得最佳性能,如图 7 所示。如[43]中所述,当立体相机具有非对称的聚散角时,当投影为 一个点落在相机平面的中心。 总而言之,结果是在统一分辨率场景中,通过固定平行眼睛实现最佳估计(见图 7),而主动视觉不会给任务带来任何优势。

    75711编辑于 2024-04-11
  • 来自专栏PPV课数据科学社区

    【学习】视觉直观感受 7 种常用排序算法

    10月14日发布《统计世界的十大算法》后,很多朋友在后台询问,哪里有“视觉直观感受 7 种常用排序算法”,今天分享给大家,感谢todayx.org。 1. 在已经排序的元素序列中从后向前扫描 如果该元素(已排序)大于新元素,将该元素移到下一位置 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置 将新元素插入到该位置中 重复步骤2 排序效果: (暂无) 7.

    70650发布于 2018-04-20
  • 视觉智能·场景进化:AI 视频系统训练平台重塑智能视觉新范式

    AI 视频系统训练平台通过构建端到端的视频理解与生成训练体系,实现了从"单帧识别"到"时序理解"、从"通用模型"到"场景专家"的技术跨越,为智能视频分析提供全方位的模型训练支持。 核心痛点解析场景迁移性能差:在特定场景训练的模型,迁移到新环境时性能急剧下降标注成本极其高昂:视频标注需要逐帧处理,时间成本是图像的数十倍时序关系建模困难:传统方法难以有效捕捉视频中的长时序依赖关系多模态融合低效:视觉 工业视觉检测针对制造业质量检测需求,提供小样本缺陷检测训练方案。通过生成对抗网络合成缺陷样本,解决正负样本不均衡问题,使缺陷检出率提升至 99.3%,误报率降至 0.02%。

    34410编辑于 2025-10-30
  • 来自专栏极客慕白的成长之路

    视觉直观感受 7 种常用的排序算法

    在已经排序的元素序列中从后向前扫描 如果该元素(已排序)大于新元素,将该元素移到下一位置 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置 将新元素插入到该位置中 重复步骤2 排序效果: (暂无) 7.

    32140发布于 2018-08-03
  • 来自专栏后端技术探索

    视觉直观感受 7 种常用的排序算法

    在已经排序的元素序列中从后向前扫描 如果该元素(已排序)大于新元素,将该元素移到下一位置 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置 将新元素插入到该位置中 重复步骤2 排序效果: (暂无) 7.

    68421发布于 2018-08-09
  • 来自专栏燧机科技-视频AI智能分析

    加油站ai视觉识别系统

    加油站ai视觉识别系统通过yolov7网络模型深度学习,加油站ai视觉识别系统对现场画面中人员打电话抽烟等违规行为,还有现场出现明火烟雾等危险状态。 加油站ai视觉识别系统还可以对卸油时灭火器未正确摆放、人员离岗不在现场、卸油过程静电释放时间不足等不规范情形进行智能识别记录。 YOLOv7 的发展方向与当前主流的实时目标检测器不同,研究团队希望它能够同时支持移动 GPU 和从边缘到云端的 GPU 设备。 图片YOLOv7 的策略是使用组卷积来扩展计算块的通道和基数。研究者将对计算层的所有计算块应用相同的组参数和通道乘数。

    65230编辑于 2023-03-05
  • HarmonyOS NEXT AI基础视觉服务-人脸识别

    案例描述这是一个基于AI基础视觉服务实现的人脸识别案例,通过调用设备相册选择图片后检测图像中的人脸信息并展示结构化识别结果。实现步骤:1. 人脸检测核心实现// 初始化人脸检测器faceDetector.init();// 配置视觉识别参数const visionInfo: faceDetector.VisionInfo = { pixelMap

    44810编辑于 2025-03-30
  • 来自专栏AI掘金志

    万亿 AIoT,「AI 视觉」企业群雄逐鹿

    今年4月,2022旷视企业业务合作伙伴大会上,印奇抛出“AIoT= AI+IoT+空间”的等式。 为打好AIoT这场持久仗,旷世在7月进一步提出更具概括性的“2+1”技术科研体系。 在城市管理的各场景中,商汤以AI大装置作为基础,基于方舟城市开放平台建设城市级的视觉中枢。 紫光华智:“AI+AR”双剑合璧,向“数字政府+百行百业”奋力进击 紫光华智,是紫光集团的核心企业,AI视觉业务的唯一载体。 在“城市大脑”是未来的主战场,“城市视觉”是发力点的共识下,紫光华智于2020年11月发布AI视觉中枢全栈解决方案。 新一代AI视觉中枢最大的特点,就是让感知海量数据的“大脑”更加智慧。

    1.3K20编辑于 2022-11-08
  • 来自专栏MixLab科技+设计实验室

    视觉特效·AI视频抠图·换脸

    好学的 ace 我最近在学习blender里的VFX,秀下我的学习成果~~ 视觉特效 Visual effects, 简称VFX 合成真人拍摄的镜头和计算机生成图像,以创造虚拟的真实场景。 其实不用呀,可以好好研究下AI视频抠图的技术 shadow eva 大批量的绿幕视频就有了。。 无界 配合上AI换脸之类的,素材更多了~~ 3D实时换脸技术 对,如果是偏艺术的素材,还可以有这种复活名画的玩法~~ shadow AR艺术滤镜 使用mediapipe的facemesh模型实现的

    4.9K10发布于 2021-08-26
  • HarmonyOS NEXT AI基础视觉服务-文字识别

    案例描述这是一个基于AI基础视觉服务实现的文字识别案例,通过调用设备相机拍摄照片后识别图片中的文字内容。实现步骤:1. 文字识别核心实现// 配置视觉识别参数let visionInfo: textRecognition.VisionInfo = { pixelMap: pixelMap};// 执行文字识别并获取结果 camera.CameraPosition.CAMERA_POSITION_BACK }) // 步骤2:检查OCR能力可用性// 使用canIUse接口检测设备是否支持文字识别能力 if (canIUse('SystemCapability.AI.OCR.TextRecognition

    37900编辑于 2025-03-30
  • HarmonyOS NEXT AI基础视觉服务-背景替换

    案例描述这是一个基于AI基础视觉服务实现的背景替换案例,通过调用设备相册选择图片后对主体进行智能分割,并支持动态更换背景颜色。实现步骤:1. 图片选择与处理async segmentImage() { if (canIUse('SystemCapability.AI.Vision.SubjectSegmentation')) { // 主题分割处理 // 配置视觉识别参数 const visionInfo: subjectSegmentation.VisionInfo = { pixelMap: this.chooseImage Local bgColor: ResourceColor = Color.White async segmentImage() { if (canIUse('SystemCapability.AI.Vision.SubjectSegmentation

    34000编辑于 2025-03-30
  • 来自专栏燧机科技-视频AI智能分析

    加油站ai视觉分析检测预警

    加油站ai视觉分析预警算法通过yolov8图像识别和行为分析,加油站ai视觉分析预警算法识别出打电话抽烟、烟火行为、静电释放时间是否合规、灭火器摆放以及人员工服等不符合规定的行为,并发出预警信号以提醒相关人员 加油站ai视觉分析预警算法模型中YOLOv8 的推理过程和 YOLOv5 几乎一样,唯一差别在于前面需要对 Distribution Focal Loss 中的积分表示 bbox 形式进行解码,变成常规的 在介绍加油站ai视觉分析预警算法Yolo算法之前,首先先介绍一下滑动窗口技术,这对我们理解Yolo算法是有帮助的。采用滑动窗口的目标检测算法思路非常简单,它将检测问题转化为了图像分类问题。 加油站ai视觉分析预警算法YOLOv8分割模型使用-seg后缀,即yolov8n- seg .pt,并在COCO上进行预训练。 不需要传递参数,因为加油站ai视觉分析预警算法模型保留了它的训练数据和参数作为模型属性。图像分类器的输出是一个单一的类标签和一个置信度分数。

    53130编辑于 2023-09-15
领券