首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏千行百业数据集中心

    roi区域识别 指定区域检测 区域入侵检测及停留时长统计

    区域入侵检测项目概述主要展示了一个利用计算机视觉分析等待时间以及监测物体或人员在视频帧预定义区域停留时长的实践演示,适用于零售分析或交通管理等领域。 enter完成当前多边形绘制、escape取消当前多边形绘制、q退出绘图窗口、s保存区域配置视频与流处理脚本inference_file_example:使用Roboflow推理模型对视频文件进行目标检测 source_video_path:源视频文件路径--model_id:Roboflow模型ID--classes:要跟踪的类别ID列表(为空则跟踪所有类别)--confidence_threshold:检测的置信水平 类似,多了--rtsp_url(视频流的完整RTSPURL)ultralytics_file_example:使用UltralyticsYOLOv8模型对视频文件进行目标检测-部分参数与inference_file_example 模型权重文件路径,默认’yolov8s.pt’)、--device(计算设备,默认’cpu’)ultralytics_stream_example:使用UltralyticsYOLOv8模型在视频流上运行目标检测

    1500编辑于 2026-06-06
  • 来自专栏CodecWang

    11: 边缘检测

    目标 Canny边缘检测的简单概念 OpenCV函数:cv2.Canny() 教程 Canny边缘检测方法常被誉为边缘检测的最优方法,废话不多说,先看个例子: import cv2 import numpy Canny边缘检测 Canny边缘提取的具体步骤如下: 1,使用5×5高斯滤波消除噪声: 边缘检测本身属于锐化操作,对噪点比较敏感,所以需要进行平滑处理。 先阈值分割后检测 其实很多情况下,阈值分割后再检测边缘,效果会更好: _, thresh = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU 练习 (选做)如果你不太理解高低阈值的效果,创建两个滑动条来调节它们的值看看: 小结 Canny是用的最多的边缘检测算法,用cv2.Canny()实现。 接口文档 cv2.Canny() 引用 本节源码 Canny Edge Detection Canny 边缘检测 Canny J .

    90820编辑于 2021-12-07
  • 来自专栏小鹏的专栏

    OpenCV之图像ROIROI操作

    cy = h//2 cx = w//2 roi = src[cy-100:cy+100,cx-100:cx+100,:] cv.imshow("roi", roi) # copy ROI image = np.copy(roi) # modify ROI roi[:, :, 0] = 0 cv.imshow("result", src) # modify copy roi image[:, : , 2] = 0 cv.imshow("result", src) cv.imshow("copy roi", image) # example with ROI - generate mask src2 ("roi", roi); Mat image = roi.clone(); // modify ROI roi.setTo(Scalar(255, 0, 0)); imshow("result roi", image); // example with ROI - generate mask Mat src2 = imread(".

    78920发布于 2021-07-19
  • 来自专栏半杯茶的小酒杯

    目标检测(Object Detection)-Faster RCNN中的ROI Pooling Layer

    什么是ROI Pooling ROI(Region Of Interest)是从目标图像中识别出的候选识别区域。 Faster RCNN架构 ROI Pooling算法 ROI Pooling不同于CNN 网络中的池化层,它通过分块池化的方法得到固定尺寸的输出。 2x2 ROI Pooling Layer 如上图所示,假设Feature Map大小为4x4,候选ROI区域大小为3x3,通过2x2的ROI Pooling Layer得到2x2的归一化输出。 4个划分后子窗口分别为1、2、3、5(5最大),3、7(7最大),9、10(10最大),11(11最大),然后对每个子窗口做Max Pooling。 Faster RCNN中的ROI Pooling ROI Pooling的输入: 1) 通过神经网络获取的固定大小的Feature Map; 2) RPN网络产生的一系列RoIs,RoIs是nx5的矩阵

    2.2K31编辑于 2022-04-28
  • 来自专栏TGLTommyAI前沿技术论文

    笔记分享 : 一文读懂3个概念 : RoI, RoI pooling, RoI Align

    哈喽,大家好,今天我们一起学习一下三个重要的概念:RoIRoI pooling 和 RoI Align 相信学习CV(Computer Vision)的同学对此并不陌生,完全理解这三个概念有助于我们掌握深度学习目标检测与识别算法 接下来,我们一起开启“RoI探险之旅” : 第一部分:RoI 1. 上帝之问:RoI是个什么鬼?? 第二部分:RoI pooling 当我们将原图上的RoI映射到feature map上之后,我们可以应用pooling。其实,这里也有一个问题:为什么要用RoI pooling ? 接下来,我们看一下整个操作过程的动态图演示,图-11所示: 【注意:每两个数值,选取其中最大值作为最终值】 ? 整个RoI pooling层的输出如图-12所示: ? 总结:RoI pooling最大的问题就是操作会导致数据丢失,影响整个模型分类和定位的准确性,解决方式就是引入了RoI Align。 第三部分:RoI Align 1. 什么是RoI Align ?

    21.9K1111发布于 2021-05-28
  • 来自专栏深度学习和计算机视觉

    RoI Pooling 与 RoI Align 有什么区别?

    需要注意的一点是RoI并不等价于bounding box, 它们可能看起来像,但是RoI只是为了进一步处理而产生的候选区域。 bounding box boundding box 指的是检测目标的边界矩形框。 量化 量化(quatization)是指将输入从连续值(或大量可能的离散取值)采样为有限多个离散值的过程。 RoI Pooling = crop feature + resize feature 通过上图的容易得到,RoI Pooling的作用本质上是为了将不同尺寸的RoI特征转换为相同的特征图输出,保证特征图展开 下图中绿色框为RoI对应的实际区域(由于经过特征尺度变换,导致RoI的坐标会可能会落到特征图的单元之间), 蓝色框代表量化(网格对齐)后的RoI所对应的特征图。 公式推导 如图,已知求位置像素P的像素值, 已知相邻 的像素区域对应位置和像素值,其中坐下角像素区域标号为11,左上角像素区域标号为12,右下角像素区域标号为21,右上角像素区域标号为22。

    1.4K10编辑于 2022-02-14
  • 来自专栏互联网数据官iCDO

    ROI已死?

    似乎只有这几个了,另外一些猛投效果类广告的行业,其实根本不可能仅仅通过购买流量实现利润为正(请注意是利润为正,不是ROI大于1,ROI大于1比比皆是,但是ROI很多时候大于2甚至3也未必有正向利润),他们投效果的目的是为了更长时间维度的盈利 流量变现的ROI永远不可能升高。流量在不断涨价,cpi却基本上很稳定。所以,ROI怎么升高呢。 4 ROI不能反映归因状况 低ROI的渠道并不一定就差,高ROI的渠道也不见得就牛逼。 这样ROI的价值必然会下降。 ROI,但ROI早已不是营销的标的。

    97920发布于 2019-10-06
  • 来自专栏用户2442861的专栏

    openCV—Python(11)—— 图像边缘检测

    box-sizing: border-box; padding: 0px 5px;">10

  • 11 box-sizing: border-box; padding: 0px 5px;">10
  • 11 laplacian边缘检测结果: ? X方向边缘检测结果: ? Y方向边缘检测结果: ? XY方向结合边缘检测结果: ? Canny边缘检测结果: ?

2.1K11发布于 2018-09-19
  • 来自专栏计算机视觉理论及其实现

    RoI Pooling与RoIWrap Pooling与RoIAlign Pooling与Precise RoI Pooling

    操作带来的检测精度影响越来越小。 RoI Pooling这种Pooling方法我是在Faster RCNN中看到的,该种Pooling方法采用的运算方法比较直接。下面是其计算的流程图:? 可以看出这里去掉了第二次的量化操作,进而减小了误差,也提升了检测的精度。4. 从而提升了检测的精确度。? 那么它具体是怎么搞的呢?还是用之前的例子来看看吧。 这就使得其检测精确度进一步提升。具体的差别有多大呢?可以看一下Mask RCNN中给出的实验数据。?5. Precise RoI Pooling?

    1.3K20编辑于 2022-09-02
  • 来自专栏疯狂学习GIS

    ENVI感兴趣区ROI文件由XML格式转为ROI格式

      本文介绍在ENVI软件中,将用户自行绘制的.xml格式的感兴趣区(ROI)文件转换为.roi格式的方法。    绘制完毕后,我们需要通过右击ROI列表,选择“Save As”保存我们刚刚绘制好的ROI文件。   可是这样保存后,软件强制设定默认的文件格式为.xml格式,而非.roi格式;如下图所示。    当然,对于新版本的ENVI软件,其虽然默认保存.xml格式的ROI文件,但也完全支持对老版本.roi格式ROI文件的读取;但有时由于一些原因,我们可能必须要将绘制好的ROI文件保存成.roi格式。 在我们的ROI文件列表中,任意选择一个ROI类型并双击,打开Region of Interest (ROI) Tool窗口。    选择我们要保存的ROI文件类别,并配置后文件名与路径。   即可看到,我们已经成功获得了.roi格式的ROI文件,即完成了由.xml格式向.roi格式的转换。   至此,大功告成。

    1.6K10编辑于 2022-08-10
  • 来自专栏贾志刚-OpenCV学堂

    YOLO11+OpenVINO 实现药片检测

    数据集下载地址: https://github.com/ultralytics/assets/releases/download/v0.0.0/medical-pills.zip、 数据标签文件配置: YOLO11 模型训练 训练命令行 yolo detect train data=medical-pills.yaml model=yolo11n.pt epochs=100 imgsz=640 PR曲线 部署与量化推理演示 PTQ的量化代码如下: 运行结果如下: 基于OpenVINO2025 C++ SDK部署INT8量化后模型,推理效果如下: OpenVINO + YOLO11药片检测的推理代码如下: std::string > detector(new YOLO11Detector()); detector->initConfig(xmlpath, labelpath, 0.2, 640, 640); cv::Mat image = cv::imread("D:/pills.jpg"); detector->detect(image); cv::imshow("YOLO11药片检测+OpenVINO2025", image);

    19910编辑于 2026-04-02
  • 来自专栏AIUAI

    Caffe源码 - RoI Pooling 层

    RoI Pooling 层 caffe prototxt 定义: layer { name: "roi_pool5" type: "ROIPooling" bottom: "conv5" : 0.0625 # 1/16 } } caffe caffe.proto ROI Pooling 层参数说明: optional ROIPoolingParameter roi_pooling_param = this->layer_param_.roi_pooling_param(); CHECK_GT(roi_pool_param.pooled_h(), 0) << "pooled_h must _); // bottom-fight y2 CHECK_GE(roi_batch_ind, 0); CHECK_LT(roi_batch_ind, batch_size); int roi_height = max(roi_end_h - roi_start_h + 1, 1); int roi_width = max(roi_end_w - roi_start_w + 1, 1); // RoI

    1.1K50发布于 2019-02-18
  • 来自专栏AI深度学习求索

    ROI操作:ROIPooling和ROIAlign

    目标:为了使得检测网络可以输入任意size的图片,使用ROIPooling在网络中某一个阶段将不同尺度的图片ROI pooling成相同的尺度,使得fc的存在也无法写死输入图片的size。

    4.6K20发布于 2018-12-11
  • 来自专栏服务端技术杂谈

    ROI解决什么问题?

    在工作中,大家经常讨论ROI。 但,有时你会发现,ROI已经被滥用了。 有时,ROI变成了一种僵化的流程。用ROI当作挡箭牌,让不作为藏在背后,给自己的主动性差、执行力差找到了借口。 我们可以想象下,工作中什么时候大家习惯提到ROI。 其实ROI一般是用于实现某个目标的过程上。 比如目标确定了,我们要完成目标,这时才通过ROI考虑哪种实现方式最合适。 在多种方式中,我们会考虑结合自身能力、资源以达成目标成本最低的那个,那这个过程就是考虑ROI合适的那个方式。 但有些人,误将ROI当作是否树立目标的参考方式。 尽管我们知道了ROI存在于how的部分,那过度聊ROI其实也是一种偷懒的行为。 这往往是由我们对于一件事情所树立的世界观决定的。 你场均1w米,90分钟生龙活虎,没一个对抗过你,你就比他们强,如果全场11个人,都是这样的体能,总会比大部分球队强。

    78510编辑于 2023-03-22
  • 来自专栏我的知识小屋

    八、ROI泛洪填充

    一、学习目标 了解什么是ROI 了解floodFill的使用方法 如有错误欢迎指出~ 二、了解OpenCV中图像ROI的颜色填充 2.1 了解ROI是什么 ROI指的是region of Interest 以上代码读取图片后,通过选取图片区域进行ROI选择。 我们得到ROI内容后,可以对该部分的内容进行编辑,例如转为灰度图像: gray_roi = cv2.cvtColor(roi, cv2.COLOR_BGR2GRAY) cv2.imshow("gray_roi =img[200:400,280:450] cv2.imshow("roi", roi)#显示图像 gray_roi = cv2.cvtColor(roi, cv2.COLOR_BGR2GRAY) cv2 .imshow("gray_roi", gray_roi)#显示图像 gray_roi_rgb = cv2.cvtColor(gray_roi, cv2.COLOR_GRAY2BGR)#灰度图像转RGB

    1.1K10发布于 2021-01-14
  • YOLO11实战——物体检测识别

    一、前言 老周当时了解YOLO的时候是YOLO8,当时很火,但转眼间就YOLO11了。从官方给的性能图来看YOLO11大概是走到此类任务的天花板了,未来几年目标检测的任务可能不会再有很巨大的提升。 使用示例:https://docs.ultralytics.com/models/yolo11/#usage-examples # Load a COCO-pretrained YOLO11n model bus.jpg 它会在你运行命令的文件里下载bus.jpg和yolo11n.pt,还有生成runs文件夹(储存结果的文件夹) 训练结果: 可以看出公交bus训练后检测到0.94的权重是公交,效果还是挺好的 你也可以用这个模型做一些微调训练自己需要检测的数据集,希望你也能训练个误差低的模型。 当YOLO11能识别1000种物体时,我们是否该思考:机器的'视力'终将超越人类? 从医疗影像的早期病变检测,到自动驾驶的复杂路况判断,物体检测的边界正在被不断拓展。而这一切,都始于你今天点击'运行'按钮的瞬间。未来已来,你,准备好成为定义它的人了吗?

    94410编辑于 2025-12-24
  • 来自专栏深度学习和计算机视觉

    来了,使用YOLOv11目标检测教程

    YOLO11 是 Ultralytics YOLO 系列的最新版本,结合了尖端的准确性、速度和效率,用于目标检测、分割、分类、定向边界框和姿态估计。 主要特点 增强的特征提取:YOLO11 使用改进的主干和颈部架构来增强特征提取,以实现更精确的目标检测和复杂任务的性能。 跨环境的适应性:YOLO11 可以无缝部署在边缘设备、云平台和配备 NVIDIA GPU 的系统上,确保最大的灵活性。 支持广泛的任务范围:YOLO11 支持各种计算机视觉任务,如目标检测、实例分割、图像分类、姿态估计和定向目标检测(OBB)。 我将在这个数据集中训练一个有 8 种不同寄生虫类别的目标检测模型。我将通过 Roboflow 处理标记、分类的图像。我经常在我的个人项目中使用这个开源平台。

    3.9K10编辑于 2024-10-10
  • 来自专栏3D视觉从入门到精通

    遮挡重叠场景下|基于卷积神经网络与RoI方式的机器人抓取检测

    RoI进行抓取检测需要两个步骤:首先,使用RoI获得一批具有相同W×H(例如7×7)大小的RoI特征,并且所有RoI都被划分为W×H网格单元。 其次,使用抓取检测网络来检测RoI中潜在的抓取。 所有潜在的抓取都能在RoI检测到。 抓握检测网络经过训练,不仅可以输出抓取矩形,还可以确定抓取是否属于RoI。在抓取检测网络中,在RoI池和抓取检测器之间添加了三个残差块,以扩大特征图的感受野。 属于真值标定对象的抓取矩形用作匹配的RoI的真值标定抓取。 C.多目标掌握数据集 为了训练网络,我们重新标记了视觉操纵关系数据集(VMRD)[11]和grasps。 用于训练网络的GPU都是带有11GB内存的GTX1080Ti。我们网络的学习率为0.001,动量为0.9。每10个时期,学习率将增加1/10倍。 从表I中我们可以看出,我们提出的基于RoI的抓取检测RoI-GD)大大提高了检测性能。

    2.9K10发布于 2020-12-11
  • 来自专栏和蔼的张星的图像处理专栏

    11.YOLOV3训练检测拾遗。

    训练配置以及检测我在上一篇文章里已经写过了,这里主要写一下可能会遇到的一些问题及解决方案。 这里面要做的许多事情别人都已经是做过了的,我做一下总结而已。 1. 保存训练日志以及训练日志可视化。 /usr/bin/env python3 # -*- coding: utf-8 -*- """ Created on Thu Nov 29 16:23:11 2018 @author: zhxing 检测的效果还不错,比上次150张图片训练的准确率要高出不少,天空和树林背景的检测准确率已经很高,不过白色的楼做背景的话,白色的无人机要就检测出来确实比较难。看后面会不会有什么别的好办法。 IOU来看的话还是能看出来一个趋势的,IOU最后基本会稳定在0.8--1的一个水平,从视频上来看,检测框的准确性确实比较一般,不知道还有么有比较好的方法去进一步提高这个精确度,这都再说了,现在就是希望感冒赶紧好起来

    2.4K30发布于 2018-12-19
  • 来自专栏AI机器学习与深度学习算法

    OpenCV-感兴趣区域ROI

    本小节介绍的是ROI。 什么是ROIROI(region of interest),即感兴趣区域。感兴趣区域,就是分析图像所关注的焦点。 比如说,我们对一张图片进行人脸的识别,此时我们只需要关注图片中人脸的部分即可,也就是说此时人脸所在的区域就是我们所关注的焦点,也就是感兴趣的区域(ROI)。 提取图片中ROI 提取ROI图片名为"my_love.jpg": ? 此时我们感兴趣的地方为美女的脸,提取图片中人脸的部分,具体代码如下: ? 提取出来的人脸部分: ? 将图片转换为了三维数组,其实提取roi,简单来说就是获取数组中指定区域的值,由于第三个维度是通道数,我们只关注整张图片中的某一区域,因此在提取的时候不需要考虑第三个维度。 可以把我们关注的区域(ROI)提取出来,相应的也可以将ROI区域合并到原始的图像中去。为了效果明显,我们将提取出来的face进行色彩空间转换,然后将转换后的face合并到原始的图像中。 ?

    1.8K00发布于 2019-11-13
  • 领券