搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏AI科技评论
DRN - 扩张残留网络（图像分类和语义分割）
2016年ICML发布了用于语义分割的DilatedNet后，作者提出了DRN，不仅可以提高语义分割效果，还可以提高图像分类效果，而不增加模型的深度和复杂度。文章发表于2017年，被引用超过100次。定位对于图像分类任务，最后是一个全局平均池化，然后是1×1卷积层和softmax层。要将模型用于定位，只需删除平均池化。不涉及任何训练或参数调优。准确的分类DRN可以直接用于定位。 5. ImageNet图像分类 ImageNet验证集的Top-1和Top-5错误率 DRN-A-18和DRN-A-34的1-crop top-1准确率分别比ResNet-18和ResNet-34高2.43 在ImageNet的验证集上的分类错误率和模型参数的个数在ImageNet的验证集上的分类错误率和模型参数的个数所有的DRN都可以在参数较少(模型较小)的情况下获得较低的错误率。提高了图像分类精度，最终DRN性能优于最先进的ResNet。
1.8K20发布于 2019-08-21
来自专栏AI研习社
在玩图像分类和图像分割？来挑战基于 TensorFlow 的图像注解生成！
玩过图像分类的开发者不少，许多人或许对图像分割（image segmentation）也不陌生，但图像注解（image caption）的难度，无疑比前两者更进一步。注解生成——作为图像分类的延伸作为一个历史悠久的 CV 任务，图像分类背后有许多强大模型。图像分类能把图像中相关联的形状、物体的视觉信息拼凑到一起，把图像放入物体类别中。针对其他 CV 任务的机器学习模型，建立在图像分类的基础之上，比如物体识别和图像分割。它们不仅能对提供的信息进行识别，还能学习如何解读 2D 空间，调和两种理解，并决定图像中物体信息的位置分布。在我们的例子中，VGG-16 图像分类模型导入 224x224 分辨率的图像，生成对分类图像非常有用的 4,096 维特征矢量。它用 MS COCO 数据集和 Inception-v3 图像嵌入训练。
1.3K40发布于 2018-03-28
来自专栏AI科技评论
开发 | 在玩图像分类和图像分割？来挑战基于 TensorFlow 的图像注解生成！
玩过图像分类的开发者不少，许多人或许对图像分割（image segmentation）也不陌生，但图像注解（image caption）的难度，无疑比前两者更进一步。注解生成——作为图像分类的延伸作为一个历史悠久的 CV 任务，图像分类背后有许多强大模型。图像分类能把图像中相关联的形状、物体的视觉信息拼凑到一起，把图像放入物体类别中。针对其他 CV 任务的机器学习模型，建立在图像分类的基础之上，比如物体识别和图像分割。它们不仅能对提供的信息进行识别，还能学习如何解读 2D 空间，调和两种理解，并决定图像中物体信息的位置分布。在我们的例子中，VGG-16 图像分类模型导入 224x224 分辨率的图像，生成对分类图像非常有用的 4,096 维特征矢量。它用 MS COCO 数据集和 Inception-v3 图像嵌入训练。
1.2K60发布于 2018-03-12
来自专栏机器学习AI算法工程
图像分类、检测，语义分割等方法梳理
本文旨在介绍深度学习在计算机视觉领域四大基本任务中的应用，包括分类(图a)、定位、检测(图b)、语义分割(图c)、和实例分割(图d)。 ? 图像分类(image classification) 给定一张输入图像，图像分类任务旨在判断该图像所属类别。 (1) 图像分类常用数据集以下是几种常用分类数据集，难度依次递增。一个分支用于做图像分类，即全连接+softmax判断目标类别，和单纯图像分类区别在于这里还另外需要一个“背景”类。有83k训练图像，41k验证图像，80k测试图像，80个类别。 (2) 语义分割基本思路基本思路逐像素进行图像分类。 Mask R-CNN 用FPN进行目标检测，并通过添加额外分支进行语义分割(额外分割分支和原检测分支不共享参数)，即Master R-CNN有三个输出分支(分类、坐标回归、和分割)。
87610发布于 2019-10-28
来自专栏AI算法与图像处理
想学图像分割，强烈建议从这5篇图像分割算法综述
橙色，绿色和黄色块分别表示语义，实例和全景分割算法。 ? DeepLabV3在样本图像上的分割结果。 ? U-net模型。蓝色框表示具有其指定形状的要素地图块。 ? DeepLabv3 +模型。 ? 语义图像分割是计算机视觉中增长最快的领域之一，具有多种应用程序。在许多领域，例如机器人技术和自动驾驶汽车，语义图像分割至关重要，因为语义分割为基于像素级别的场景理解提供了采取动作所需的必要上下文。最受欢迎的用于语义分割的UDA策略的维恩图。每种方法都属于代表使用的自适应技术的集合。 ? 从分类（稀疏任务）到语义分割（密集任务）的一些样本图像上一些可能的视觉任务的概述。 ? 目标检测或定位是从粗略到精细的数字图像推断的增量步骤。它不仅提供图像对象的类别，而且还提供已分类图像对象的位置。该位置以边界框或质心的形式给出。本文为那些希望在实例分割领域进行研究的人提供了宝贵的信息。对象识别的演变：从粗略推断到细粒度推断：（a）图像分类，（b）对象检测或定位，（c）实例分割，（d）语义分割。 ?
3.7K20发布于 2021-02-05
来自专栏机器学习AI算法工程
如何用TensorFlow和TF-Slim实现图像标注、分类与分割
笔者将和大家分享一个结合了TensorFlow和slim库的小应用，来实现图像分类、图像标注以及图像分割的任务，围绕着slim展开，包括其理论知识和应用场景。 CUDA_VISIBLE_DEVICES"] = '0' sys.path.append("/home/dpakhom1/workspace/models/slim") 接着，下载VGG-16模型，我们将用它来对图像做分类和分割在本文中，我们就用这个预训练的模型来给图片分类、标注和分割，映射到这1000个类别。下面是一个图像分类的例子。图像首先要做预处理，经过缩放和裁剪，输入的图像尺寸与训练集的图片尺寸相同。所以，当网络只能观察到校车的一部分图片时，与出租车和皮卡车混淆了。正如我们在上面所看到的，我们得到了图片的一个简单分割结果。它不算很精确，因为最初训练网络是用来进实现分类任务，而不是图像分割。这样，我们给分类和分割的结果增加了空间信息。小结本文介绍了用slim库实现图像的分类和分割，并且简要阐述了技术原理。
1.6K40发布于 2018-03-15
来自专栏新智元
【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理
作者：张皓【新智元导读】本文作者来自南京大学计算机系机器学习与数据挖掘所（LAMDA），本文直观系统地梳理了深度学习在计算机视觉领域四大基本任务中的应用，包括图像分类、定位、检测、语义分割和实例分割。本文旨在介绍深度学习在计算机视觉领域四大基本任务中的应用，包括分类(图a)、定位、检测(图b)、语义分割(图c)、和实例分割(图d)。 ? 一个分支用于做图像分类，即全连接+softmax判断目标类别，和单纯图像分类区别在于这里还另外需要一个“背景”类。有83k训练图像，41k验证图像，80k测试图像，80个类别。 (2) 语义分割基本思路基本思路逐像素进行图像分类。 Mask R-CNN 用FPN进行目标检测，并通过添加额外分支进行语义分割(额外分割分支和原检测分支不共享参数)，即Master R-CNN有三个输出分支(分类、坐标回归、和分割)。
2.6K61发布于 2018-03-20
来自专栏PPV课数据科学社区
【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理
【导读】本文作者来自南京大学计算机系机器学习与数据挖掘所（LAMDA），本文直观系统地梳理了深度学习在计算机视觉领域四大基本任务中的应用，包括图像分类、定位、检测、语义分割和实例分割。本文旨在介绍深度学习在计算机视觉领域四大基本任务中的应用，包括分类(图a)、定位、检测(图b)、语义分割(图c)、和实例分割(图d)。一个分支用于做图像分类，即全连接+softmax判断目标类别，和单纯图像分类区别在于这里还另外需要一个“背景”类。有83k训练图像，41k验证图像，80k测试图像，80个类别。 (2) 语义分割基本思路基本思路逐像素进行图像分类。 Mask R-CNN 用FPN进行目标检测，并通过添加额外分支进行语义分割(额外分割分支和原检测分支不共享参数)，即Master R-CNN有三个输出分支(分类、坐标回归、和分割)。
1.6K80发布于 2018-04-24
来自专栏书山有路勤为径
特征类型和图像分割
形态学操作—膨胀与腐蚀图像分割（Image Segmentation）熟悉了一些简单的特征类型，如何通过使用这些特征将图像的不同部分组合在一起。将图像分组或分割成不同的部分称为图像分割。图像分割的最简单情况是背景减法。在视频和其他应用中，通常情况是人必须与静态或移动背景隔离，因此我们必须使用分割方法来区分这些区域。图像分割还用于各种复杂的识别任务，例如在对道路图像中的每个像素进行分类时。而要进行图像分割，要的只是那些完整的闭合边界，因为这类边界能切实标识出特定的图像区域和物体，图像描廓就可以实现这一点。 ? ，请选择要包含的图像的正确宽度和高度。
1.4K30发布于 2018-08-29
来自专栏AIoT技术交流、分享
5行Python代码实现图像分割
目录 1、环境部署 2、语义分割 3、即时分割 ---- 众所周知图像是由若干有意义的像素组成的，图像分割作为计算机视觉的基础，对具有现有目标和较精确边界的图像进行分割，实现在图像像素级别上的分类任务。图像分割可分为语义分割和实例分割两类，区别如下：语义分割：将图像中每个像素赋予一个类别标签，用不同的颜色来表示；实例分割：无需对每个像素进行标记，只需要找到感兴趣物体的边缘轮廓。
77620发布于 2021-01-20
来自专栏往期博文
【图像分类】YOLOv5-6.2全新版本：支持图像分类
前言众所周知，YOLOv5是一款优秀的目标检测模型，但实际上，它也支持图像分类。在6.1版本中，就暗留了classify这个参数，可以在做检测的同时进行分类。官方仓库地址：https://github.com/ultralytics/yolov5/releases 更新概览在几天前刚新出的6.2版本中，直接将分类功能单独剥离开来，使其能够直接训练图像分类数据集 Deci.ai优化在Deci上单击一次即可自动编译和量化YOLOv5，从而获得更好的性能 GPU导出基准可以使用python utils/benchmarks.py --weights yolov5s.pt 工程结构首先看新版本的工程结构，和前几个版本差别不大。主要是多了一个classify文件夹，包含图像分类训练，验证，检测三个函数。训练结果会保存在runs/train-cls文件夹中。模型预测模型预测更简单，指定训练好的权重weights，输入图像source，图像尺寸imgsz即可。模型会从高到低输出前5个类别的概率值。
2.5K30编辑于 2022-09-23
来自专栏深度学习与数据挖掘实战
【今日热门&优质资源】TensorFlow和TF-Slim实现图像分类与分割
【如何用TensorFlow和TF-Slim实现图像分类与分割】链接：http://warmspringwinds.github.io/tensorflow/tf-slim/2016/10/30/image-classification-and-segmentation-using-tensorflow-and-tf-slim
53830发布于 2018-11-21
来自专栏有三AI
【图像分割应用】医学图像分割（三）——肿瘤分割
这是专栏《图像分割应用》的第3篇文章，本专栏主要介绍图像分割在各个领域的应用、难点、技术要求等常见问题。肿瘤的分割是医学图像分析领域的一个重要内容，相比较前面提到过的脑区域分割和心脏分割，肿瘤分割任务由于个体间形状、纹理等差异大，从而实现更加困难。本文就来分析一下，肿瘤分割任务。 (1) 基于阈值的分割方法基于阈值的分割方法是图像分割中最简单、高效的方法，也是最基础的方法之一。这种方法通过对图像内设置全局或局部阈值，实现灰度图像的二值化，从而实现前背景分割，即目标区域分割。我们常见的分割结构（如编解码结构）就可以理解为：首先学习一个特征映射函数，将原始图像映射到高维特征空间；随后学习一个度量函数，用来增加不同类别像素点之间的距离并对相同类别的像素点聚类；最后，通过损失函数指导应设函数和度量的权重更新下期我们对医学图像分割问题做一个总结，之后开启《图像分割应用》专栏的第二部分。
4.4K32发布于 2019-07-23
来自专栏有三AI
【图像分割应用】医学图像分割（二）——心脏分割
这是专栏《图像分割应用》的第2篇文章，本专栏主要介绍图像分割在各个领域的应用、难点、技术要求等常见问题。相比较脑区域分割，医学图像中的心脏分割问题要更复杂，因为心脏是一个不停运作的器官，其形状也会在运动过程中发生变化。本文我们就来看看医学图像分割之心脏分割。以右心室为例，其存在的难点有：在腔内存在与心肌相似的信号强度右心室新月形形状复杂，从基部到顶点一直变化分割顶点图像的切片十分困难患者的心室内形态和信号强度差异大，且可能有病理改变简单来讲，左心室是一个厚壁的圆柱形区域数据库的困难对基于深度学习的医学图像分割方法而言，数据库的获取是最主要的困难。总结本文简要介绍了医学图像分割应用领域内的心脏分割，包括心室分割和全心脏分割。在进行任务分析和难点解读后，给出了几个应用范例。下期我们一起来看一下医学领域分割的最后一个子方向：肿瘤分割。
4.2K30发布于 2019-07-23
来自专栏有三AI
【图像分割应用】医学图像分割（一）——脑区域分割
与日常生活中常见场景的分割任务不同，医学图像（如MRI图像）由于图像获取设备的影响，会出现对比度低、信噪比低、光强低等问题；且器官本身存在运动和形变（如心脏），个体之间也有差异。这些因素导致了医学图像分割的难度和其自身的算法设计特点。 ? 大脑区域及形状个体差异示意图下面我们以脑区域分割为例，讨论一下该任务的难点，并通过一个应用实例来进一步理解医学图像中的脑区域分割问题。显然，扫描时间越长（空间分辨率越高）对分割效果的帮助越大，但是这种操作需要考虑到病人暴露在放射下的时间和对病人的影响。 3. 最开始，通过迭代更新成员函数和聚类中心实现目标函数最小化的Fuzzy C-Means（FCM）算法表现不错，对于医疗图像中的噪声图像也可以顺利应对。脑组织提取结果从模型角度来看，给定脑部切片，可以通过将FCM与马尔科夫随机场（MRF）结合的方法提升分割精度。其中，FCM善于分析和利用图像中的亮度信息，而MRF则可以建模图像中的空间和上下文关系。
3.9K21发布于 2019-07-28
来自专栏机器学习、深度学习
图像分割
我们首先使用VGG-16卷积提取卷积特征，对一个采样的像素点，从多个卷积特征图上提取对应的特征，建立 hypercolumn descriptor，然后将该特征输入到一个MLP多层感知器，最后输入分类结果我们发现从训练图像中采样很少的像素就可以得到很好的结果。 ?
1K50发布于 2019-05-26
来自专栏有三AI
【图像分割应用】医学图像分割小总结
本专栏的第一个板块医学图像分割中从具体应用出发，介绍了脑分割、心脏分割和肿瘤分割三个问题，本文就总结一下现阶段医学图像分割中该知道的内容。本文我们就一起来看一下医学图像分割中的难点、基本概念和state-of-the-art方法，并给出参考的方法和代码。 ? 为了实现相对准确的分割，其中一个重要操作是背景体元移除，并结合空间信息实现脑部分割。完成脑部分割以后，就可以对分割出来的图像做进一步的分割和分析操作，从而判断病灶并提出解决方案。 ? 此领域比较常用的图像类型为CT图像和MRI图像（核磁共振图像），并在此基础上分割左心室、识别心脏钙化程度。 ? 》专栏的第一板块：医学图像分割，并给出了可供参考的方法和未来的研究方向。
2.8K31发布于 2019-07-23
来自专栏AI科技大本营的专栏
详解计算机视觉五大技术：图像分类、对象检测、目标跟踪、语义分割和实例分割
▌4、语义分割计算机视觉的核心是分割，它将整个图像分成一个个像素组，然后对其进行标记和分类。特别地，语义分割试图在语义上理解图像中每个像素的角色（比如，识别它是汽车、摩托车还是其他的类别）。这种方法允许针对任何尺寸的图像生成分割映射，并且比块分类算法快得多，几乎后续所有的语义分割算法都采用了这种范式。但是，这也仍然存在一个问题：在原始图像分辨率上进行卷积运算非常昂贵。 ▌5 、实例分割除了语义分割之外，实例分割将不同类型的实例进行分类，比如用 5 种不同颜色来标记 5 辆汽车。分类任务通常来说就是识别出包含单个对象的图像是什么，但在分割实例时，我们需要执行更复杂的任务。一旦生成这些掩码， Mask R-CNN 将 RoIAlign 与来自 Faster R-CNN 的分类和边界框相结合，以便进行精确的分割： ▌结语上述这 5 种主要的计算机视觉技术可以协助计算机从单个或一系列图像中提取
13.6K73发布于 2018-04-26
来自专栏机器学习算法与Python学习
详解计算机视觉五大技术：图像分类、对象检测、目标跟踪、语义分割和实例分割
在本文中，我将分享 5 种主要的计算机视觉技术，并介绍几种基于计算机视觉技术的深度学习模型与应用。 ▌1 、图像分类 ? ▌4、语义分割 ? 计算机视觉的核心是分割，它将整个图像分成一个个像素组，然后对其进行标记和分类。特别地，语义分割试图在语义上理解图像中每个像素的角色（比如，识别它是汽车、摩托车还是其他的类别）。目前的语义分割研究都依赖于完全卷积网络，如空洞卷积 ( Dilated Convolutions ），DeepLab 和 RefineNet 。 ▌5 、实例分割 ? 除了语义分割之外，实例分割将不同类型的实例进行分类，比如用 5 种不同颜色来标记 5 辆汽车。分类任务通常来说就是识别出包含单个对象的图像是什么，但在分割实例时，我们需要执行更复杂的任务。 ▌结语上述这 5 种主要的计算机视觉技术可以协助计算机从单个或一系列图像中提取、分析和理解有用的信息。
2.2K22发布于 2019-07-04
来自专栏全栈程序员必看
图像分割的评价指标_图像实例分割
大家好，又见面了，我是你们的朋友全栈图像分割可分为：语义分割，实例分割，全景分割 1、语义分割（semantic segmentation）：标注方法通常是给每个像素加上标签；常用来识别天空、草地 3、全景分割（Panoptic Segmentation）：结合前面两者，生成统一的、全局的分割图像，既识别事物，也识别物体。图像分割评价指标： 1、IoU: 交并比，两个区域重叠的部分除以两个区域的集合部分， IOU算出的值score ＞ 0.5 就可以被认为一个不错的结果了 2、mIoU（mean IoU）：均交并比，识别或者分割图像一般都有好几个类别，把每个分类得出的分数进行平均一下就可以得到mean IoU，也就是mIoU。人类全景分割的表现（PQ,SQ,RQ） IoU(p,g)是预测的分割p和GroundTruth g的交并比, TP是指IoU>0.5的分割结果，FP (False Positives)，和FN (False
3.2K31编辑于 2022-09-23

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

DRN - 扩张残留网络（图像分类和语义分割）

在玩图像分类和图像分割？来挑战基于 TensorFlow 的图像注解生成！

开发 | 在玩图像分类和图像分割？来挑战基于 TensorFlow 的图像注解生成！

图像分类、检测，语义分割等方法梳理

想学图像分割，强烈建议从这5篇图像分割算法综述

如何用TensorFlow和TF-Slim实现图像标注、分类与分割

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

特征类型和图像分割

5行Python代码实现图像分割

【图像分类】YOLOv5-6.2全新版本：支持图像分类

【今日热门&优质资源】TensorFlow和TF-Slim实现图像分类与分割

【图像分割应用】医学图像分割（三）——肿瘤分割

【图像分割应用】医学图像分割（二）——心脏分割

【图像分割应用】医学图像分割（一）——脑区域分割

图像分割

【图像分割应用】医学图像分割小总结

详解计算机视觉五大技术：图像分类、对象检测、目标跟踪、语义分割和实例分割

详解计算机视觉五大技术：图像分类、对象检测、目标跟踪、语义分割和实例分割

图像分割的评价指标_图像实例分割

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐