数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):2320 标注数量 (xml文件个数):2320 标注数量(txt文件个数):2320 标注类别数:9 标注类别名称:["abrasive-wear","broken-gears","broken-parts","corrosion micropitting-pitting-indentitation 框数 = 2091 spalling 框数 = 620 总框数:7440 使用标注工具:labelImg 标注规则:对类别进行画矩形框 重要说明:暂无 特别声明:本数据集不对训练的模型或者权重文件精度作任何保证 ,数据集只提供准确且合理标注 图片预览: 标注例子: 数据集地址:download.csdn.net/download/2403_88102872/90085013
今天给大家分享人工智能数据集,工业制造相关数据,需要的同学可以下载使用。 1、SeverStal 钢铁表面缺陷数据集 下载地址:SeverStal 钢铁表面缺陷数据集 2、MVTec 工业3D对象检测数据集 (MVTec ITODD) MVTec 工业 3D 对象检测数据集 (MVTec ITODD) 是用于 3D 对象检测和姿态估计的公共数据集,重点关注工业设置和应用。 数据集包括: 1、28 个对象和 3500 个包含这些对象实例的标记场景 2、五个传感器(两个 3D 传感器和三个灰度相机)观察每个场景 下载地址:MVTec 工业3D对象检测数据集 (MVTec ITODD 有关此数据集中考虑的测量记录的气体身份名称、浓度值 和时间分布序列的详细信息。 下载地址:工业制造_公开数据集_帕依提提-人工智能数据集服务平台
Python与算法社区 已有 446 篇原创,干货满满 三步加星标 01 02 03 三步加星标 你好,我是 zhenguo 经常有粉丝问我,手上有没有数据集,几M大小的,尽量真实点的。 今天我为你推荐10个这类小而经典的数据集。 1 covid-19 新冠肺炎已伴随2020快一年,世纪各地每日新增人数等数据,网上有公开数据集和下载API接口。 2 fashion-mnist 论经典数据集,非手写字莫属,而fashion意味着终结了老套的手写字,取而代之的是人类必需品:十类服饰小图。 ? 所以,这份数据集或许对相关爱好者有些许参考意义。 ? 9 女性创业和劳动力 Women Entrepreneurship and Labor Force ,全球女性企业家都有谁,她们影响力指数又是怎样,可以试着分析这个数据集。
在人脸识别常用的 9 大数据集(LFW, YTF, CALFW, CPLFW,CFP, AgeDB-30, MegaFace, IJB-B, IJB-C)上,该算法表现出了一致性的精度提高,虽然代码没开源 实验结果 除了使用GroupFace网络结构,作者还使用arcface loss损失函数,在 9 个常用的1:1人脸验证和1:N人脸识别数据集中的实验,均得到了显著的精度提升。 ? ? ?
数据集格式:仅仅包含jpg图片,每个类别文件夹下面存放着对应图片 图片数量(jpg文件个数):17509 分类类别数:9 类别名称:["chineseapple","lantana","negatives prickly_acacia 图片数:1062 rubber_vine 图片数:1009 siam_weed 图片数:1074 snake_weed 图片数:1016 重要说明:暂无 特别声明:本数据集不对训练的模型或者权重文件精度作任何保证 ,数据集只提供准确且合理分类存放 图片示例: 下载地址: https://download.csdn.net/download/FL1623863129/89304837
某中心发布最大规模工业“抓取和放置”机器人训练数据集为提升仓库中负责分拣、抓取和打包产品的机器人性能,某中心公开发布了在工业产品分拣场景中捕获的最大规模图像数据集。 此前最大的工业图像数据集仅包含约100个对象,而名为ARMBench的该数据集则包含了超过190,000个对象。因此,该数据集可用于训练“抓取和放置”机器人,使其能更好地适应新产品和新场景。 数据集细分与挑战物体分割数据集包含超过50,000张图像,每张图像包含1到50个手动分割的物体,平均约10.5个。 物体识别数据集包含超过235,000个标记的“抓取活动”;每个抓取活动包括一张抓取图像和三张转移图像。 缺陷检测数据集包括静态图像和视频。超过19,000张静态图像是在转移阶段捕获的,旨在训练缺陷检测模型,以判断机械臂是否意外损坏了物体或一次抓取了多个物体。
金属外表多种生锈检测数据集(1200张图片已划分)|面向工业巡检的目标检测数据集在工业设备智能运维、基础设施安全评估与城市大型金属结构全生命周期管理不断推进的背景下,金属锈蚀的自动化识别与精确定位已成为工业视觉领域的重要研究与落地方向 本文将围绕一个已完成标注与划分的金属外表生锈目标检测数据集(共1202张),系统介绍其应用背景、数据集构成、锈蚀类型定义、典型应用场景以及目标检测建模价值,为后续基于YOLOv8YOLOv9RT-DETR 本数据集正是在这一工程需求背景下构建,面向工业级金属外表锈蚀的多类别目标检测任务。 数据集核心特点✅覆盖4种工业常见锈蚀类型✅图像来源多样,包含不同材质、光照、拍摄距离✅已完成训练验证测试集严格划分✅标注精细,适合工业级模型训练与评估✅可直接用于无人机巡检、工业视觉系统开发类别定义(classes 通过构建标准化、可复用、可扩展的金属锈蚀目标检测数据集,并结合深度学习模型进行自动识别,我们可以:提前发现隐蔽风险降低人工巡检成本提升工业运维智能化水平构建真正可落地的AI工业应用系统本数据集为后续YOLO
By 超神经 内容一览:本期整理了 HyperAI超神经官网近期更新的 9 个数据集,涉及人脸识别、姿态估计、自动驾驶三个领域。 本文整理汇总了 9 个具有代表性的数据集,大家按需下载使用。 在人脸识别的训练中,训练的数据量大、质量稳定、没有「杂质」,是研究中非常好的优质数据库。 VGG-Face2 人脸识别数据集 VGG-Face2 数据集,是一个人脸图片数据集。 Comma.ai 自动驾驶视频数据集 Comma.ai 数据集是一个用于自动驾驶的视频数据集。包含共计 7.25 小时的视频,该数据集包含 10 个以 20Hz 频率记录的视频。 Talk2Car 自动驾驶数据集 Talk2Car 数据集是一个对象引用数据集,包含了用自然语言为自动驾驶汽车编写的命令,即乘客可以通过说话的形式对自动驾驶汽车下达命令。
为了适应全面丰富的NLP任务,方便更多开发者灵活插拔尝试多种网络结构,并且让应用最快速达到工业级效果,今年4月23日,百度正式开放了工业级中文NLP工具与预训练模型集——PaddleNLP(nlp.baidu.com 工具集拥有当前业内效果最好的中⽂语义表示模型和基于用户大数据训练的应用任务模型,模型源于产业实践,达到工业级的应用效果。 PaddlePaddle 是中国首个、也是目前国内唯一开源开放,集核心框架、工具组件和服务平台为一体的端到端开源深度学习平台,其囊括支持面向真实场景应用、达到工业级应用效果的模型,并具备针对大规模数据场景的分布式训练能力 与此同时,百度还开放了在对话等任务的开放数据集上超越SOTA效果的模型网络结构与参数,方便相关领域研究人员快速验证、使用。 除了开放预训练模型,PaddleNLP还开放了相关任务的评测数据集。这些数据来自于百度真实的工业化场景,能够很好地对模型效果进行评估。
在本文中,我们将展示如何在自定义数据集上训练 YOLOv9 模型。我们将通过一个训练视觉模型来识别球场上的足球运动员。话虽如此,您可以使用在本文中使用所需的任何数据集。 如何训练一个YOLOv9模型 您可以使用YOLOv9项目目录中的train.py文件来训练YOLOv9模型。 步骤#1:下载数据集 要开始训练模型,您需要一个数据集。 在本文中,我们将使用足球运动员的数据集。由此产生的模型将能够识别球场上的足球运动员。 如果你没有数据集,请查看Roboflow Universe,这是一个公开共享了20多万个计算机视觉数据集的社区。 此代码下载YOLOv7格式的数据集,该数据集与YOLOv9模型兼容。 您可以将任何以YOLOv7格式格式化的数据集与本指南一起使用。 在您的Roboflow帐户中创建一个新项目,然后上传您的数据集。单击侧边栏中的“生成”以生成数据集版本。准备好数据集版本后,您可以上传模型权重。
下载数据集请登录爱数科(www.idatascience.cn) 由电商平台爬取的图书信息,包括书名、出版信息、当前价格等。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 当当网搜索页面爬取。
下载数据集请登录爱数科(www.idatascience.cn) 其记录了2014年之前天文学家在恒星(除了太阳)周围发现的行星的信息。 1. 字段描述 2. 数据预览 3. 数据来源 来源于UCI机器学习库。
下载数据集请登录爱数科(www.idatascience.cn) 该数据集记录了一家全球超市4年的订购数据,包含订单的订单号、下单时间、发货时间、运输模式、顾客名称和地区等信息。 1. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
下载数据集请登录爱数科(www.idatascience.cn) 通过物理测量预测鲍鱼的年龄。 从原始数据中删除了缺失值的样本,并且对连续值的范围进行了缩放。数据集共4177个样本,8个字段 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 Warwick J Nash, Tracy L Sellers, Simon R Talbot, Andrew J Cawthorn and Wes B Ford (1994) "The Population 数据引用 Nash W J, Sellers T L, Talbot S R, et al.
焊接情况检测数据集(千张图片已划分)|面向工业质检的目标检测训练集在现代工业制造体系中,焊接质量作为产品可靠性的重要指标之一,直接影响结构件的力学性能、安全性和使用寿命。 数据集下载链接:https://pan.baidu.com/s/1gzAuAJ1-Qb-1s3TEGIC9Uw? 总结来看,本次分享的焊接情况检测数据集为工业智能化提供了坚实的基础。 通过合理划分训练集、验证集和测试集,开发者可以充分利用数据进行模型优化与验证,从而在实际工业生产环境中实现对焊接表面缺陷的自动检测与监控。 总之,这份数据集是工业AI应用中不可或缺的资源,为焊接检测技术的研究与实践提供了坚实的数据基础。
下载数据集请登录爱数科(www.idatascience.cn) 小费数据集 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源
下载数据集请登录爱数科(www.idatascience.cn) 数据集由 Jose Portilla 和 Pierian Data 为他的 Udemy 课程(Python 数据科学和机器学习训练营) 创建,适合用于数据分析与逻辑回归预测。 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
大数据文摘出品 编译:张驰、倪倪 随着工业4.0的到来,新数字工业技术的兴起将带来制造业的巨大转变。 通过机器来收集和分析数据,以更低的成本通过更快速、更灵活、更高效的流程,生产出更高质量的商品,这在工业4.0时代都成为了可能。 —Olivier Scalabre,资深合伙人和常务董事 9大技术转变工业生产 先进的数字技术早已在制造业中得以使用,但是随着工业4.0时代的到来,它将转变工业生产。 9大技术趋势奠定了工业4.0的基石。 大数据和分析能力 在工业4.0的环境中,对一些不同来源的数据(生产设备和系统以及企业和顾客管理系统)的收集以及综合评估将标准化,用以支持实时决策。 水平和垂直系统集成 随着工业4.0到来,公司、部门、职能和能力将变得更加紧密,因为跨公司的通用数据集成网络不断发展并能够真正实现自动化价值链。
【新智元导读】继前天发布800万视频数据集之后,今天,谷歌又发布了图片数据库Open Images,包含了900万标注数据,标签种类超过6000种。 今天, 我们发布了Open Images——一个包含了900万图像URL的数据集,值得一提的是,这些图像全部都是标签数据,标签种类超过6000种。 我们尽量让数据集变得实用:数据集中所使用的标签类型比拥有1000个分类的ImageNet数据集更加贴近实际生活。对于想要从零开始训练一个深度神经网络的人来说,这些图片数据远远足够了。 这一数据集是谷歌、CMU和康奈尔大学联合研究的成果,现在,已经有大量基于Open Images 数据集的论文。 一些关键数据: ? ? ? 900万图片数据集下载:https://github.com/openimages/dataset
下载数据集请登录爱数科(www.idatascience.cn) 这个数据集涵盖了过去6年苹果公司的股价。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。