今天给大家分享人工智能数据集,工业制造相关数据,需要的同学可以下载使用。 1、SeverStal 钢铁表面缺陷数据集 下载地址:SeverStal 钢铁表面缺陷数据集 2、MVTec 工业3D对象检测数据集 (MVTec ITODD) MVTec 工业 3D 对象检测数据集 (MVTec ITODD) 是用于 3D 对象检测和姿态估计的公共数据集,重点关注工业设置和应用。 数据集包括: 1、28 个对象和 3500 个包含这些对象实例的标记场景 2、五个传感器(两个 3D 传感器和三个灰度相机)观察每个场景 下载地址:MVTec 工业3D对象检测数据集 (MVTec ITODD 有关此数据集中考虑的测量记录的气体身份名称、浓度值 和时间分布序列的详细信息。 下载地址:工业制造_公开数据集_帕依提提-人工智能数据集服务平台
数据集有增强,大于1/3是原图剩余为增强图片。 注意数据图片都是近距离拍摄 数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数 ):1445 标注数量(xml文件个数):1445 标注数量(txt文件个数):1445 标注类别数:7 标注类别名称(注意yolo格式类别顺序不和这个对应,而以labels文件夹classes.txt
本小节使用更大更正规的手写识别数据集MNIST数据集,使用sklearn导入MNIST数据集并使用kNN算法对MNIST数据集进行分类。 原始数据集。 /master/lab7/mldata/mnist-original.mat 百度网盘:https://pan.baidu.com/s/1PcEsFps6NHBRWVxBMl7SmQ 提取码:pz8t DESCR字段给出了下载数据集的网站"mldata.org",如果有兴趣可以访问这个网站,看看其他的数据集。 按照正常的机器学习流程,得到数据集之后需要使用train_test_split方法对其进行划分,划分一定比例的训练集以及测试集,但是对于MNIST数据集而言,已经帮我们划分好的训练集和测试集,我们只需要对
在深度学习中,数据是模型训练的基石。高质量的数据处理和准备是模型成功的关键。无论是使用经典的数据集(如 MNIST、CIFAR-10),还是处理自定义数据集,都需要掌握数据加载、预处理和增强的技巧。 本节将介绍如何加载常用的数据集。在 PaddlePaddle 中,加载内置数据集非常简单。 使用 paddle.vision.datasets 模块加载内置数据集paddle.vision.datasets 模块提供了多个经典数据集的接口,例如:MNIST:手写数字数据集。 CIFAR10:10 类物体的彩色图像数据集。CIFAR100:100 类物体的彩色图像数据集。FashionMNIST:时尚物品图像数据集。 这些数据集可以通过简单的几行代码加载,并且支持自动下载和数据预处理。
某中心发布最大规模工业“抓取和放置”机器人训练数据集为提升仓库中负责分拣、抓取和打包产品的机器人性能,某中心公开发布了在工业产品分拣场景中捕获的最大规模图像数据集。 此前最大的工业图像数据集仅包含约100个对象,而名为ARMBench的该数据集则包含了超过190,000个对象。因此,该数据集可用于训练“抓取和放置”机器人,使其能更好地适应新产品和新场景。 数据集细分与挑战物体分割数据集包含超过50,000张图像,每张图像包含1到50个手动分割的物体,平均约10.5个。 物体识别数据集包含超过235,000个标记的“抓取活动”;每个抓取活动包括一张抓取图像和三张转移图像。 缺陷检测数据集包括静态图像和视频。超过19,000张静态图像是在转移阶段捕获的,旨在训练缺陷检测模型,以判断机械臂是否意外损坏了物体或一次抓取了多个物体。
Landsat7_C2_SR数据集是经大气校正后的地表反射率数据,属于Collection2的二级数据产品,空间分辨率为30米,基于Landsat生态系统扰动自适应处理系统(LEDAPS)(版本3.4.0 2003年6月以来,因扫描线校正器(SLC)故障导致传输数据存在间隙问题 Landsat7_C2_SR数据集是Landsat7卫星的一种数据产品,提供每个卫星场景的反射率值。 这个数据集使用了Landsat生态系统干扰自适应处理系统(LEDAPS),对大气效应进行了校正,并考虑了地形变化。这使得对地表特性和时间变化进行更准确的分析成为可能。 这个数据集可以从美国地质调查局的Earth Explorer网站免费下载。 key为LANDSAT_7/02/T1/SR的Landsat7_C2_SR类数据集 * @Name : Landsat7_C2_SR_T1数据集 */ //指定检索数据集,可设置检索的空间和时间范围
金属外表多种生锈检测数据集(1200张图片已划分)|面向工业巡检的目标检测数据集在工业设备智能运维、基础设施安全评估与城市大型金属结构全生命周期管理不断推进的背景下,金属锈蚀的自动化识别与精确定位已成为工业视觉领域的重要研究与落地方向 本数据集正是在这一工程需求背景下构建,面向工业级金属外表锈蚀的多类别目标检测任务。 数据集核心特点✅覆盖4种工业常见锈蚀类型✅图像来源多样,包含不同材质、光照、拍摄距离✅已完成训练验证测试集严格划分✅标注精细,适合工业级模型训练与评估✅可直接用于无人机巡检、工业视觉系统开发类别定义(classes )✅RT-DETR(高精度需求场景)✅FasterR-CNN(离线精细分析)该数据集非常适合作为:工业目标检测入门实战YOLO工程化项目案例无人机视觉巡检系统训练数据六、结语金属锈蚀并非简单的“表面问题 通过构建标准化、可复用、可扩展的金属锈蚀目标检测数据集,并结合深度学习模型进行自动识别,我们可以:提前发现隐蔽风险降低人工巡检成本提升工业运维智能化水平构建真正可落地的AI工业应用系统本数据集为后续YOLO
为了适应全面丰富的NLP任务,方便更多开发者灵活插拔尝试多种网络结构,并且让应用最快速达到工业级效果,今年4月23日,百度正式开放了工业级中文NLP工具与预训练模型集——PaddleNLP(nlp.baidu.com 工具集拥有当前业内效果最好的中⽂语义表示模型和基于用户大数据训练的应用任务模型,模型源于产业实践,达到工业级的应用效果。 PaddlePaddle 是中国首个、也是目前国内唯一开源开放,集核心框架、工具组件和服务平台为一体的端到端开源深度学习平台,其囊括支持面向真实场景应用、达到工业级应用效果的模型,并具备针对大规模数据场景的分布式训练能力 与此同时,百度还开放了在对话等任务的开放数据集上超越SOTA效果的模型网络结构与参数,方便相关领域研究人员快速验证、使用。 除了开放预训练模型,PaddleNLP还开放了相关任务的评测数据集。这些数据来自于百度真实的工业化场景,能够很好地对模型效果进行评估。
下载数据集请登录爱数科(www.idatascience.cn) 由电商平台爬取的图书信息,包括书名、出版信息、当前价格等。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 当当网搜索页面爬取。
下载数据集请登录爱数科(www.idatascience.cn) 其记录了2014年之前天文学家在恒星(除了太阳)周围发现的行星的信息。 1. 字段描述 2. 数据预览 3. 数据来源 来源于UCI机器学习库。
下载数据集请登录爱数科(www.idatascience.cn) 该数据集记录了一家全球超市4年的订购数据,包含订单的订单号、下单时间、发货时间、运输模式、顾客名称和地区等信息。 1. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
下载数据集请登录爱数科(www.idatascience.cn) 通过物理测量预测鲍鱼的年龄。 从原始数据中删除了缺失值的样本,并且对连续值的范围进行了缩放。数据集共4177个样本,8个字段 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 Warwick J Nash, Tracy L Sellers, Simon R Talbot, Andrew J Cawthorn and Wes B Ford (1994) "The Population 数据引用 Nash W J, Sellers T L, Talbot S R, et al.
焊接情况检测数据集(千张图片已划分)|面向工业质检的目标检测训练集在现代工业制造体系中,焊接质量作为产品可靠性的重要指标之一,直接影响结构件的力学性能、安全性和使用寿命。 随着工业视觉和深度学习的发展,利用AI模型自动检测焊缝质量逐渐成为行业趋势。而高质量的焊接检测数据集,正是训练这类模型的核心基础。 总结来看,本次分享的焊接情况检测数据集为工业智能化提供了坚实的基础。 通过合理划分训练集、验证集和测试集,开发者可以充分利用数据进行模型优化与验证,从而在实际工业生产环境中实现对焊接表面缺陷的自动检测与监控。 总之,这份数据集是工业AI应用中不可或缺的资源,为焊接检测技术的研究与实践提供了坚实的数据基础。
车间以西门子S7-1200 PLC作为核心控制器(支持Profinet协议),负责产线节拍控制、设备联动及异常响应;同时部署TCP/IP协议工业摄像头,分布在螺栓拧紧、外观检测、尺寸测量等关键工位,支持 然而,异构协议导致三大通讯难题:数据交互壁垒:S7-1200的Profinet协议无法直接调用摄像头的画面采集、录像控制等功能,产线异常时需人工切换监控界面查看,关键工序漏检风险高;控制逻辑割裂:PLC 二、技术方案与系统部署(一)硬件架构与网络拓扑部署捷米特 JM-PN-TCP/IP 网关,搭建三层通讯网络:Profinet侧:网关作为 Profinet 从站接入 S7-1200 的 X1 端口,通过 (二)捷米特 JM-PN-TCP/IP 网关优势多协议深度兼容:支持 Profinet、ONVIF、RTSP 等协议,适配市面主流工业摄像头品牌;工业级高可靠性:具备 IP65 防护、宽温运行能力,MTBF 未来结合 AI 边缘计算技术,捷米特工业网关可进一步实现实时缺陷识别、云端数据协同分析等功能,助力企业打造智能化、可视化的工业生产体系。
下载数据集请登录爱数科(www.idatascience.cn) 小费数据集 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源
下载数据集请登录爱数科(www.idatascience.cn) 数据集由 Jose Portilla 和 Pierian Data 为他的 Udemy 课程(Python 数据科学和机器学习训练营) 创建,适合用于数据分析与逻辑回归预测。 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
7 开发集和测试集应该多大? 开发集应该足够大,大到可以检测出不同算法之间的差异。比如:如果分类器A的精度为90.0%,分类器B精度为90.1%。 如果你的开发集只有100条,那么你可能检测不出这0.1%的差异,与其它机器学习的问题相比,100条数据很小,常见的开发集数据规模在1000到10000条之间。数据量越高,模型之间的差异越明显。 在这种情况下,开发集的数据量可能远远超过10000条,只为了对算法进行改进。 测试集要多大?它也应该足够大,大到你有一个很高自信度去对系统的整体性能进行评估。这里有一个方法:将30%的数据用于测试。 在你拥有一个中等(100到10000个样本)数据量的情况下,它的效果不错。 但是在大数据的时代下,我们面对的机器学习问题数据量可能会超过10亿条样本,开发集与测试集之间的比例一直在减小,但是开发与测试集的绝对数量在增加。在给开发集和数据集分配时,没必要过多的进行分配。
数据集类型:图像分类用,不可用于目标检测无标注文件 数据集格式:仅仅包含jpg图片,每个类别文件夹下面存放着对应图片 图片数量(jpg文件个数):6749 分类类别数:7 类别名称:["Unlabeled brown_blight 图片数:980 gray_blight 图片数:1000 healthy 图片数:1074 helopeltis 图片数:1000 red_spot 图片数:1143 重要说明:数据集里面茶叶均为单叶 ,请仔细查看图片预览,斟酌下载 特别声明:本数据集不对训练的模型或者权重文件精度作任何保证,数据集只提供准确且合理分类存放 图片预览: 下载地址: https://download.csdn.net
数据集类型:图像分类用,不可用于目标检测无标注文件 数据集格式:仅仅包含jpg图片,每个类别文件夹下面存放着对应图片 图片数量(jpg文件个数):889 分类类别数:7 类别名称:["baibanbing hongtizheng 图片数:160 huangsaizheng 图片数:97 重要说明:主要对虾是否生病进行分类判断,主要有黄鳃症、红体症、黑鳃症、黑斑病、肝萎缩、白浊病、白斑病 特别声明:本数据集不对训练的模型或者权重文件精度作任何保证 ,数据集只提供准确且合理分类存放 虾的图片示例(虾的具体学名叫不出来,就叫对虾吧): 下载地址: https://download.csdn.net/download/FL1623863129/89245697
今天早上接到了GEE的邮件,这次数据集的更新主要是我们使用的长时间序列的遥感影像Landsat系列,之前我们所使用时间最长的Landsat C01数据集,2024年7月1日将会直接熊数据集中移除。 您可能有项目在使用地球引擎数据目录中的大地遥感卫星第 1 集和预采集数据集,这些数据集将于 2024 年 7 月 1 日移除。请迁移到集合 2,以避免请求失败。 信件内容 我们特此通知您,自 2024 年 7 月 1 日起,我们将从地球引擎数据目录中删除大地遥感卫星第 1 号采集集和预采集集数据集。 诸如 32 天 NDVI 等计算数据集将从 Collection 2 生成。 您需要知道什么? 自 2021 年 12 月 31 日起,美国地质调查局不再制作或提供大地遥感卫星第 1 集数据。 注意:请确保在 2024 年 7 月 1 日前更新地球引擎脚本、模块和应用程序,以避免请求失败。