今天给大家分享人工智能数据集,工业制造相关数据,需要的同学可以下载使用。 1、SeverStal 钢铁表面缺陷数据集 下载地址:SeverStal 钢铁表面缺陷数据集 2、MVTec 工业3D对象检测数据集 (MVTec ITODD) MVTec 工业 3D 对象检测数据集 下载地址:无传感器驱动诊断数据集_帕依提提-人工智能数据集服务平台 4、热轧带钢表面缺陷数据集-东北大学 下载地址:热轧带钢表面缺陷数据集-东北大学_帕依提提-人工智能数据集服务平台 5、氨、乙醛、丙酮 、乙烯、乙醇和甲苯6 种气体数据集 数据集包括来自六种不同纯气态物质的记录,即氨、乙醛、丙酮、乙烯、乙醇和甲苯,每种物质的剂量范围从 5 到 1000 ppmv。 有关此数据集中考虑的测量记录的气体身份名称、浓度值 和时间分布序列的详细信息。 下载地址:工业制造_公开数据集_帕依提提-人工智能数据集服务平台
数据集中有很多增强图片,运用增强手法有旋转增强,增加明暗度和拼接增强具体看图片预览 数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式 xml文件和yolo格式txt文件) 图片数量(jpg文件个数):4159 标注数量(xml文件个数):4159 标注数量(txt文件个数):4159 标注类别数:5 标注类别名称(注意yolo格式类别顺序不和这个对应 = 1453 porosity 框数 = 2732 spatters 框数 = 5829 总框数:11422 使用标注工具:labelImg 标注规则:对类别进行画矩形框 重要说明:暂无 特别声明:本数据集不对训练的模型或者权重文件精度作任何保证 ,数据集只提供准确且合理标注 图片预览: 标注例子:
Environ.Economics & Management,vol.5, 81-102, 1978. 译文 波士顿房价数据集 **数据集特征:** 实例数:506 属性数:13数值/分类预测。中值(属性14)通常是目标。 这是UCI ML住房数据集的副本。 https://archive.ics.uci.edu/ml/machine-learning-databases/housing/ 这个数据集取自卡内基梅隆大学的StatLib图书馆大学。 那个Harrison,D.和Rubinfeld,D.L.的波士顿房价数据,“享乐价格和对清洁空气的需求”,J.Environ。《经济学与管理》,第5卷,81-1021978年。
某中心发布最大规模工业“抓取和放置”机器人训练数据集为提升仓库中负责分拣、抓取和打包产品的机器人性能,某中心公开发布了在工业产品分拣场景中捕获的最大规模图像数据集。 此前最大的工业图像数据集仅包含约100个对象,而名为ARMBench的该数据集则包含了超过190,000个对象。因此,该数据集可用于训练“抓取和放置”机器人,使其能更好地适应新产品和新场景。 数据集细分与挑战物体分割数据集包含超过50,000张图像,每张图像包含1到50个手动分割的物体,平均约10.5个。 物体识别数据集包含超过235,000个标记的“抓取活动”;每个抓取活动包括一张抓取图像和三张转移图像。 缺陷检测数据集包括静态图像和视频。超过19,000张静态图像是在转移阶段捕获的,旨在训练缺陷检测模型,以判断机械臂是否意外损坏了物体或一次抓取了多个物体。
数据集标注是深度学习项目中不可获取的一部分,下文从划分数据集到利用标注一条龙讲解 数据集制作并标注 数据集划分 数据集划分 1.以YOLO为例先新建一个文件夹把数据集(图片全部放入) 2.然后新建两个文件夹分别存放数据集 (images)和标签(labels) 3.概按照3:1的比例把图片划分为两个文件夹一个为训练集一个为验证集 4.然后在标签的文件夹里分别新建两个文件夹对应于图片文件夹的训练集和验证集 具体文件夹关系如下
虽然YOLOv5算法并没有与YOLOv4算法进行性能比较与分析,但是YOLOv5在COCO数据集上面的测试效果还是挺不错的。 其实工业界往往更喜欢使用这些方法,而不是利用一个超级复杂的算法来获得较高的检测精度。 目标检测数据集 1.PASCAL VOC 2.MS COCO PASCAL VOC: PASCAL VOC挑战赛再2005年到2012年间展开。 PASCAL VOC 2007:9963张图片,24640个标注;PASCAL VOC2012:11530张图片,27450个标注,该数据集有20个分类: Person:person Animal:bird COCO - Common Objects in Context COCO数据集包含20万个图象:11.5万多张训练集图片,5千张验证集图像,2万多张检测集图像 80个类别中有超出50万个目标标注 平均每个图像的目标数为
金属外表多种生锈检测数据集(1200张图片已划分)|面向工业巡检的目标检测数据集在工业设备智能运维、基础设施安全评估与城市大型金属结构全生命周期管理不断推进的背景下,金属锈蚀的自动化识别与精确定位已成为工业视觉领域的重要研究与落地方向 数据集下载链接:https://pan.baidu.com/s/1JR5KnTDWreLm1zLvBnU_BA? 本数据集正是在这一工程需求背景下构建,面向工业级金属外表锈蚀的多类别目标检测任务。 数据集核心特点✅覆盖4种工业常见锈蚀类型✅图像来源多样,包含不同材质、光照、拍摄距离✅已完成训练验证测试集严格划分✅标注精细,适合工业级模型训练与评估✅可直接用于无人机巡检、工业视觉系统开发类别定义(classes 通过构建标准化、可复用、可扩展的金属锈蚀目标检测数据集,并结合深度学习模型进行自动识别,我们可以:提前发现隐蔽风险降低人工巡检成本提升工业运维智能化水平构建真正可落地的AI工业应用系统本数据集为后续YOLO
在本项目的前期训练中,数据最后的结果都不理想。因此在代码中引入了多种数据模型:逻辑回归、高斯朴素贝叶斯、K近邻分类、决策树分类、支持向量机分类、xgboost。在训练集上,最高准确率为77%。 因此在代码中引入了多种数据模型:逻辑回归、高斯朴素贝叶斯、K近邻分类、决策树分类、支持向量机分类、xgboost。在训练集上,最高准确率为77%。 wangsen/ai/13/homework/diabetes.csv") df.info() target = df.pop("Outcome") data = df.values print(data[:5] ) lr = LogisticRegression() lr.fit(data,target) score = lr.score(data,target) print("训练集上的预测准确率",score keras https://www.kesci.com/home/project/5a5b691046c4ba639c6fbfa2 多种 机器学习https://blog.csdn.net/weixin
最近需要学习使用genefu这个包,可以看我在生信技能树分享的韩国人的单细胞转录组乳腺癌研究文献就明白了,然后应用到自己的数据里面,发现这个包的说明书里面提到了5个乳腺癌表达数据集,安装如下: source biocLite("breastCancerUNT",ask=F,suppressUpdates=T) biocLite("breastCancerNKI",ask=F,suppressUpdates=T) 这5个数据集都是以前的研究者发表的 ,它们 Mainz, Transbig, UPP, and UNT 数据集 分别对应的是: GSE11121,GSE7390,GSE3494,GSE2990.不过NKI数据集并没有上传在GEO里面,是从作者的补充材料里面整理的 数据载入R 因为genefu这个包已经把这5个数据集处理好了,可以直接加载到R里面查看。 更重要的是这 5 个数据集的临床信息,都被重新归纳总结啦: cinfo <- colnames(pData(mainz7g)) > cinfo [1] "samplename" "dataset
你的团队下载了很多图片数据集,包含猫咪图片(正样本,positive example)和非猫咪图片(负样本, negative example)。他们将这些数据划分为70%的训练集,30%的测试集。 大数据时代之前,在机器学习中人们对数据集的一个常见划分规则为:将数据集划分为70%/30%的训练集和测试集。 我们通常定义: • 训练集(Training set) — 运行在算法上的数据集. • 开发集(Dev/development set) — 这部分数据通常用来调参,选择特征,以及对学习算法进行改进。 换句话说,开发集和测试集的目的是为了让你对算法进行改进,使算法效果变得更好 所以你应该: • 选择开发集和测试集时,主要选择可以反映未来需要获取的数据 换句话说,你的测试集不应该只是可用数据的30%这么简单 切记不要认为你的训练集和测试集分布必须是一样的。尽量去选择那些可以反映真实情况的数据作为测试样本。
为了适应全面丰富的NLP任务,方便更多开发者灵活插拔尝试多种网络结构,并且让应用最快速达到工业级效果,今年4月23日,百度正式开放了工业级中文NLP工具与预训练模型集——PaddleNLP(nlp.baidu.com 工具集拥有当前业内效果最好的中⽂语义表示模型和基于用户大数据训练的应用任务模型,模型源于产业实践,达到工业级的应用效果。 PaddlePaddle 是中国首个、也是目前国内唯一开源开放,集核心框架、工具组件和服务平台为一体的端到端开源深度学习平台,其囊括支持面向真实场景应用、达到工业级应用效果的模型,并具备针对大规模数据场景的分布式训练能力 与此同时,百度还开放了在对话等任务的开放数据集上超越SOTA效果的模型网络结构与参数,方便相关领域研究人员快速验证、使用。 除了开放预训练模型,PaddleNLP还开放了相关任务的评测数据集。这些数据来自于百度真实的工业化场景,能够很好地对模型效果进行评估。
下载数据集请登录爱数科(www.idatascience.cn) 由电商平台爬取的图书信息,包括书名、出版信息、当前价格等。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 当当网搜索页面爬取。
下载数据集请登录爱数科(www.idatascience.cn) 其记录了2014年之前天文学家在恒星(除了太阳)周围发现的行星的信息。 1. 字段描述 2. 数据预览 3. 数据来源 来源于UCI机器学习库。
计讯物联5G加密工业网关TG451,支持多种VPN协议OpenVPN、IPSEC、PPTP、L2TP等保证数据传输的安全性,支持APN/VPDN,多重防护,享受金融级加密保护,广泛应用于交通、电力、金融 、水利、气象、环保、工业自动化,能源矿产、医疗、农业、林业、石油、建筑、智能交通、智能家居等物联网应用。 图片1.png 5G加密工业网关功能配置 图片2.png 5G加密工业网关高速率、低时延、大容量,在同样的密集的设备接入地区更快、更稳定,完美契合智慧物联的设备通信需求。 丰富的行业应用接口,包括千兆网口、RS485、RS232、DI、继电器、ADC、POE供电,满足工业、电力、生产、物流、城市管理等行业设备的接入,实现一站式集成通信传输,大大降低通信网部署难度。
下载数据集请登录爱数科(www.idatascience.cn) 该数据集记录了一家全球超市4年的订购数据,包含订单的订单号、下单时间、发货时间、运输模式、顾客名称和地区等信息。 1. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
下载数据集请登录爱数科(www.idatascience.cn) 通过物理测量预测鲍鱼的年龄。 从原始数据中删除了缺失值的样本,并且对连续值的范围进行了缩放。数据集共4177个样本,8个字段 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 Warwick J Nash, Tracy L Sellers, Simon R Talbot, Andrew J Cawthorn and Wes B Ford (1994) "The Population Coast and Islands of Bass Strait",Sea Fisheries Division, Technical Report No. 48 (ISSN 1034-3288) 5. 数据引用 Nash W J, Sellers T L, Talbot S R, et al.
简介 ERA5-HEAT数据集 该数据集提供了一组代表室外条件下人类热应力和不适指数的完整历史重建。该数据集也被称为ERA5-HEAT(人类热舒适度),代表了当前生物气候学数据记录制作的最先进水平。 该数据集围绕两个主要变量展开:1)平均辐射温度(MRT);2)通用热气候指数(UTCI)。这些变量描述了人体如何体验大气条件,特别是气温、湿度、通风和辐射。 该数据集是利用欧洲中期预报中心(ECMWF)的ERA5 再分析计算得出的。ERA5将模型数据与世界各地的观测数据结合在一起,对地球气候及其近几十年的演变提供了全球范围内完整一致的描述。 数据集说明 空间信息 Attribute Details Spatial extent Global Spatial resolution 27.75km (.25 deg) Temporal resolution -heat') var era5_heat_i = era5_heat_ic.first() // 打印第一幅图像,查看波段 print(era5_heat_i) // 可视化第一幅图像中的选定波段
简介 注(2024-04-19): 由于哥白尼气候数据存储的现代化工作受到影响,ECMWF 数据集的生产可能会中断。 提供商未说明计划完成日期,详情请参见用户论坛。 ERA5-陆地是一个再分析数据集,以比ERA5更高的分辨率提供了几十年陆地变量演变的一致视图。 ERA5-陆地是通过重放 ECMWF ERA5 气候再分析的陆地部分而生成的。 再分析利用物理定律将模式数据与世界各地的观测数据相结合,形成一个全球完整一致的数据集。 再分析产生的数据可追溯到几十年前,能准确描述过去的气候。 该数据集包括 CDS 上提供的全部 50 个变量,是 ECMWF ERA5 陆地小时数据的每日总和,包括流动带和非流动带。 ERA5-陆地每日汇总数据可提供从 1950 年到三个月的实时数据。 更多信息,请访问哥白尼气候数据商店。 降水量和其他流量(累积)带偶尔会出现负值,这在物理上是不合理的。
焊接情况检测数据集(千张图片已划分)|面向工业质检的目标检测训练集在现代工业制造体系中,焊接质量作为产品可靠性的重要指标之一,直接影响结构件的力学性能、安全性和使用寿命。 随着工业视觉和深度学习的发展,利用AI模型自动检测焊缝质量逐渐成为行业趋势。而高质量的焊接检测数据集,正是训练这类模型的核心基础。 总结来看,本次分享的焊接情况检测数据集为工业智能化提供了坚实的基础。 通过合理划分训练集、验证集和测试集,开发者可以充分利用数据进行模型优化与验证,从而在实际工业生产环境中实现对焊接表面缺陷的自动检测与监控。 总之,这份数据集是工业AI应用中不可或缺的资源,为焊接检测技术的研究与实践提供了坚实的数据基础。
下载数据集请登录爱数科(www.idatascience.cn) 小费数据集 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源