本篇目录 轴承类数据集 齿轮箱数据集 机床数据集 风电机组数据集 钢铁数据集 工业机器人 电机故障诊断数据集 机电设备故障数据集 结构健康监测和评估数据集 液压装置状态评估数据集 半导体制造过程数据集 齿轮故障诊断的实验数据集及python处理 http://www.52phm.cn/datasets/gearbox/gear_fault_dataset.html 工业机器人 移动机器人SCITOS-G5 http://www.52phm.cn/datasets/Iron-and-steel/Steel-annealing-data-set.html 钢板故障数据集 http://www.52phm.cn 电机故障诊断数据集 电机状态预测数据集 获取下载数据方式: http://www.52phm.cn/datasets/General-machinery/Motor-condition-data.html 机电设备故障诊断数据集 机电设备故障诊断数据集 获取下载数据方式: http://www.52phm.cn/datasets/General-machinery/Electromechanical-equipment-fault-diagnosis-data-set.html
数据集下载请登录爱数科(www.idatascience.cn) 根据世界卫生组织(WHO)的数据,中风是全球第二大死亡原因,约占总死亡人数的11%。 该数据集用于根据输入参数(例如性别,年龄,各种疾病和吸烟状况)预测患者是否可能中风。数据中的每一行都提供有关患者的相关信息。 1. 字段描述 2. 数据预览 3. 字段诊断信息
下载数据集请登录爱数科(www.idatascience.cn) 个人的年收入是由多种因素造成的。从直观上看,它受个体的教育程度、年龄、性别、职业等因素的影响这些数据是。 这些数据由Ronny Kohavi和Barry Becker(数据挖掘和可视化,Silicon Graphics)从美国某地区1994年的人口普查局数据库中提取的。 可以用此数据集来进行收入的预测,预测任务是确定一个人的年收入是否超过5万美元。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 UCI开源数据集。
下载数据集请登录爱数科(www.idatascience.cn) 体脂的精确测量往往是昂贵且不方便的,本数据集列出了 252 名男性通过水下称重和各种体围测量确定的体脂肪百分比估计值。 该数据可用于多元回归分析。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。 5. 数据引用 Bailey C.
下载数据集请登录爱数科(www.idatascience.cn) 实验数据用于创建低能耗建筑中电器能耗的回归模型。数据集为10分钟,持续约4.5个月。 然后,将无线数据平均10分钟。能量数据每10分钟用m-bus能量计记录一次。 最近的机场气象站(比利时基耶夫斯机场)的天气是从Reliable Prognosis(rp5.ru)的公共数据集中下载的,并使用日期和时间列与实验数据集合并在一起。 数据集中包含两个随机变量,用于测试回归模型并过滤掉非预测属性(参数)。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据引用 Candanedo L M, Feldheim V, Deramaix D.
故障预测方法分类 1.基于可靠性模型的故障预测方法 通常,基于可靠性模型或基于概率的PHM方法适用于从过去故障历史数据的统计特性角度进行故障预测。 基于数据驱动的故障预测方法 在许多情况下,对于由很多不同的信号引发的历史故障数据或者统计数据集,很难确认何种预测模型适用于预测。 或者在研究许多实际的故障预测问题时,建立复杂部件或者系统的数学模型是很困难的甚至是不可能的,因此,部件或者系统设计、仿真、运行和维护等各个阶段的测试、传感器历史数据就成为掌握系统性能下降的主要手段,这种基于测试或者传感器数据进行预测的方法称为数据驱动的故障预测技术 下面通过自组织映射神经网络(SOM)的方法进行故障诊断。 ? 轴承振动图谱 准备数据集,确定类标签(如下图所示,共八种故障类型) ? 《数据驱动的故障预测》 2.基于数据驱动的滚动轴承故障诊断研究 3.CPS:新一代工业智能 4.PHM算法|故障诊断建模方法
下载数据集请登录爱数科(www.idatascience.cn) 需求预测是每个增长中的在线业务的关键组成部分。没有适当的需求预测流程,几乎不可能在任何给定时间都拥有适量的库存。 送餐服务必须处理大量易腐烂的原材料,这对于此类公司准确地预测每日和每周的需求显得尤为重要。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
下载数据集请登录爱数科(www.idatascience.cn) 该数据集包含 48120 条每小时在四个不同路口的车辆数量观察。数据是由传感器在每个路口的不同时间收集的。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
下载数据集请登录爱数科(www.idatascience.cn) 痴呆症是一种综合征,通常是慢性或渐进性,代表认知功能(即处理思维的能力)的恶化超出了正常衰老的预期。 本数据集由150名年龄在60岁至96岁之间的受试者纵向收集。每个受试者被扫描两次或两次以上,间隔至少一年。您可以利用它进行分类预测。 1. 字段描述 2. 数据预览 3. 数据来源 https://data.mendeley.com/datasets/tsy6rbc5d4/1 5. 数据引用 Battineni, Gopi; Amenta, Francesco; Chintalapudi, Nalini (2019), “Data for: MACHINE LEARNING IN
下载数据集请登录爱数科(www.idatascience.cn) 预测死亡事件的12个临床特征。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。 5. 数据引用 Chicco D, Jurman G.
下载数据集请登录爱数科(www.idatascience.cn) 该数据集包含具有全球足迹的制造公司的历史产品需求。该公司提供数十种产品类别中的数千种产品。在负责的区域内有四个中央仓库来运送产品。 如果能够以合理的准确性对不同中心的每个产品进行预测,以预测下一个月后的每月需求,那么它将以多种方式对公司有利。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
下载数据集请登录爱数科(www.idatascience.cn) 此数据集包含服装生产过程的重要属性和员工的生产率,这些属性已手动收集并已得到行业专家的验证。 该数据集可通过预测生产率范围(0-1)来用于回归目的,也可以通过将生产率范围(0-1)转换为不同的类别来进行分类。包含15个属性,1197条数据。 1. 字段描述 2. 数据预览 3. 数据来源 Abdullah Al Imran, abdalimran '@' gmail.com 5. 数据引用 Al Imran A, Amin M N, Rifat M R I, et al.
下载数据集请登录爱数科(www.idatascience.cn) 一家旅游公司希望根据下面的指标预测客户是否会流失。帮助建立预测模型,节省公司的资金。 该数据集包含了该公司用户年龄、收入等一些相关信息。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
下载数据集请登录爱数科(www.idatascience.cn) 保险公司已经向其客户提供了健康保险,现在他们需要建立模型来预测过去一年的客户是否也会对他们提供的车辆保险感兴趣。 建立一个模型来预测客户是否会对车辆保险感兴趣,这对公司非常有帮助,因为它可以相应地计划其沟通策略以覆盖这些客户并优化其业务模型和收入。 数据集中包含有关客户基本信息(性别,年龄,区域代码类型),车辆(车辆年龄,损坏),保单(保费,货源渠道)等信息。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
开发一个基于深度学习的CNC设备故障预测系统是一个复杂但的项目。以下我们的一个详细的步骤:1. 数据收集与预处理数据收集:从CNC设备的历史运行数据中收集大量样本,包括传感器数据、操作日志、维护记录等。数据清洗与预处理:去除噪声和异常值,填补缺失值,对数据进行归一化或标准化处理,确保数据质量。 特征工程特征提取:使用DeepSeek的特征提取工具,从原始数据中提取对故障预测有用的特征,如振动频率、温度变化率、电流波动等。 模型训练与优化训练:使用标记的训练数据集训练模型,调整超参数,如学习率、批次大小等,以优化训练过程。验证与测试:使用验证集和测试集评估模型的性能,确保模型的泛化能力。5. 实时监控与预测:在生产环境中部署模型,实现实时数据输入与故障预测。通过遵循上述步骤,结合DeepSeek与合适的深度学习模型,构建了一个高效、准确的CNC设备故障预测系统,为工业生产提供强有力的支持。
下载数据集请登录爱数科(www.idatascience.cn) 心脏病的患者的一些指标以及是否发病的数据集。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
下载数据集请登录爱数科(www.idatascience.cn) 一个组织想要预测谁是消费贷款产品的潜在违约者。他们有基于他们所观察到的顾客历史行为的数据。 因此,当他们获得新客户时,他们希望预测谁的风险更大,谁没有。此数据集为基于用户行为的贷款预测测试集。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。
STATWORX 团队的数据集十分新颖,但只是利用四个隐藏层的全连接网络实现预测,读者也可以下载该数据尝试更加优秀的循环神经网络。 S&P 500 股指时序绘图 预备训练和测试数据 该数据集需要被分割为训练和测试数据,训练数据包含总数据集 80% 的记录。该数据集并不需要扰乱而只需要序列地进行切片。 比较常见的错误就是在拆分测试和训练数据集之前缩放整个数据集。因为我们在执行缩放时会涉及到计算统计数据,例如一个变量的最大和最小值。 但在现实世界中我们并没有来自未来的观测信息,所以必须对训练数据按比例进行统计计算,并将统计结果应用于测试数据中。不然的话我们就使用了未来的时序预测信息,这常常令预测度量偏向于正向。 经过 10 个 epoch 之后,我们完美地拟合了测试数据!最后的测试 MSE 等于 0.00078,这非常低,因为目标被缩放过。测试集的预测的平均百分误差率等于 5.31%,这是很不错的结果。 ?
STATWORX 团队的数据集十分新颖,但只是利用四个隐藏层的全连接网络实现预测,读者也可以下载该数据尝试更加优秀的循环神经网络。 S&P 500 股指时序绘图 预备训练和测试数据 该数据集需要被分割为训练和测试数据,训练数据包含总数据集 80% 的记录。该数据集并不需要扰乱而只需要序列地进行切片。 比较常见的错误就是在拆分测试和训练数据集之前缩放整个数据集。因为我们在执行缩放时会涉及到计算统计数据,例如一个变量的最大和最小值。 但在现实世界中我们并没有来自未来的观测信息,所以必须对训练数据按比例进行统计计算,并将统计结果应用于测试数据中。不然的话我们就使用了未来的时序预测信息,这常常令预测度量偏向于正向。 经过 10 个 epoch 之后,我们完美地拟合了测试数据!最后的测试 MSE 等于 0.00078,这非常低,因为目标被缩放过。测试集的预测的平均百分误差率等于 5.31%,这是很不错的结果。 ?
1.摘要 该试验台在不同小齿轮条件下进行测试,并通过加速度计进行振动信号采集,加速度计采样率为10KHz、采样时长为10s,采样数据共3包,每一包数据对应着不同故障类型,分别是健康状态、齿轮断齿、齿轮磨损状态下的数据集 该数据集被授权于用于任何学术和研究目的。 2.试验台结构 试验台装置整体传动系统主要由电机作为驱动输入,通过皮带带动齿轮箱,而齿轮箱输出端通过皮带带动刹车系统。 试验台设置 测试原理图 加速度计的方向及位置 3.数据集解读 数据集有3包数据,每包数据采样率为10kHz,采样时长为10s; 电机转速1420rpm/min,小齿轮15齿数、大齿轮110齿数; 啮合频率=(1420/60)*15=355Hz,在进行频谱分析中来看,实际啮合频率是365Hz左右; 数据与故障对应关系 断齿 Gearbox_a_chipped_tooth_full_load_03_ 简单提供一个baseline,方便大家使用数据集和做一些分析学习。