我正试图根据过去的历史数据建立一个预测模型。根据过去一年的数据,我有关于具体机器故障的详细信息。我有2016年几个月和2017年1月至11月的数据。我正试图预测这台机器在12月是否会出现故障。我根据我执行的数据转换,附上了过去的历史数据。我被困在如何建立一个模型,以确定机器是否抛出任何修理或更换在未来一个月。
我需要建立一个分类模型,以确定机器是否出现故障。我不明白如何将这多行转换为每台机器的单行记录。我需要为日月建立分类吗?我将如何表示每个传感器数据列。本质上看正确的方式来表示数据,这样分类就更容易预测下一个月了。
任何形式的指导都会对dataset.csv train.csv大有帮助。
train.csv包含了已经预测的机器12月的1个月数据。目标列是预测在12月份,机器是否需要修理或更换或没有问题。
发布于 2018-09-18 09:51:14
本质上,您希望将结果变量移至1,即将12月的结果转移到11月份。在这样做的时候,你是在说当前月份(11月)的值导致了下个月(12月)的结果。至于处理完全依赖于用于分析的环境/软件的数据的问题,然而,它们看起来像现在一样好。
https://datascience.stackexchange.com/questions/38407
复制相似问题