我有这样的数据集。这里的第一列是日期,第二列是温度,第三列是湿度,第四列和第五列是另外两个布尔数据。我有这样6年的数据。
2010-01-01,25.6,59,0,1
2010-01-02,25.6,60,0,1
2010-01-03,24.2,45,1,1
2010-01-04,26.3,20,0,1
2010-01-05,26.2,17,0,1
2010-01-06,24.3,65,0,0
2010-01-07,23.1,50,0,1
2010-01-08,26.3,25,1,0
2010-01-09,26.6,23,0,1
2010-01-10,24.3,60,0,1这个数据集的标签(我想预测的变量)是:(布尔值)
0,0,0,1,1,0,0,0,1,0现在,我想实现机器学习,从这个数据集预测未来的时间框架。我对机器学习几乎一无所知。我想用蟒蛇做这件事。哪一个库或方法最适合和最容易做到这一点?能给我一个简单的示例代码吗?
发布于 2017-04-21 12:40:25
在我看来,你的问题更像是分类问题,而不是时间序列问题。我的建议是:将日期分成几个子变量(年份、月、日、周)。然后使用这个值和其他值作为分类算法的输入。理想情况下,您可以尝试几个。我可以推荐这方面的学习技巧(http://scikit-learn.org/stable/auto_例子/分类/绘图_分类器_comparison.html)
一个建议是:根据分类算法的不同,您需要首先对数据进行规范化。我发现下面的博客对于入门级的问题很有用(通过代码示例--如果您想从时间序列的角度来处理这个问题,他也会谈到这个)和文档http://machinelearningmastery.com/blog/。
希望这能帮上忙。
发布于 2017-04-21 21:24:41
欢迎来到这个奇妙而有时令人恐惧的机器学习世界!在El Burro回答的基础上,我将从一个递归的神经网络开始,并在上面添加一个逻辑层。
递归神经网络是机器学习中的时间序列模型。它们接受输入(在每个时间点上变量的值),执行一些转换,并给出一个输出(在您的例子中是一个类标签,但它们也可以用于序列到序列的预测)。
对于你来说,一个特别相关的博客文章可能是序列分类。
https://datascience.stackexchange.com/questions/18506
复制相似问题