我有一个月的时间序列能源消耗数据。数据的频率为每小时半小时。数据集的特点如下
使用这些变量,我需要预测电力(能源)消耗。这些变量的pairs图是

我从一个线性模型开始,但这个模型的表现似乎非常糟糕。我想知道是否有任何自动技术,可以检查所有可能组合的预测变量,并输出最佳拟合模型。我可以检查所有的模型(线性组合,非线性,样条等)手动,但它将需要大量的时间。
我是实时预测的半小时率(非常短期预测)。另外,我使用不同的模型对应于一天中不同的半小时。例如,在一天中,我们有48个半小时,所以对应于每半个小时,我有一个单独的模型。在整个过程中,我使用以下方法:
步骤2和步骤3继续到停止状态。使用的停车条件是否。测试日。我的培训数据的截图如下:
head(training_data)
tail(training_data)
发布于 2016-04-06 16:26:47
以前也有过同样的问题。已使用的Weka工具(http://www.cs.waikato.ac.nz/ml/weka/)。
这一办法:
将一天中的时间转换为标称(非数字)(如编号为0-47的垃圾桶)
·将一周中的一天转换为名义(非数字)
·使用M5Tree构建模型
树中的规则会弹出"if 0< bin < 5:30am_bin“之类的内容.它区分了一天的开始
有超过一个月的数据会更好。例如,在一周中的某些日子里,只有4个样本。所以再多几个月会更好。在这种情况下,再一次将月份转换为一个名义值(非数值),这样规则就可以获得季节性和月度变化。
https://datascience.stackexchange.com/questions/11062
复制相似问题