我正在尝试创建一个污染预测LSTM。我见过网络上的一个例子为一个多变量的低污染监测服务,以预测一个城市(北京)的污染水平,但不止一个城市呢?我真的不想为每个城市建立一个单独的网络,我想为所有的x个城市建立一个单一的通用模型/网络。但是如何将这些数据输入LSTM呢?
假设我对每个城市都有相同的数据,我是不是.
1)对一个城市的所有数据进行培训,然后对下一个城市进行培训,等等,直到所有城市都完成。
( 2)对所有城市的数据进行t+1、t+2等数据的训练。
3)完全不同的东西。
有什么想法吗?
发布于 2018-06-20 08:07:33
我要说的是,备选方案1的效果不太好:根据我的经验,该模型要么只适合你训练的第一个或最后一个模型,要么取决于你给算法多少自由,以便随着时间的推移改变权重(例如,学习率)。
你真的需要决定你要预测什么。这是单个城市的污染水平吗?你对每个城市都有哪些特征?
如果你所拥有的特征也是能够解释目标变量的通用特征,那么同时对所有城市进行培训也是有意义的。所以,如果你有温度,湿度,一些城市的交通统计数据等,那么所有的训练在一起都是有意义的。
我会考虑每一个样本导致一个目标污染水平,如果该样本有足够的信息(根据特征)与其他城市的样本区分开来,那么模型就应该了解并利用数据中的这些细微之处。
发布于 2018-06-20 08:17:30
我可以想到两种选择:
time t插入每个城市的污染,并且该网络可以预测t+n上所有城市的污染(n是任意范围;它越长,预测的准确性就越低)。t+n污染预测,给定t对任何城市的污染。但这意味着您的网络可以很好地推广。为了推广LSTM,您应该考虑在培训期间添加Dropout。见这和这。https://datascience.stackexchange.com/questions/33412
复制相似问题