首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >多元多系列LSTM

多元多系列LSTM
EN

Data Science用户
提问于 2018-06-20 07:51:12
回答 2查看 2.5K关注 0票数 1

我正在尝试创建一个污染预测LSTM。我见过网络上的一个例子为一个多变量的低污染监测服务,以预测一个城市(北京)的污染水平,但不止一个城市呢?我真的不想为每个城市建立一个单独的网络,我想为所有的x个城市建立一个单一的通用模型/网络。但是如何将这些数据输入LSTM呢?

假设我对每个城市都有相同的数据,我是不是.

1)对一个城市的所有数据进行培训,然后对下一个城市进行培训,等等,直到所有城市都完成。

( 2)对所有城市的数据进行t+1、t+2等数据的训练。

3)完全不同的东西。

有什么想法吗?

EN

回答 2

Data Science用户

回答已采纳

发布于 2018-06-20 08:07:33

我要说的是,备选方案1的效果不太好:根据我的经验,该模型要么只适合你训练的第一个或最后一个模型,要么取决于你给算法多少自由,以便随着时间的推移改变权重(例如,学习率)。

你真的需要决定你要预测什么。这是单个城市的污染水平吗?你对每个城市都有哪些特征?

如果你所拥有的特征也是能够解释目标变量的通用特征,那么同时对所有城市进行培训也是有意义的。所以,如果你有温度,湿度,一些城市的交通统计数据等,那么所有的训练在一起都是有意义的。

我会考虑每一个样本导致一个目标污染水平,如果该样本有足够的信息(根据特征)与其他城市的样本区分开来,那么模型就应该了解并利用数据中的这些细微之处。

票数 2
EN

Data Science用户

发布于 2018-06-20 08:17:30

我可以想到两种选择:

  • 多投入/多产出模型:如果城市之间关系密切,其中一个城市的污染可能会影响另一个城市的污染。在这种情况下,通过将每个城市的测量数据作为LSTM的单独输入来检查相互污染是有意义的。您可以使用这些时间序列对您的网络进行培训,在测试期间,您将在time t插入每个城市的污染,并且该网络可以预测t+n上所有城市的污染(n是任意范围;它越长,预测的准确性就越低)。
  • 单输入/单输出模型:另一种方法是利用每个城市的所有培训数据创建一个单一输入网络,方法是假设所有数据都来自同一个来源(或至少类似的来源)。该网络被训练成输出t+n污染预测,给定t对任何城市的污染。但这意味着您的网络可以很好地推广。为了推广LSTM,您应该考虑在培训期间添加Dropout。见
票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/33412

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档