首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于机器学习的多变量时间序列预测--如何创建有监督的数据格式

基于机器学习的多变量时间序列预测--如何创建有监督的数据格式
EN

Data Science用户
提问于 2019-07-19 13:54:29
回答 1查看 255关注 0票数 0

Q1:

我有一个多元时间序列数据集。对于每个时间步骤,有11个特性和1个输出。我将使用监督ML来predect输出。我知道在单变量情况下,如果我要用过去的3天来预测t-天,数据集将被格式化为

代码语言:javascript
复制
x(t-3) | x(t-2) | x(t-1) | x(t)

, where x(t) is the output to predict. 

当数据集是一个多变量问题时,我应该如何格式化它?

我看到在一些内核中,这个问题被格式化为

代码语言:javascript
复制
x12(t-3) | x12(t-2) | x12(t-1) | x1(t), x2(t), ..., x12(t)

, where x12(t) is the output to predict. 

在这种情况下,过去3天的变量x1到x11被忽略了。

然而,在我的例子中,这些变量可能很重要。我能把问题格式化为

代码语言:javascript
复制
x1(t-3),...,x12(t-3) | x1(t-2), ..., x12(t-2) | x1(t-1),..., x12(t-1) | x1(t), x2(t), ..., x12(t) 

(一些功能只是从日期时间索引中创建的日期、月份、周日等)

Q2:

只有11个特征,是否有必要进行特征选择?

EN

回答 1

Data Science用户

发布于 2019-07-19 15:28:47

关于如何处理多变量时间序列问题,我相信GitHub链接时态多元会有所帮助。

您必须将n_inputs和n_outputs分别更改为12和1。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/56003

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档