首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >时间序列生成.多维时间序列数据

时间序列生成.多维时间序列数据
EN

Data Science用户
提问于 2019-11-21 08:42:37
回答 1查看 133关注 0票数 2

免责声明:数学家请不要因为我在这篇文章中使用了一些术语而生我的气。我是个工程师。:-)

背景:所以我目前正在研究一个问题,在这个问题中,我必须生成一个过程的时间序列序列,其中n个参与者在2d空间中移动。但我不知道这是否可能是由机器学习模型M学习的.The过程。

顺便说一下!我从来没有处理过时间序列数据,但是在没有序列的图像和信号模型的训练方面有很好的经验,所以我一直在阅读。

因此,为了开始尝试一些非常简单的东西,我从:这里获取了一个足球运动员位置数据集。我试图把它建模成一个监督学习问题,我试着预测n个玩家在时间戳T上的位置,假设在时间戳T1。但我很快意识到,这是行不通的,因为球员的位置也取决于球的位置和对手球员的位置。

无论如何,我的问题如下:- 1.如何对数据集进行建模?它仅仅是一个(Nx2xNo.Timestamps)类似于三维张量数据集(N对应于玩家).2表示x位和y位。而不是。作为最后一个维度的时间戳)?

  1. 我把时间序列生成问题建模为监督学习问题的方法正确吗?
  2. 我应该看哪些预处理步骤?另外,我如何处理丢失的值。
  3. 我之所以放弃使用足球数据集的想法:再来一次,因为它只包含一支球队的位置。另一组队员没有戴传感器。当我读到一些关于ARIMA模型的东西时,我读到了一些外生变量也影响了这个过程。
  4. 如果这一切都是可能的,我希望是的(因为不可能就是什么!)我该看什么模特?因为我最终要在一个完全不同的数据集中处理这个问题.我曾经有过训练神经网络模型的经验,比如CNN和ANNs,并且非常乐意使用神经网络,理想的情况下,我会在这里这样做。直到现在,我的研究已经指向了LSTMs,RNNs和ARIMA模型。

请指导我的同样,因为我是非常新的时间序列分析。

EN

回答 1

Data Science用户

发布于 2019-11-21 09:30:23

时间序列数据必须包含所有的观测结果,并带有某种标准的时间效应(这里有点明显)。如果我想在某些模型上测试理论&需要一些数据集,那么参数将是,时间戳*否。特征(包括玩家相对于源的位置)。二维张量就足够了。我不做3d张量的原因是,它会导致更复杂的场景,我将不得不将第3维(N的第一个维度)与预测的前二维相关联。更好的方法是简化位置&在一个行中,我可以有多个标签,因为每个位置对我的模型都很重要。

时间序列的生成通常属于连续预测,而先前的预测数据被认为是观测数据。我宁愿让它接受强化学习。是的,你可以在思想上和监督学习一起工作,但也可以尝试RL方法。

根据缺失的值,如果它们的数据量不超过10%-15%,我会说删除它们。在上述百分比上没有固定条。如果是更多,请填写内插或滚动平均(两者都对我有利)。Rest预处理取决于数据类型、规范化数据、删除异常值等.

是的,它会影响数据,但是您可以使用符号波的不同波动来生成数据,用于测试,或者使用任何其他函数来生成信号(喜鹊首选)。

目前,我正在测试我的时间序列的双向lstm - CNN组合,是的,阿里玛是好的,但做一点点这个呼气不会有伤害。我想说的是CNN--时间序列的任何RNN组合。

希望这能有所帮助。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/63524

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档