免责声明:数学家请不要因为我在这篇文章中使用了一些术语而生我的气。我是个工程师。:-)
背景:所以我目前正在研究一个问题,在这个问题中,我必须生成一个过程的时间序列序列,其中n个参与者在2d空间中移动。但我不知道这是否可能是由机器学习模型M学习的.The过程。
顺便说一下!我从来没有处理过时间序列数据,但是在没有序列的图像和信号模型的训练方面有很好的经验,所以我一直在阅读。
因此,为了开始尝试一些非常简单的东西,我从:这里获取了一个足球运动员位置数据集。我试图把它建模成一个监督学习问题,我试着预测n个玩家在时间戳T上的位置,假设在时间戳T1。但我很快意识到,这是行不通的,因为球员的位置也取决于球的位置和对手球员的位置。
无论如何,我的问题如下:- 1.如何对数据集进行建模?它仅仅是一个(Nx2xNo.Timestamps)类似于三维张量数据集(N对应于玩家).2表示x位和y位。而不是。作为最后一个维度的时间戳)?
请指导我的同样,因为我是非常新的时间序列分析。
发布于 2019-11-21 09:30:23
时间序列数据必须包含所有的观测结果,并带有某种标准的时间效应(这里有点明显)。如果我想在某些模型上测试理论&需要一些数据集,那么参数将是,时间戳*否。特征(包括玩家相对于源的位置)。二维张量就足够了。我不做3d张量的原因是,它会导致更复杂的场景,我将不得不将第3维(N的第一个维度)与预测的前二维相关联。更好的方法是简化位置&在一个行中,我可以有多个标签,因为每个位置对我的模型都很重要。
时间序列的生成通常属于连续预测,而先前的预测数据被认为是观测数据。我宁愿让它接受强化学习。是的,你可以在思想上和监督学习一起工作,但也可以尝试RL方法。
根据缺失的值,如果它们的数据量不超过10%-15%,我会说删除它们。在上述百分比上没有固定条。如果是更多,请填写内插或滚动平均(两者都对我有利)。Rest预处理取决于数据类型、规范化数据、删除异常值等.
是的,它会影响数据,但是您可以使用符号波的不同波动来生成数据,用于测试,或者使用任何其他函数来生成信号(喜鹊首选)。
目前,我正在测试我的时间序列的双向lstm - CNN组合,是的,阿里玛是好的,但做一点点这个呼气不会有伤害。我想说的是CNN--时间序列的任何RNN组合。
希望这能有所帮助。
https://datascience.stackexchange.com/questions/63524
复制相似问题