我是ML领域的新手。所以,如果我在某个地方错了,请忽略或纠正。目前正在为时间序列数据进行模型培训。我的问题是更具体的自行车共享。我有每个地区和每一种自行车类型(齿轮,没有齿轮.)的自行车共享数量。每一天。
例如,数据:
Date BikeType Area BikeCount
1/1/19 Gear 1 10
1/1/19 WithoutGear 1 15
1/1/19 Gear 2 8
1/1/19 WithoutGear 2 12
2/1/19 Gear 1 11
2/1/19 WithoutGear 1 17
2/1/19 Gear 2 9
2/1/19 WithoutGear 2 16因此,我将有一个趋势,每种类型的自行车在每个地区。如何对此数据使用时间序列。我必须预测每种类型和每一地区所需的自行车。例如,对于给定的数据,在3/1/19的3/1/19中,我必须预测齿轮传动自行车所需的数量以及1和2区域所需的WithoutGeared自行车数量。(考虑到两个日期的数据足以进行预测,我对每个特定区域和类型都有2年数据,它们有一个良好的趋势)
第二个问题是..。目前,我只需要二维自行车类型和面积,他们可能会增加以后(如他们的颜色和条件)如何处理这一点。任何贡献都是有帮助的。
我从这个问题中得到了一个提示:https://stackoverflow.com/questions/55545501/how-to-perform-time-series-analysis-that-contains-multiple-groups-in-python-usin
但是,这是唯一最好的办法.
谢谢(我也需要关于题目的建议)
在以下引用中,我也遇到了类似的问题:
现在,我还有两个疑问:
发布于 2020-01-16 14:12:18
我认为你应该研究多元回归。您可以使用这些变量(类型、面积等)以及其他因素,如季节性。创建虚拟变量,如星期的日期,周数,月份等来捕捉季节性。例如,多雨月份的自行车需求可能会减少。这些都是数据固有的特性。
发布于 2020-01-22 13:59:00
我将逐一讨论你的问题:
如何对此数据使用时间序列
您可以通过输入变量的时间序列来训练RNN多元回归器。您的第一层将是递归层(LSTM或GRU),并提供以下input_shape:
( batch size , input size , Number of variables )
我只需要二维的自行车类型和面积,他们以后可能会增加(比如他们的颜色和状况)如何处理这个问题。
如果您需要添加以前不存在的新变量,恐怕您必须重新训练您的模型。不同的体系结构=需要训练的一组不同的权重。
LSTM是唯一的方法吗?
不,你可以使用递归层与GRU细胞。GRUs与LSTM不同:它们的参数较少(即威力较小),但训练速度更快。没有正确或错误的选择,我认为这两种架构都值得测试,看看哪一种在当前任务上表现得更好。
我的数据列(数据类型和区域)是维度还是功能?
请重新表述这个问题,你的意思还不清楚。你所说的“数据类型和面积尺寸或特征”是什么意思?
以上显示的所有变量都可以用作输入变量,如果您相应地对它们进行预处理的话.例如,日期时间信息可以转化为更多的数值变量来捕捉季节性趋势(这只是一个例子)。自行车的类型和区域可以是一个热点编码,或者其他相关信息可以根据它们的值连接.有很多选择。
https://datascience.stackexchange.com/questions/66578
复制相似问题