我正在进行交通数据分析,在那里我需要预测通过每个交通路口的车辆数量。
我的数据集的形状如下所示:
Road A-Junction B-Junction Date Hour CarCount
X a b 2000-06-09 7 10
Y b c 2000-06-09 7 20我想找出A-连接和B-连接之间的相关性。或者简单地说,在给定的X和Y路的例子中,我们能把a,b和c路联系起来吗?
发布于 2018-06-11 18:09:31
很抱歉,张贴作为一个答复,但评论部分不允许我放置预先格式化的文本。使用上面的例子,图形表示是否与下面的表示类似?
X=== a -10- b ---- c
| | |
| | |
Y=== a ---- b -20- c所以你想知道10路( X路,交界处a- b)和20 ( Y路,交界处b- c)是否相关?
更新:谢谢您的确认。对不起,我完全不是在交通领域,但我会给我的2分钱,因为我知道的ML在一般情况下。
我假设您希望了解10到20之间的相关性,以帮助您建立一个预测模型。如果你稍微解开这个问题,我想也许我们可以重组这个问题。
(如果您只是简单地查看所有可用的组合和它们之间的关联,这可能需要花费很长时间,而且除非您将信息规范化为您的预测模型,否则它可能不会是可操作的。)
标签=汽车数量
地物=日期、道路、交界处a、b交界处、附近交叉口的汽车数量 +其他相关设施
如果是这样的话,也许我们可以尝试通过特征工程将数据规范化到公路、交叉路口a、b。
在图上展开
W z-4--a --6- b --8- c
| | | |
3 20 28 9
| | | |
X-z-1- a -10-b -19- c
| | |
15 12 7
| | |
Y--10- a -14-b -20- c至于X路a- b交界处,我们的标签是10。
重新考虑附近的道路,因为:
0级--直接连接段
一级-直接连接到0级道路的路段
2级-直接连接1级公路的路段(如果需要的话)
W z-1--a -1-- b --1- c
| | | |
1 0 0 1
| | | |
X-z-0- a -**-b -0- c
| | |
0 0 1
| | |
Y--1-- a -1 -b --1- c示例:
Road Jun A Jun B L0 Connection L0 Avg Car L1 Connection L1 Avg
X a b 6 17.5 9 [you get the idea]抱歉,你的回答太长了;希望它能帮助你思考一些解决问题的方法。
https://datascience.stackexchange.com/questions/32958
复制相似问题