我需要根据GPS数据把开车的人聚在一起。数据由移动电话收集。我们每10秒就从每个用户那里分批接收它们。每批的GPS数据(位置、速度、方向)每2秒收集一次。
理想的解决方案是实时处理这些数据,并识别/更新一起开车的人群。但是,我们可能会从用户那里收到无序的数据(例如,由于连接性的丧失)。最终,我们应该得到所有的条目,但这使得实时处理更加复杂。
相反,我想先从后处理开始。我计划使用线性回归对每个用户在给定时期的数据进行规范化--在同一时间具有位置标记。然后利用聚类算法对用户进行聚类。这是一个好办法吗?如果是,那么您会推荐哪种聚类算法。或者有更好的方法来解决这个问题?
发布于 2022-11-16 04:33:06
特点是拉力,长,速度,方向。他们决定集群。因为你不知道簇的数目,所以K-方法不能用.如果数据中有异常值,请使用DBSCAN。否则使用层次式聚类。在层次聚类中,用树状图来确定聚类的数量。簇间距离的类型可以是“单”的。单簇更适合于连锁或串行簇。
https://datascience.stackexchange.com/questions/115507
复制相似问题