我有一个非常大的数据集(超过57万行)作为熊猫数据帧。它同时具有经度和纬度列(所有英国位置)。所以我想在英国地图上绘制它们,并使用matplotlib底图。然而,绘制它需要花费太长的时间。有没有什么方法可以加速这个过程,或者我的代码中是否有任何错误?
for index, row in road.iterrows():
count = row['count']
x, y = m(row["Longitude"], row["Latitude"])
size = count ** 2 + 3
m.plot(x, y, 'o', markersize=size, color='#444444', alpha=0.8)发布于 2018-08-31 01:28:29
以下是几个想法:
循环中使用它,也就是,如果你只在循环中使用一次,for row in road.iterrows():
类似于:
for row in road.iterrows():
m.plot(m(row["Longitude"], row["Latitude"]),
'o',
markersize=(row['count'] ** 2 + 3),
color='#444444',
alpha=0.8)看起来不是很漂亮,但应该会快一点。
然后跟踪每个更改对性能的影响。
祝好运!
发布于 2018-08-31 03:14:05
这真的取决于你试图对数据进行什么可视化。
我的第一个想法是做一个数据的密度图(首先将数据放入一个更大的网格中,然后用颜色绘制网格,表明每个网格中有多少东西)。
https://stackoverflow.com/questions/52100514
复制相似问题