我有一个熊猫数据帧中的经纬度,经度和地址。用户输入一个地址,我想根据最后的long从pandas数据帧中查找相关的详细信息。下面是我的代码:
import pandas as pd
df_geo = pd.DataFrame({'Address': ['Addr1','Addr2','Addr3'],
'Value': [100, 101, 103],
'Lat': [33.515226, 33.51529, 33.515230],
'Long': [-112.094456, -112.094459, -112.094464]})我使用API对地址进行了地理编码,并获得了lat、long列表。
[33.515227, -112.094457]如何在pandas dataframe中找到交叉点或最近的坐标,并拉取Address和Value字段?我们有地理编码API。Pandas DataFrame可能相当大,所以如果可能的话,请使用python geo库中的一个寻找有效的解决方案。
发布于 2021-11-22 09:38:35
使用sklearn中的BallTree
import pandas as pd
import numpy as np
from sklearn.neighbors import BallTree
df_geo = pd.DataFrame({'Address': ['Addr1','Addr2','Addr3'],
'Value': [100, 101, 103],
'Lat': [33.515226, 33.51529, 33.515230],
'Long': [-112.094456, -112.094459, -112.094464]})
coords = [33.515227, -112.094457]
X = np.deg2rad(df_geo[['Lat', 'Long']].values)
y = np.deg2rad(np.array([coords]))
tree = BallTree(X, leaf_size=2)
dist, ind = tree.query(y)输出:
>>> df_geo[['Address', 'Value']].iloc[ind[0][0]].tolist()
['Addr1', 100]
>>> dist
array([[2.46826831e-08]])
>>> ind
array([[0]])https://stackoverflow.com/questions/70061309
复制相似问题