我有一系列的城市列表。我想按国家名称对它们进行分组。有没有我可以安装的库可以做到这一点?
例如array(‘洛杉矶’,‘底特律’,‘西雅图’,‘亚特兰大’,‘圣地亚哥’,‘匹兹堡’,‘首尔’,‘圣克拉拉’,‘奥斯汀’,‘芝加哥’)
我想知道它们所属的国家,并在我的数据框中添加一个新的国家/地区列。
发布于 2021-07-20 01:14:06
我同意评论中所说的-当城市名称不是唯一的时候,没有明确的方法将一个城市加入一个国家。
例如,如果我们运行...
import pandas as pd
df = pd.read_csv('https://datahub.io/core/world-cities/r/world-cities.csv')
df.rename(columns ={"name":"city"}, inplace=True)
print(df)输出:

# create a list of city names for testing...
myCityList = ['Los Angeles', 'Detroit', 'Seattle', 'Atlanta', 'Santiago', 'Pittsburgh', 'Seoul', 'Santa Clara', 'Austin', 'Chicago']
# pull out all the rows matching a city in the test list..
df.query(f'city=={myCityList}')输出:

然而,有些地方是错误的,因为在测试城市列表中列出的行比项目多(显然Santiago被多次列出)……
print(len(myCityList))
print(df.query(f'city=={myCityList}').shape[0])输出:
10
15上面的可能是有用的,但它必须谨慎使用,因为它不能100%保证为给定的城市输出正确的国家。
https://stackoverflow.com/questions/68443850
复制相似问题