我有一个表,其中一个列是县名,另一个列是各种属性。
我想将这列县名转换为fips代码。
我有一个中间表,显示每个县的fips代码。
下面是一个示例,说明我拥有哪些数据(初始数据和中间数据)和我想要的数据(最终数据)。
initial_df = {
'county': ['REAGAN', 'UPTON', 'HARDEMAN', 'UPTON'],
'values': [508, 364, 26, 870]
}
intermediate_df = {
'county': ['REAGAN', 'HARDEMAN', 'UPTON'],
'fips': [48383, 47069, 48461]
}
final_df = {
'county': ['REAGAN', 'UPTON', 'HARDEMAN', 'UPTON'],
'fips': [48383, 48461, 47069, 48461],
'values': [508, 364, 26, 870]
}发布于 2018-09-19 01:23:51
你可以使用“合并”。
import pandas as pd
initial_df = {'county': ['REAGAN', 'UPTON', 'HARDEMAN', 'UPTON'], 'values': [508,
364, 26, 870]}
intermediate_df = {'county': ['REAGAN', 'HARDEMAN', 'UPTON'], 'fips': [48383, 47069,
48461]}
final_df = {'county': ['REAGAN', 'UPTON', 'HARDEMAN', 'UPTON'], 'fips': [48383,
48461, 47069, 48461], 'values': [508, 364, 26, 870]}
df1=pd.DataFrame(initial_df)
df2=pd.DataFrame(intermediate_df)
df3=df1.merge(df2)
print(df3)输出是您的final_df。
发布于 2018-09-19 01:21:16
有一种方法:
initial_df = pd.DataFrame(initial_df)
final_df = initial_df.assign(fips = initial_df['county'].map(dict(zip(*intermediate_df.values()))))或者:
initial_df = pd.DataFrame(initial_df)
final_df = initial_df.assign(fips = initial_df['county'].map(pd.DataFrame(intermediate_df).set_index('county')['fips']))两者的结果都是:
>>> final_df
county values fips
0 REAGAN 508 48383
1 UPTON 364 48461
2 HARDEMAN 26 47069
3 UPTON 870 48461发布于 2018-09-19 01:37:01
您可以从intermediate_df中获取字典,并将其转换为以fips作为值的县名上键的字典。然后使用它来map initial_df中的county字段。
mapping = {k: v for k, v in zip(*intermediate_df.values())}
df_final = pd.DataFrame(initial_df)
df_final['fips'] = df_final['county'].map(mapping)
>>> df_final
county values fips
0 REAGAN 508 48383
1 UPTON 364 48461
2 HARDEMAN 26 47069
3 UPTON 870 48461https://stackoverflow.com/questions/52396612
复制相似问题