当我尝试连接两个数据帧时,我得到了错误pandas.errors.InvalidIndexError: Reindexing only valid with uniquely valued Index objects。我认为这个问题存在于我将一列映射到另一列的代码中的某个地方。
mapping_g = {'Hospice' : ['ALLCARE', 'CARING EDGE MINOT', 'CARING EDGE HERMANTOWN', 'CARING EDGE BISMARK', 'BLUEBIRD HOSPICE', 'DOCTORS HOSPICE', \
'FIRST CHOICE HOSPICE', 'KEYSTONE HOSPICE' , 'JOURNEY\'S HOSPICE', 'LIGHTHOUSE HOSPICE', 'SALMON VALLEY HOSPICE'] ,'Group': ['ACH1507', \
'CE11507', 'CE21507', 'CE51507', 'BBH1507', 'DOC1507', 'FCH1507', 'KEY1507', 'JOU1507', 'LHH1507', 'SVH1507']}
g_mapping_df = pd.DataFrame(data=mapping_g)
g = dict(zip(g_mapping_df.Group, g_mapping_df.Hospice))
raw_pbm_data['Name Of Hospice'] = raw_pbm_data['GroupID'].map(g)
combined_data = pd.concat([raw_direct_data,raw_pbm_data], axis=0, ignore_index=True)我认为这与我在倒数第二行中将GroupID列放入收容所列的名称中有关。
发布于 2021-03-25 01:36:18
意识到raw_pbm_data['Name Of Hospice'] = raw_pbm_data['GroupID'].map(g)实际上应该是raw_pbm_data['HospiceName'] = raw_pbm_data['GroupID'].map(g)
我正在处理一堆不同的Excel文件,所有的列名都略有不同,但都是相似的。我不能手动重命名Excel文件,因为它们的格式是我的雇主希望它们的格式,所以我正在处理数据帧中的信息。因此,上面的更改解决了我的问题,因为它只是将一个新列添加到dataframe上,而不是替换现有的列,我认为这对于连接中断的原因是有意义的。
https://stackoverflow.com/questions/66786079
复制相似问题