首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >对数据框列使用map()时的InvalidIndexError

对数据框列使用map()时的InvalidIndexError
EN

Stack Overflow用户
提问于 2021-03-25 01:17:49
回答 1查看 50关注 0票数 0

当我尝试连接两个数据帧时,我得到了错误pandas.errors.InvalidIndexError: Reindexing only valid with uniquely valued Index objects。我认为这个问题存在于我将一列映射到另一列的代码中的某个地方。

代码语言:javascript
复制
mapping_g = {'Hospice' : ['ALLCARE', 'CARING EDGE MINOT', 'CARING EDGE HERMANTOWN', 'CARING EDGE BISMARK', 'BLUEBIRD HOSPICE', 'DOCTORS HOSPICE', \
    'FIRST CHOICE HOSPICE', 'KEYSTONE HOSPICE' , 'JOURNEY\'S HOSPICE', 'LIGHTHOUSE HOSPICE', 'SALMON VALLEY HOSPICE'] ,'Group': ['ACH1507', \
    'CE11507', 'CE21507', 'CE51507', 'BBH1507', 'DOC1507', 'FCH1507', 'KEY1507', 'JOU1507', 'LHH1507', 'SVH1507']}

g_mapping_df = pd.DataFrame(data=mapping_g)
g = dict(zip(g_mapping_df.Group, g_mapping_df.Hospice))
raw_pbm_data['Name Of Hospice'] = raw_pbm_data['GroupID'].map(g)

combined_data = pd.concat([raw_direct_data,raw_pbm_data], axis=0, ignore_index=True)

我认为这与我在倒数第二行中将GroupID列放入收容所列的名称中有关。

EN

回答 1

Stack Overflow用户

发布于 2021-03-25 01:36:18

意识到raw_pbm_data['Name Of Hospice'] = raw_pbm_data['GroupID'].map(g)实际上应该是raw_pbm_data['HospiceName'] = raw_pbm_data['GroupID'].map(g)

我正在处理一堆不同的Excel文件,所有的列名都略有不同,但都是相似的。我不能手动重命名Excel文件,因为它们的格式是我的雇主希望它们的格式,所以我正在处理数据帧中的信息。因此,上面的更改解决了我的问题,因为它只是将一个新列添加到dataframe上,而不是替换现有的列,我认为这对于连接中断的原因是有意义的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66786079

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档