我有一只熊猫数据,combined_copy,它有一个专栏,job_industry_category有多个类别。我想使用一个映射函数来将这些类别限制在前3类的分布中,其余的是另一个类别。我打算使用数字数字如下:
combined_copy['job_industry_category'].map({'Manufacturing' : 0, 'Financial Services' : 1, 'Health' : 2})
我需要帮助,如何将所有其他剩余的类别映射到一个类别3,作为一个类别。
本栏的所有类别如下:“制造业”、“金融服务”、“未指明”、“健康”、“零售”、“地产”、“IT”、“娱乐”、“农业”、“电讯”
我尝试使用na_action参数:
combined_copy['job_industry_category'].map({'Manufacturing' : 0, 'Financial Services' : 1, 'Health' : 2}, na_action={None : 3})
但另一类则以NaNs的形式出现。请帮忙。
发布于 2022-11-09 14:12:45
我们可以使用映射函数
>>> def com_map(x):
... if x=='Manufacturing':
... return 0
... else:
... return 3
...内部映射函数
df['j_i_c'].map(com_map)https://stackoverflow.com/questions/74376042
复制相似问题