我正在从事开发人员2020调查,我想以某种方式总结一下类似于下面的"DevType“专栏
Developer, full-stack 4424
Developer, back-end 3086
Developer, back-end;Developer, front-end;Developer, full-stack 2227
Developer, back-end;Developer, full-stack 1476
Developer, front-end 1401
Developer, mobile 1251
Developer, front-end;Developer, full-stack 830
Developer, back-end;Developer, desktop or enterprise applications;Developer, front-end;Developer, full-stack 813
Developer, back-end;Developer, desktop or enterprise applications 650
Developer, desktop or enterprise applications 606
Name: DevType, dtype: int64.我想先对它进行分析,所以我想把这些标题总结成更短的/紧凑的名称,这样它们就可以在图表上显示出来。然后,我希望以某种方式为本专栏分配编号(我以为我会做dfuk"#DevType"=dfuk"DevType".apply(lambda :len(str(X).split(‘;’),但这不是一个很好的解决方案。
请帮我找出解决这些问题的办法,并提前感谢你!
发布于 2021-03-22 06:59:23
我建议:
分配一个数字。
关于最后一点,请参阅本文:Pandas: convert categories to numbers
https://stackoverflow.com/questions/66737239
复制相似问题