首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >熊猫中的许多职位相互分离

熊猫中的许多职位相互分离
EN

Stack Overflow用户
提问于 2021-03-21 20:34:37
回答 1查看 72关注 0票数 0

我正在从事开发人员2020调查,我想以某种方式总结一下类似于下面的"DevType“专栏

代码语言:javascript
复制
Developer, full-stack                                                                                           4424
Developer, back-end                                                                                             3086
Developer, back-end;Developer, front-end;Developer, full-stack                                                  2227
Developer, back-end;Developer, full-stack                                                                       1476
Developer, front-end                                                                                            1401
Developer, mobile                                                                                               1251
Developer, front-end;Developer, full-stack                                                                       830
Developer, back-end;Developer, desktop or enterprise applications;Developer, front-end;Developer, full-stack     813
Developer, back-end;Developer, desktop or enterprise applications                                                650
Developer, desktop or enterprise applications                                                                    606
Name: DevType, dtype: int64.

我想先对它进行分析,所以我想把这些标题总结成更短的/紧凑的名称,这样它们就可以在图表上显示出来。然后,我希望以某种方式为本专栏分配编号(我以为我会做dfuk"#DevType"=dfuk"DevType".apply(lambda :len(str(X).split(‘;’),但这不是一个很好的解决方案。

请帮我找出解决这些问题的办法,并提前感谢你!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-03-22 06:59:23

我建议:

  • 完全删除了"developer“这个词,这在任何地方都是不必要的,因为您在这里处理的域是毫无疑问的;如果剩余的名称仍然太长,
  • 会取每个单词的第一个字母('fs‘表示’完整堆栈‘);
  • 使用pd.Categorical为每种类型的dev.

分配一个数字。

关于最后一点,请参阅本文:Pandas: convert categories to numbers

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66737239

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档