我有这样的数据集:
EmployeeID BenefitsType Status YearsInJob
000001 M A 3.1
000002 O T 2.9
000003 N A 5.1
000004 B A 0.9我想将数据绘制为基于不同类别的YearInJob发行版。例如:
plt.figure(figsize=(7,7))
sns.distplot(wk[wk.Benefits=="M"]['Years In Job'], color = "blue", bins=20)
sns.distplot(wk[wk.Benefits=="O"]['Years In Job'], color = "green", bins=20)
sns.distplot(wk[wk.Benefits=="N"]['Years In Job'], color = "red", bins=20)
sns.distplot(wk[wk.Benefits=="B"]['Years In Job'], color = "orange", bins=20)
plt.legend(labels=['Medical','Offset','N','Both'])但是上面的代码考虑了所有的员工。有什么办法区分身份吗?比如仍然在工作的和被解雇的员工的分配?以及如何将其添加到代码中?
我试过了
sns.distplot(wk[wk.Benefits=="M"]['Years In Job'], hue = "Status", color = "blue", bins=20)但结果却是个错误。
有人能帮忙吗?
发布于 2019-11-20 15:37:05
distplot不能使用hue=参数自动拆分数据集,因此,您必须在调用distplot时筛选数据集。
例如:
sns.distplot(wk[(wk.Benefits=="M")&(wk.Status=="A")]['Years In Job'], color = "blue", bins=20)
sns.distplot(wk[(wk.Benefits=="M")&(wk.Status=="T")]['Years In Job'], color = "red", bins=20)https://stackoverflow.com/questions/58957988
复制相似问题