我在打造一个员工流失模型。我有2016年至2019年的员工数据(留任/离开公司的员工),我的目标是从2016年到2018年使用数据进行培训,并预测2019年。
由于2016-2019年间有很多员工没有离开公司,所以我的培训集是:2018年的数据是关于没有离开公司的员工的数据,他们在2016/2017/2018年期间离开了公司,以便在培训数据集中只有一个人。
我的问题
谢谢:)!
发布于 2019-09-23 09:45:07
我会忽略你的问题。在我看来,这听起来像是你有一个数据集,其中基本上包含了员工的开始日期和“结束日期”,或者如果员工仍然在为您工作,则没有结束日期。这听起来像是一种叫做“生存回归”或“生存分析”的回归技术的标准案例。我建议你调查一下。
现在,对于你的问题,我不太确定目标泄漏,因为我不太清楚,如果你的雇员结构每年都有变化,那么肯定会有一些泄漏,是的。
https://datascience.stackexchange.com/questions/60629
复制相似问题