首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >历史数据会导致目标泄漏吗?

历史数据会导致目标泄漏吗?
EN

Data Science用户
提问于 2019-09-23 08:58:16
回答 1查看 122关注 0票数 1

我在打造一个员工流失模型。我有2016年至2019年的员工数据(留任/离开公司的员工),我的目标是从2016年到2018年使用数据进行培训,并预测2019年。

由于2016-2019年间有很多员工没有离开公司,所以我的培训集是:2018年的数据是关于没有离开公司的员工的数据,他们在2016/2017/2018年期间离开了公司,以便在培训数据集中只有一个人。

我的问题

  • 只有2016/2017年离开的人会导致目标泄漏吗?
  • 我不使用时间假人,但我的模型是否过于合适,认为员工更有可能在2016-2017年离开公司,因为这是他们经常看到的?
  • 如果是这样,我怎样才能避免这个问题?

谢谢:)!

EN

回答 1

Data Science用户

发布于 2019-09-23 09:45:07

我会忽略你的问题。在我看来,这听起来像是你有一个数据集,其中基本上包含了员工的开始日期和“结束日期”,或者如果员工仍然在为您工作,则没有结束日期。这听起来像是一种叫做“生存回归”或“生存分析”的回归技术的标准案例。我建议你调查一下。

现在,对于你的问题,我不太确定目标泄漏,因为我不太清楚,如果你的雇员结构每年都有变化,那么肯定会有一些泄漏,是的。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/60629

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档