我希望开发一个机器学习模型来预测员工的业绩(例如,员工ID 12345下个月将销售15种保险产品)。我不想将员工ID输入培训数据集,因为它会扭曲结果。然而,我确实需要能够将每一名工作人员与他们预测的业绩联系起来,一旦模型开始运作。
这样做的唯一方法是开发排除人员细节的模型,然后预测传递数据w/o人员ID,然后通过索引/实例顺序将模型输出与人员详细信息关联起来吗?
这似乎是一种周全的方法。
发布于 2022-04-08 15:55:29
我也这么想。这也是我唯一能想到的办法。因为您需要知道,您不应该将员工ID作为培训数据包含在您的培训模型中。
由于您已经使用了Pandas模块,您可以通过使用DataFrame轻松地搜索您想要的工作人员。别担心。我认为这是一种非常简单和快速的方法,可以将您的预测映射回员工ID。
很抱歉没有提供一个新的更好的方法。但是我不认为你需要担心现有的解决方案,因为我不能想到任何像运行时这样的坏效果。希望这对你有帮助。
https://stackoverflow.com/questions/71795286
复制相似问题