我正在研究一个机器学习问题。目标是预测客户是否会签署合同,以及他需要多长时间才能签署合同。
因此,我计划如何处理它: 1-训练第一个模型进行分类预测,预测积极的模型。2-仅针对实际签订合同的客户训练二次回归模型,并预测他们的响应时间。3-使用第一个模型,预测正类4-使用第二个模型,预测时间目标,仅基于预测为正的时间目标。
请告诉我我的方法是否正确,我是否引入了任何偏见?是否有任何已知的方法来处理此类问题。
非常感谢。
发布于 2019-02-02 23:06:37
我相信你的方法是正确的,因为对于那些没有登录的人来说,包括登录时间是没有意义的。事实上,如果您将它们包含在回归中,您甚至无法为它们分配任何有意义的目标值。例如,如果您指定0作为他们的登录时间,这意味着他们比实际登录的人更渴望登录,这是荒谬的。如果你给它们赋了一个很大的值,你的模型将会不必要地强调它们,并且不会有很好的表现。
https://stackoverflow.com/questions/54492962
复制相似问题