然而,我对R和机器学习非常陌生,我必须进行一个项目,根据许多变量e.e来预测客户流失。服务年限、开出的贷方票据数量、错过交货的次数、提价次数等。
我正在使用rpart和随机森林,并获得了一个数据集,其中每个数据集都有一个流失预测。我能够生成一个置信度矩阵,并查看哪些是重要的指标。然而,输出的目的是作为要处理的“风险”客户列表发送给销售团队。
真正重要的是将信心/倾向/喜欢度%附加到流失中,以便我可以按风险顺序进行排名,但同时,是否有一种方法可以为每个客户添加类别/摘要/原因,说明为什么他们被预测会流失-即客户abc -价格上涨,因此我们需要小心定价。客户对未交货的清晰度很高,需要修复我们的服务吗?
非常感谢你的帮助。
发布于 2016-09-21 16:52:48
https://stackoverflow.com/questions/39611286
复制相似问题