文章/答案/技术大牛

发布

社区首页 >问答首页 >R预测模型预测预测和倾向的原因%

问R预测模型预测预测和倾向的原因%
EN

Stack Overflow用户

提问于 2016-09-21 16:29:45

回答 1查看 232关注 0票数 1

然而，我对R和机器学习非常陌生，我必须进行一个项目，根据许多变量e.e来预测客户流失。服务年限、开出的贷方票据数量、错过交货的次数、提价次数等。

我正在使用rpart和随机森林，并获得了一个数据集，其中每个数据集都有一个流失预测。我能够生成一个置信度矩阵，并查看哪些是重要的指标。然而，输出的目的是作为要处理的“风险”客户列表发送给销售团队。

真正重要的是将信心/倾向/喜欢度%附加到流失中，以便我可以按风险顺序进行排名，但同时，是否有一种方法可以为每个客户添加类别/摘要/原因，说明为什么他们被预测会流失-即客户abc -价格上涨，因此我们需要小心定价。客户对未交货的清晰度很高，需要修复我们的服务吗？

非常感谢你的帮助。

发布于 2016-09-21 16:52:48

如果你想预测流失的概率，你可以训练一个逻辑回归模型，并用该模型来预测流失概率。您还可以找出导致客户流失的重要预测变量(请参阅http://www.duplication.net.au/ANZMAC09/papers/ANZMAC2009-678.pdf)，您可以使用anova连同它一起查找由重要预测变量解释的方差。
如果您想要找到特定客户流失发生的原因，您可以学习决策树(购物车/零件)模型，然后在决策树中遵循从根到客户所属的叶节点的路径。randomForest集成分类器可用于根据OOB错误估计来查找最重要的流失预测器。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/39611286

复制

相似问题

问R预测模型预测预测和倾向的原因%EN