伙计们!
我有一个具有大量客户行为特性的数据集,输出被“搅动”/“不搅动”。我应用了一个简单的随机森林分类器,并取得了良好的性能。
有了这个,我可以预测给定的用户是否会流失。但是,我需要理解的是,在被搅动的用户之间是什么模式,以及在非流失用户中的模式是什么。我怎样才能做到这一点?(在这里,我可以展示这样的东西:“通常情况下,那些搅乱的用户会做这个、那个和那个”)
PS:不需要一个完整的解释,如果你能给我一些学习的方向,我会很高兴的,这样我才能获得这些知识。
事先非常感谢!
发布于 2016-03-25 16:20:07
几个好的选择是看看你的射频模型的特征/可变重要度图。或者,根据模型的不同,您可以尝试从模型中提取几棵树并对它们进行检查。然而,这些方法并不是确定的;也就是说,确定哪些变量是对搅动的强预测因素并不意味着它们对搅动有因果影响,单个树可能是有偏见的,不代表RF模型提出的聚合输出。要确定因果关系,可以使用这些方法作为设计测试的起点。
https://datascience.stackexchange.com/questions/10893
复制相似问题