我正在尝试建立一个预测的流失模型,它将识别那些可能会流失的客户。我把一个被搅乱的用户定义为没有在60天内完成交易的人。90%的交易发生在彼此之间的60天内,因此这感觉是合理的。
然而,我的行为数据非常有限。我有一个用户的交易记录,我可以访问谷歌分析(GA)。但是,GA不允许我跟踪用户的具体操作--所有的东西都聚集在整个用户群中。
我建议我们跟踪并保存用户浏览网站、点击按钮、登录时间等的记录,但这已被拒绝,因为这被认为是不必要的,因为我们有Google Analytics。我是不是不讲道理?有什么解决办法吗。我不认为我能够利用用户的地址、年龄和交易等基本信息来建立大量的流失预测模型。
发布于 2019-01-03 11:41:05
你不是不讲道理,但很难知道他们是合理的还是不合理的。如果他们觉得现有的信息量是足够的,从这些信息中可以衍生出许多其他的东西,以及“搅动”的定义是什么,那么遵守它们也是很好的。当然,在网站上跟踪用户行为方面,最好是拥有您正在寻找的数据,但这还不是全部。
搅拌的
这个定义可能会有所不同,您需要问自己如何定义它。
你是否认为某人一旦停止购买X天后,无论他们在网站上做什么,在你的例子60?失败的事务或挂起的事务,如添加到cart但尚未排序的事务,是否计算为搅动?
如果你只考虑某人在60天内没有成功的交易,那么你可以调查很多其他的因素。
也许你已经考虑过这些问题了,但对于未来的观众来说,我还是要补充一下我过去是如何处理这些问题的。
1)客户的平均销售价值
2)订单数量的计算
( 3)他们购买了哪些类别的产品
( 4)客户自第一次订货或开户以来的年龄,或两者兼而有之
5)最后一次订货是什么时候?
以上几点已经表明,你已经或多或少地试图获得客户的最近频率-货币方面的信息。
使用此
1)他们的平均数是多少?
2)个人顾客的购买行为如何?
( 3)这些顾客多久购买一次产品?
4)他们购买的其他相关产品是什么?
5)属于某一特定类别的顾客返回并向该商店下订单的最短和最长的时间
所以,你刚刚从最基本的订单信息中提取了这么多信息。当然,您也可以从这些数据中提取越来越多的数据。然而,这是否足够取决于问题的陈述,数据量,当然还有意见。
https://datascience.stackexchange.com/questions/43422
复制相似问题