我的任务是想出一种方法,为不同的客户群计划60个月的客户活动。这些分组可以基于多种因素-计划、收购渠道、收购月份等,即最终用户需要使用的任何标准。我边学边学,我认为最好的方法是基于60个月的完整数据,使用回归为几个不同的客户群体开发一个模型。然后,该模型可以应用于最终用户感兴趣的不同客户组。
该模型似乎在大多数情况下都工作得很好,但也有一些群体的购买活动水平不同。例如,我的模型基于客户每月平均花费15美元的数据。然而,有一些客户群体的平均支出为5美元,因此预测结果相差甚远。通常,该模型使用2-3个月的客户组数据运行。
有没有一种方法可以“缩放”系数,以便模型能够很好地针对不同消费水平的不同群体进行预测?这更像是一个统计问题..任何指导都将不胜感激。
发布于 2016-04-08 15:48:09
如果我对您的问题理解正确,您正在使用平均花费为15美元的数据构建回归模型,但现在您试图使用该模型来预测平均花费为5美元的不同群体的结果,而这会打乱您的预测?
发生这种情况的原因是因为您的模型规范是错误的。处理这一问题的正确方法是在构建回归模型时同时包含$15和$5组(即使用所有数据进行训练)。你不应该使用回归在一个群体上进行训练,然后在另一个群体上进行测试,因为你只是将错误的模型应用到了你的目标群体(5美元组)
如果由于某种原因,你不能使用所有感兴趣的组的数据来重建你的模型,你可以尝试的另一件事是用15美元的组来构建一个标准化的模型。我不确定这在实践中有多好用,你必须构建模型并测试它,但它会是这样的:
取你的$15组数据,通过取每个值,减去该变量的平均值,然后除以标准差来标准化预测变量:X_standardized = (X - mean(X))/sd(X)
使用这些标准化的预测值来构建新的回归模型。
一旦你有了新的模型,你想要预测5美元组的值,而不是传递用于预测的原始$5值,你必须首先标准化变量,并传递标准化值。
如果您试图一次预测一个值,并且无法获得足够大的5美元组成员样本来计算平均值和标准差,那么这是行不通的。
https://stackoverflow.com/questions/36414149
复制相似问题