我有一个玩家玩的游戏。D7保留是指安装了我的游戏的玩家的百分比,7天后,他们就玩了我的游戏。
现在我正在做分析,它显示只有10%的玩家在第7天玩我的游戏,我显着地改变了游戏的难度并收集了分析数据。数据显示,现在的D7是15%。
我是否可以得出结论,D7变化是由困难变化引起的,或者这是相关性不是因果关系的例子之一?以及我如何识别我是否能想到因果关系。
物理学家,心理学家在实验中做了很多这样的事情。固定所有参数变化一个,观察行为变化并得出结论。什么是正确的方法来处理这个问题?
发布于 2019-08-18 17:36:53
因果关系的概念有点棘手。你(通常)不能对此进行测试。你需要拿出一个基于理论的想法来解释事物是如何运作的,比如,如果商品的价格上涨,需求就会下降。在经验应用程序中,您需要考虑其他因素对需求的影响,这样您就不会忽略数据生成过程的重要方面。
当我读到你的描述时,你似乎有一个很好的机会来区分困难中的变化的因果效应。这似乎是"差别化“(DiD)的经典示例。唯一的问题可能是你改变了所有球员的困难,所以你需要看看如何处理这个问题。
我想到的另一件事是,从本质上看存活率(X天后),这将是"生存分析“的一个任务。
作为一种(或多或少)天真的方法,我要说你的方法是正确的。但是,要确保你能控制任何你能控制的东西,比如玩家的特征(因为现在和过去不同的人玩你的游戏是可能的)。
所以当你有
y = \beta X + \gamma d + u,
如果y是D7,X是关于玩家的任何知识,而d是困难的(0困难,1较少困难),那么您应该得到一个或多或少的好主意,将d=0转换为d=1对y的作用。当您使用OLS (线性回归)时,系数\gamma应该直接给出变化。但请记住,这或多或少是一种天真的方法(这应该会给出“好的”结果)。
https://datascience.stackexchange.com/questions/57745
复制相似问题