我正在做一个使用校园犯罪率作为自变量的项目。数据是高度正向倾斜的。我需要转换数据,以便实现正态分布来运行OLS。然而,我知道如果我做一个对数转换,我将丢失犯罪率为0(表示没有犯罪)的所有实例。其他可能的解决方案是什么?
发布于 2017-03-10 04:04:25
虽然你可以通过计算log(1+rate)之类的东西来避免案例的损失,但不管怎样,非负边界可能会造成麻烦。您可以考虑使用具有对数链接响应尺度的gamma的广义线性模型(分析>广义线性模型)。这也可以处理右偏问题。
但请注意,在OLS回归中,是误差带来了正态性假设,而不是因变量。
https://stackoverflow.com/questions/42674312
复制相似问题