我有数据,我绘制了一个正态分布和QQ图。我想知道,特别是在QQ情节中,95.4%的数据似乎是正态分布的。
我的问题是,在QQ情节中,2西格玛以上的数字意味着什么?应该删除它们吗?还是我需要转换这个变量,使它更加正态分布?


发布于 2019-08-31 16:43:27
正态分布是数据的理论模型。经验数据的分布可以与正态分布更为相似,也可以与正态分布更为不同。
这一经验数据与理论正态分布有几个显著差异:
根据您的目标,您可以选择一个更好的模型或转换数据以适应正态分布模型。权力分配可能是一个更好的数据模型。如果希望转换数据以更好地适应正态分布,可以删除异常值,然后应用日志转换。
https://datascience.stackexchange.com/questions/58472
复制相似问题