这是一个数据框架,它显示了一些信息,如计数、平均数、std和一些百分位数。请您解释一下实际如何使用这些数据来理解df/a系列。
losses wins year
count 8.000000 8.000000 8.000000
mean 6.625000 9.375000 2011.125000
std 3.377975 3.377975 0.834523
min 1.000000 4.000000 2010.000000
25% 5.000000 7.500000 2010.750000
50% 6.000000 10.000000 2011.000000
75% 8.500000 11.000000 2012.000000有人能解释一下每一个计数,平均值,std,min,.&,这些百分位数是如何用来理解数据的吗?
发布于 2016-05-01 10:20:57
这些是一些统计数据,对数据分布的性质提供了一些看法。
mean是分布的平均值,也是“期望”值。平均来说,你会期望得到这个号码。std告诉您数据相对于mean的波动有多大。具体来说,它是mean与mean的平方偏差。50%也是中间值,它与mean的不同给出了分布倾斜的信息。这也是平均值的另一个定义,它对数据中的异常值是稳健的。25% & 75%给出了关于峰度的观点。此外,所有百分位数通常对异常值更有鲁棒性。min,max,max - min,75% - 25%都是关于数据相对于mean的波动有多大的透视图的替代品。count这个数字越大,所有统计数据的可信度就越高。https://stackoverflow.com/questions/36964155
复制相似问题