使用python的Pandas库,Dataframe.describe()函数打印数据集的标准偏差。但是,文档页面没有指定这个标准差是“未校正”标准差还是“校正的”标准偏差。
有人能告诉我它还回哪一个吗?
发布于 2014-09-08 06:53:39
这是校正后的样品标准差。
您可以通过一个简单的系列并应用以下公式来说服自己:
In [11]: s = pd.Series([1, 2])
In [12]: s.std()
Out[12]: 0.70710678118654757
In [13]: from math import sqrt
....: sqrt(0.5)
Out[13]: 0.7071067811865476校正样品标准差的公式:
In [14]: sqrt(1./(len(s)-1) * ((s - s.mean()) ** 2).sum())
Out[14]: 0.7071067811865476发布于 2014-09-08 06:53:33
得到DataFrame.describe() Series.std()的标准差。作为这些文件告诉我们,
在所要求的轴上返回无偏标准差。 默认情况下由N1标准化.这可以使用ddof参数进行更改。
因此,describe()返回的标准偏差实际上是“校正样本标准差”。
https://stackoverflow.com/questions/25718228
复制相似问题