首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何正确发现熊猫的偏度和峰度?

如何正确发现熊猫的偏度和峰度?
EN

Stack Overflow用户
提问于 2019-06-26 00:08:23
回答 2查看 7.5K关注 0票数 7

我想知道如何正确计算熊猫的偏度和峰度。Pandas为skew()kurtosis()值提供了一些值,但它们似乎与scipy.stats值有很大不同。相信熊猫和scipy.stats哪个好呢?

下面是我的代码:

代码语言:javascript
复制
import numpy as np
import scipy.stats as stats
import pandas as pd

np.random.seed(100)
x = np.random.normal(size=(20))

kurtosis_scipy = stats.kurtosis(x)
kurtosis_pandas = pd.DataFrame(x).kurtosis()[0]

print(kurtosis_scipy, kurtosis_pandas)
# -0.5270409758168872
# -0.31467107631025604

skew_scipy = stats.skew(x)
skew_pandas = pd.DataFrame(x).skew()[0]

print(skew_scipy, skew_pandas)
# -0.41070929017558555
# -0.44478877631598901

版本:

代码语言:javascript
复制
print(np.__version__, pd.__version__, scipy.__version__)
1.11.0 0.20.0 0.19.0
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-06-26 00:14:47

bias=False

代码语言:javascript
复制
print(
    stats.kurtosis(x, bias=False), pd.DataFrame(x).kurtosis()[0],
    stats.skew(x, bias=False), pd.DataFrame(x).skew()[0],
    sep='\n'
)

-0.31467107631025515
-0.31467107631025604
-0.4447887763159889
-0.444788776315989
票数 8
EN

Stack Overflow用户

发布于 2019-06-26 01:53:44

熊猫计算种群峰度的无偏估计。在维基百科上查找公式:https://www.wikiwand.com/en/Kurtosis

从头开始计算峰度

代码语言:javascript
复制
import numpy as np
import pandas as pd
import scipy

x = np.array([0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0,
              2, 2, 3, 2, 5, 2, 3, 999])
xbar = np.mean(x)
n = x.size
k2 = x.var(ddof=1) # default numpy is biased, ddof = 0
sum_term = ((x-xbar)**4).sum()
factor = (n+1) * n / (n-1) / (n-2) / (n-3)
second = - 3 * (n-1) * (n-1) / (n-2) / (n-3)

first = factor * sum_term / k2 / k2

G2 = first + second
G2 # 19.998428728659768

使用numpy/scipy计算峰度

代码语言:javascript
复制
scipy.stats.kurtosis(x,bias=False) # 19.998428728659757

使用pandas计算峰度

代码语言:javascript
复制
pd.DataFrame(x).kurtosis() # 19.998429

同样,您也可以计算偏斜度。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56758125

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档