首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >.std() & .skew()用.rolling给出错误的答案

.std() & .skew()用.rolling给出错误的答案
EN

Stack Overflow用户
提问于 2018-08-20 17:02:06
回答 1查看 1K关注 0票数 4

我用的是熊猫版本:“0.23.4”

在调试我的代码时,我意识到,std和斜交没有给出正确的滚动窗口结果。检查下面的代码:

代码语言:javascript
复制
import pandas as pd
import numpy as np
import scipy.stats as sp

df = pd.DataFrame(np.random.randint(1,10,(5)))
df_w = df.rolling(window=3, min_periods=1)

m1 = df_w.apply(lambda x: np.mean(x))
m2 = df_w.mean()

s1 = df_w.apply(lambda x: np.std(x))
s2 = df_w.std()

sk1 = df_w.apply(lambda x: sp.skew(x))
sk2 = df_w.skew()

虽然平均值的结果是相同的,但对性病和斜率没有?这是预期的行为还是我遗漏了什么?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-08-20 17:14:43

差别在于指定的增量自由度。

Numpy使用ddof 默认为0,而熊猫使用ddof 作为缺省值为1。此值影响计算std的方式(具体而言,如何将其规范化,例如参考这里)

如果将两者都指定为0,则结果是相同的。

代码语言:javascript
复制
s1 = df_w.apply(lambda k: np.std(k, ddof=0), raw=True)
s2 = df_w.std(ddof=0)

>>> (s1==s2).all()
True

同样,对于skew,熊猫计算偏度,而scipy 计算偏倚。计算

因此,要获得相同的结果,只需在bias=False中指定scipy

代码语言:javascript
复制
sk1 = df_w.apply(lambda x: sp.skew(x, bias=False))
sk2 = df_w.skew()

>>> (sk1==sk2).all()
True
票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51935456

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档