文章/答案/技术大牛

发布

社区首页 >问答首页 >.std() & .skew()用.rolling给出错误的答案

问.std() & .skew()用.rolling给出错误的答案
EN

Stack Overflow用户

提问于 2018-08-20 17:02:06

回答 1查看 1K关注 0票数 4

我用的是熊猫版本：“0.23.4”

在调试我的代码时，我意识到，std和斜交没有给出正确的滚动窗口结果。检查下面的代码：

import pandas as pd
import numpy as np
import scipy.stats as sp

df = pd.DataFrame(np.random.randint(1,10,(5)))
df_w = df.rolling(window=3, min_periods=1)

m1 = df_w.apply(lambda x: np.mean(x))
m2 = df_w.mean()

s1 = df_w.apply(lambda x: np.std(x))
s2 = df_w.std()

sk1 = df_w.apply(lambda x: sp.skew(x))
sk2 = df_w.skew()

虽然平均值的结果是相同的，但对性病和斜率没有？这是预期的行为还是我遗漏了什么？

python

pandas

numpy

scipy

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-08-20 17:14:43

差别在于指定的增量自由度。

Numpy使用ddof 默认为0，而熊猫使用ddof 作为缺省值为1。此值影响计算std的方式(具体而言，如何将其规范化，例如参考这里)

如果将两者都指定为0，则结果是相同的。

s1 = df_w.apply(lambda k: np.std(k, ddof=0), raw=True)
s2 = df_w.std(ddof=0)

>>> (s1==s2).all()
True

同样，对于skew，熊猫计算偏度，而scipy 计算偏倚。计算

因此，要获得相同的结果，只需在bias=False中指定scipy

sk1 = df_w.apply(lambda x: sp.skew(x, bias=False))
sk2 = df_w.skew()

>>> (sk1==sk2).all()
True

票数 5

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/51935456

复制

相似问题

问.std() & .skew()用.rolling给出错误的答案
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问.std() & .skew()用.rolling给出错误的答案EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问.std() & .skew()用.rolling给出错误的答案
EN