首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用groupby函数计算列的四分位统计量?

如何使用groupby函数计算列的四分位统计量?
EN

Stack Overflow用户
提问于 2022-08-11 18:57:00
回答 2查看 135关注 0票数 1

我每隔1分钟就有数据,我希望将粒度更改为5分钟,并使用这样的.groupby计算基本数据统计数据:

代码语言:javascript
复制
   df2 = df1.groupby(pd.Grouper(freq='5Min',closed='right',label='right')).agg({
                                        "value1":  "mean", "value2": "max",
                                        "value3": "quantile"})

我也想得到四分位数/分位数数据,但不能指定特定的分位点。缺省值为50分位数。如何获得value3的第75分位数?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2022-08-11 22:13:05

传递给agg的值不必是字符串:它们可以是其他函数。您可以定义一个自定义函数,例如

代码语言:javascript
复制
def q75(series):
    return series.quantile(0.75)

然后把这个传递给agg,就像

代码语言:javascript
复制
   df2 = df1.groupby(pd.Grouper(freq='5Min',closed='right',label='right')).agg({
                                        "value1":  "mean", "value2": "max",
                                        "value3": q75})

您甚至可以通过在列表中传递相同的属性来计算多个数量:

代码语言:javascript
复制
df2 = df1.groupby(pd.Grouper(freq='5Min', closed='right', label='right')).agg({
    "value1": "mean", "value2": "max", "value3": [q25, q50, q75]})
票数 1
EN

Stack Overflow用户

发布于 2022-08-11 19:45:49

您可以使用groupby.quantile函数。您将能够指定确切的分位数,甚至可以选择类型的插值。我不确定是否有可能一步到位地完成每一件事。您可能需要单独执行,然后将带有四分位数的列附加到df中。

链接到文档:https://pandas.pydata.org/docs/reference/api/pandas.core.groupby.DataFrameGroupBy.quantile.html

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/73325649

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档