文章/答案/技术大牛

发布

社区首页 >问答首页 >如何使用groupby函数计算列的四分位统计量？

问如何使用groupby函数计算列的四分位统计量？
EN

Stack Overflow用户

提问于 2022-08-11 18:57:00

回答 2查看 135关注 0票数 1

我每隔1分钟就有数据，我希望将粒度更改为5分钟，并使用这样的.groupby计算基本数据统计数据：

   df2 = df1.groupby(pd.Grouper(freq='5Min',closed='right',label='right')).agg({
                                        "value1":  "mean", "value2": "max",
                                        "value3": "quantile"})

我也想得到四分位数/分位数数据，但不能指定特定的分位点。缺省值为50分位数。如何获得value3的第75分位数？

python

pandas

dataframe

group-by

回答 2

Stack Overflow用户

回答已采纳

发布于 2022-08-11 22:13:05

传递给agg的值不必是字符串:它们可以是其他函数。您可以定义一个自定义函数，例如

def q75(series):
    return series.quantile(0.75)

然后把这个传递给agg，就像

   df2 = df1.groupby(pd.Grouper(freq='5Min',closed='right',label='right')).agg({
                                        "value1":  "mean", "value2": "max",
                                        "value3": q75})

您甚至可以通过在列表中传递相同的属性来计算多个数量：

df2 = df1.groupby(pd.Grouper(freq='5Min', closed='right', label='right')).agg({
    "value1": "mean", "value2": "max", "value3": [q25, q50, q75]})

票数 1

Stack Overflow用户

发布于 2022-08-11 19:45:49

您可以使用groupby.quantile函数。您将能够指定确切的分位数，甚至可以选择类型的插值。我不确定是否有可能一步到位地完成每一件事。您可能需要单独执行，然后将带有四分位数的列附加到df中。

链接到文档：https://pandas.pydata.org/docs/reference/api/pandas.core.groupby.DataFrameGroupBy.quantile.html

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/73325649

复制

相似问题

问如何使用groupby函数计算列的四分位统计量？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用groupby函数计算列的四分位统计量？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用groupby函数计算列的四分位统计量？
EN