首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >为什么pandas.pivot_table中的margins=True只能在一个维度上计算总数?

为什么pandas.pivot_table中的margins=True只能在一个维度上计算总数?
EN

Stack Overflow用户
提问于 2019-05-29 19:10:04
回答 1查看 298关注 0票数 2

pandas.pivot_table的示例显示了针对行和列计算的合计,但对于me,合计仅针对行进行计算。

我可以在此设置中使用不同的DataFrames重现此行为:

Ubuntu 18.04,Python 3.6.7,Pandas 0.24.2

代码语言:javascript
复制
import pandas
df = pandas.DataFrame([
    ["sec", "2019-01", 1], 
    ["sec", "2019-02", 2], 
    ["maint","2019-02", 1], 
    ["maint","2019-03",3]
])
print(df)
# If not passing arguments as lists, behavior is essentially the same
p = df.pivot_table(
    index=[0], columns=[1], values=[2], 
    aggfunc="sum", fill_value=0., 
    margins=True
)
print(p)

输出:

代码语言:javascript
复制
       0        1  2
0    sec  2019-01  1
1    sec  2019-02  2
2  maint  2019-02  1
3  maint  2019-03  3

            2                    
1     2019-01 2019-02 2019-03 All
0                                
maint       0       1       3   4
sec         1       2       0   3
All         0       0       0   7

正如您在最后一行中看到的,聚合没有应用于列(除了最后一列),值仅为0。

正如许多示例所建议的那样,我原本期望pivot_table会产生这样的结果:

代码语言:javascript
复制
            2                    
1     2019-01 2019-02 2019-03 All
0                                
maint       0       1       3   4
sec         1       2       0   3
All         1       3       3   7

我做错了什么或理解错了什么吗?或者这可能是一个bug?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-05-30 00:46:58

这是pandas中的一个错误,它只出现在数字列和margins=True中。解决方法是将数字列名临时转换为字符串:

代码语言:javascript
复制
In [1]: import pandas as pd; pd.__version__
Out[1]: '0.24.2'

In [2]: df = pd.DataFrame([
   ...:     ["sec", "2019-01", 1],
   ...:     ["sec", "2019-02", 2],
   ...:     ["maint","2019-02", 1],
   ...:     ["maint","2019-03",3]])

In [3]: # wrong output with numeric columns
   ...: df.pivot_table(index=[0], columns=[1], values=[2],
   ...:                aggfunc="sum", fill_value=0., margins=True)
Out[3]:
            2
1     2019-01 2019-02 2019-03 All
0
maint       0       1       3   4
sec         1       2       0   3
All         0       0       0   7

In [4]: # correct output with string columns
   ...: df.columns = df.columns.map(str)
   ...: df.pivot_table(index=['0'], columns=['1'], values=['2'],
   ...:                aggfunc="sum", fill_value=0., margins=True)
Out[4]:
            2
1     2019-01 2019-02 2019-03 All
0
maint       0       1       3   4
sec         1       2       0   3
All         1       3       3   7
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56359196

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档