pandas.pivot_table的示例显示了针对行和列计算的合计,但对于me,合计仅针对行进行计算。
我可以在此设置中使用不同的DataFrames重现此行为:
Ubuntu 18.04,Python 3.6.7,Pandas 0.24.2
import pandas
df = pandas.DataFrame([
["sec", "2019-01", 1],
["sec", "2019-02", 2],
["maint","2019-02", 1],
["maint","2019-03",3]
])
print(df)
# If not passing arguments as lists, behavior is essentially the same
p = df.pivot_table(
index=[0], columns=[1], values=[2],
aggfunc="sum", fill_value=0.,
margins=True
)
print(p)输出:
0 1 2
0 sec 2019-01 1
1 sec 2019-02 2
2 maint 2019-02 1
3 maint 2019-03 3
2
1 2019-01 2019-02 2019-03 All
0
maint 0 1 3 4
sec 1 2 0 3
All 0 0 0 7正如您在最后一行中看到的,聚合没有应用于列(除了最后一列),值仅为0。
正如许多示例所建议的那样,我原本期望pivot_table会产生这样的结果:
2
1 2019-01 2019-02 2019-03 All
0
maint 0 1 3 4
sec 1 2 0 3
All 1 3 3 7我做错了什么或理解错了什么吗?或者这可能是一个bug?
发布于 2019-05-30 00:46:58
这是pandas中的一个错误,它只出现在数字列和margins=True中。解决方法是将数字列名临时转换为字符串:
In [1]: import pandas as pd; pd.__version__
Out[1]: '0.24.2'
In [2]: df = pd.DataFrame([
...: ["sec", "2019-01", 1],
...: ["sec", "2019-02", 2],
...: ["maint","2019-02", 1],
...: ["maint","2019-03",3]])
In [3]: # wrong output with numeric columns
...: df.pivot_table(index=[0], columns=[1], values=[2],
...: aggfunc="sum", fill_value=0., margins=True)
Out[3]:
2
1 2019-01 2019-02 2019-03 All
0
maint 0 1 3 4
sec 1 2 0 3
All 0 0 0 7
In [4]: # correct output with string columns
...: df.columns = df.columns.map(str)
...: df.pivot_table(index=['0'], columns=['1'], values=['2'],
...: aggfunc="sum", fill_value=0., margins=True)
Out[4]:
2
1 2019-01 2019-02 2019-03 All
0
maint 0 1 3 4
sec 1 2 0 3
All 1 3 3 7https://stackoverflow.com/questions/56359196
复制相似问题