我有一份清单如下。
[['Andrew', '1', '9'], ['Peter', '1', '10'], ['Andrew', '1', '8'], ['Peter', '1', '11'], ['Sam', '4', '9'], ['Andrew', '2', '2']]我想总结按其他columns.The结果分组的最后一列,如下所示
[['Andrew', '1', '17'], ['Peter', '1', '21'], ['Sam', '4', '9'], ['Andrew', '2', '2']]这仍然是一份名单。
在实际的实践中,我总是想总结最后一列被许多其他列分组。有什么方法可以用Python来完成吗?非常感谢。
发布于 2018-03-28 13:51:11
除最后一列外,按所有列动态分组:
In [24]: df = pd.DataFrame(data)
In [25]: df.groupby(df.columns[:-1].tolist(), as_index=False).agg(lambda x: x.astype(int).sum()).values.tolist()
Out[25]: [['Andrew', '1', 17], ['Andrew', '2', 2], ['Peter', '1', 21], ['Sam', '4', 9]]发布于 2018-03-28 13:55:43
这是一个通过collections.defaultdict的O(n)解决方案,适用于任意数量的键。
如果您想要的输出是一个列表,那么这可能比通过Pandas的解决方案更好,因为Pandas需要对非标准类型进行转换。
from collections import defaultdict
lst = [['Andrew', '1', '9'], ['Peter', '1', '10'], ['Andrew', '1', '8'],
['Peter', '1', '11'], ['Sam', '4', '9'], ['Andrew', '2', '2']]
d = defaultdict(int)
for *keys, val in lst:
d[tuple(keys)] += int(val)
res = [[*k, v] for k, v in sorted(d.items())]结果
[['Andrew', '1', 17], ['Andrew', '2', 2], ['Peter', '1', 21], ['Sam', '4', 9]]解释
defaultdict中。发布于 2018-03-28 13:54:03
Op1
您可以传递一个索引sum并将收费列表转换回列表。
pd.DataFrame(L).\
set_index([0,1])[2].astype(int).sum(level=[0,1]).\
reset_index().values.tolist()
Out[78]: [['Andrew', '1', 17], ['Peter', '1', 21], ['Sam', '4', 9], ['Andrew', '2', 2]]Op2
对于列表列表,您可以使用来自groupby的itertools
from itertools import groupby
[k+[sum(int(v) for _,_, v in g)] for k, g in groupby(sorted(l), key = lambda x: [x[0],x[1]])]
Out[98]: [['Andrew', '1', 17], ['Andrew', '2', 2], ['Peter', '1', 21], ['Sam', '4', 9]]https://stackoverflow.com/questions/49536332
复制相似问题