因此,我有以下按报告国和伙伴国分列的跟踪进出口的贸易流动数据集。在删除了一些不需要的列后,我编辑了我的数据框架,以便显示国家A和国家B之间的贸易流动。我只剩下这样的东西:
我的问题是,我希望能够计算每个伙伴国(“partner_code”)的平均进出口,但当我运行以下程序时:
X= df[(df.location_code.isin("IRN")) & df.partner_code.isin('TCD')] 分组= x.groupby('partner_code').mean()
最后,我得到了所有出口的平均值除以所有存在“product_id”(所以数量要高得多)的实例,而不是所有年份的平均进口或出口总额。
以下列5项出口价值的平均数计算出不正确的平均数:
发布于 2021-02-04 09:09:53
在熊猫,我们可以groupby多个专栏,根据我的理解,您想要分组按伙伴,国家和年份。
以下一行将起作用:
df = df.groupby(['partner_code', 'location_code', 'year'])['import_value', 'export_value'].mean()请注意,得到的数据是有MultiIndex索引的。供参考,正式文档:文档
https://stackoverflow.com/questions/66005217
复制相似问题