我有一个关于高级熊猫的问题。目前,我的数据框的列是名人、日期(YYYY-MM-DD)和No。追随者。对于每个日期,它将显示新的编号。追随者。

然而,我想要计算平均no。从开始日期2020年1月1日到2020年4月1日,每个名人的新追随者数量,表格格式中只包含名人,没有。列中关注者的数量。

我如何在上面写一段python代码呢?
非常感谢!
发布于 2020-05-11 00:22:57
您可以使用groupby按名人收集所有行。
df_grouped = df.groupby(['celebrities'])
for name, group in df_grouped:
print(group['Followers'].avg())这将打印每个名人的平均追随者数量。如果您愿意,也可以按日期添加过滤器(group[group['Date']>X]['Followers'].avg())
https://stackoverflow.com/questions/61715034
复制相似问题