我正在使用python中包含大量NAs的数据框架。我想数一下每个变量的NAs数。我查看了文档并找到了count(),除了它,它给了我与我想要的相反的东西:
df.groupby("var1").count()我的问题是,我怎么能只计算群中的NAs数量呢?我试过:
df.groupby("var1").isnull() or df.groupby("var1").isna() 或
df.groupby("var1").apply(isnull)但这会给我带来错误。
我想做的是:将数据库按变量分组(在本例中为公民权),然后计算每个因素的每个级别的NAs数。
我希望输出类似于屏幕截图,但输出的是NAs数,而不是观察数减去NAs数:
或者,换句话说,我正在寻找Python中这个R代码的解决方案:
dat%>%group_by(citizenship)%>%summarise_all(funs(sum(is.na(.)))发布于 2022-04-29 17:36:38
如果“每个变量”指的是每个dataframe列,则可以这样做:
df['column name'].isna().sum()如果您想使用groupby,您可以在这里找到一个解决方案:熊猫在群函数中计数空值
https://stackoverflow.com/questions/72059696
复制相似问题